Skip List 跳表深度解析：从算法原理到 Redis 底层实现的完整指南

Redis 的 ZADD 命令能在 O(log N) 时间内完成元素插入，ZRANGEBYSCORE 能高效地按分数范围查询——这些操作的底层数据结构不是红黑树（Red-Black Tree），不是 AVL 树，而是一种很多人闻所未闻的概率数据结构：跳表（Skip List）。Redis 作者 Antirez 在设计有序集合（Sorted Set）时，放弃了平衡树的确定性，选择了一种「靠概率保证平衡」的结构，这个看似冒险的决策背后，隐藏着深刻的工程权衡。如果你正在使用 Redis 的 ZSet 却不理解跳表，你对 Redis 的认知就少了一块关键拼图。

🔬 一、跳表的核心原理：为什么它比链表快

1.1 从有序链表说起

理解跳表最好的方式，是从最简单的有序链表开始。假设我们有一个包含 16 个元素的有序链表，要查找元素 62，需要从头节点逐个遍历——时间复杂度是 O(N)。

// 有序链表查找：O(N) 逐个遍历
class ListNode {
  constructor(
    public value: number,
    public next: ListNode | null = null
  ) {}
}

function searchInList(head: ListNode | null, target: number): ListNode | null {
  let current = head
  while (current && current.value < target) {
    current = current.next  // 逐个前进，效率低
  }
  return current?.value === target ? current : null
}

问题很明显：链表不支持二分查找，因为不支持随机访问。但如果我们给链表加一层「快速通道」呢？

1.2 多层索引的直觉

跳表的核心思想是多层索引：在原始有序链表之上，建立多层「快速通道」，每一层都是下一层的子集。查找时从最高层开始，遇到比目标大的节点就下降一层，类似在多层高速公路上行驶——顶层是快车道，只能停靠少量站点；底层是慢车道，每个站点都停。

// 跳表节点定义：每个节点有多个层级的 forward 指针
class SkipListNode {
  public forward: (SkipListNode | null)[]
  
  constructor(
    public value: number,
    public score: number,
    public level: number  // 该节点的层数
  ) {
    this.forward = new Array(level + 1).fill(null)
  }
}

💡 **提示：**跳表的「层」不是数据本身的层级关系，而是索引的层级。最底层（Level 0）包含所有元素，是完整的有序链表；每一层都是下一层的「采样子集」。

1.3 查找过程动画

以查找元素 62 为例，假设跳表有 4 层索引：

Level 3: HEAD ──────────────────────────────> 78 ──> NIL
Level 2: HEAD ───────────────> 45 ──────────> 78 ──> NIL
Level 1: HEAD ──> 17 ────────> 45 ──> 62 ──> 78 ──> NIL
Level 0: HEAD -> 3 -> 17 -> 25 -> 37 -> 45 -> 52 -> 62 -> 70 -> 78 -> NIL

查找路径：HEAD(Level 3) → 78 超过了，下降到 Level 2 → 45 小于 62，前进到 78 超过了，下降到 Level 1 → 45 → 62，找到了！

总共只访问了 7 个节点，而普通链表需要访问 7 个节点。在更大的数据集上，差距会非常明显——对于 N=10000 个元素的跳表，平均查找步数约为 log₂(N) ≈ 13，而链表需要 5000 步。

⚙️ 二、完整实现：从零构建一个生产级跳表

2.1 核心数据结构

下面是完整的 TypeScript 跳表实现，支持插入、删除、按分数范围查询——与 Redis ZSet 的核心操作一致：

// 完整的跳表实现，模拟 Redis ZSet 的核心操作
const MAX_LEVEL = 32          // 最大层数（Redis 默认也是 32）
const P = 0.25                // 晋升概率（Redis 使用 0.25）

class SkipList {
  private header: SkipListNode
  private level: number = 0   // 当前最大层级
  private length: number = 0  // 元素数量

  constructor() {
    this.header = new SkipListNode(-Infinity, -Infinity, MAX_LEVEL)
  }

  // 随机生成层数：几何分布
  private randomLevel(): number {
    let lvl = 0
    while (Math.random() < P && lvl < MAX_LEVEL - 1) {
      lvl++
    }
    return lvl
  }

  // 插入元素：O(log N) 平均时间
  insert(score: number, value: number): void {
    const update: (SkipListNode | null)[] = new Array(MAX_LEVEL).fill(null)
    let current = this.header

    // 从最高层向下搜索插入位置
    for (let i = this.level; i >= 0; i--) {
      while (current.forward[i] && current.forward[i]!.score < score) {
        current = current.forward[i]!
      }
      update[i] = current  // 记录每层需要更新的节点
    }

    const newLevel = this.randomLevel()

    // 如果新层数超过当前最大层数，更新 header 的 forward
    if (newLevel > this.level) {
      for (let i = this.level + 1; i <= newLevel; i++) {
        update[i] = this.header
      }
      this.level = newLevel
    }

    // 创建新节点并插入
    const newNode = new SkipListNode(value, score, newLevel)
    for (let i = 0; i <= newLevel; i++) {
      newNode.forward[i] = update[i]!.forward[i]
      update[i]!.forward[i] = newNode
    }

    this.length++
  }

  // 查找元素：O(log N) 平均时间
  search(score: number): SkipListNode | null {
    let current = this.header
    for (let i = this.level; i >= 0; i--) {
      while (current.forward[i] && current.forward[i]!.score < score) {
        current = current.forward[i]!
      }
    }
    current = current.forward[0]!
    return current?.score === score ? current : null
  }

  // 按分数范围查询（类似 Redis ZRANGEBYSCORE）
  rangeByScore(min: number, max: number): SkipListNode[] {
    const result: SkipListNode[] = []
    let current = this.header

    // 先定位到 min 的位置
    for (let i = this.level; i >= 0; i--) {
      while (current.forward[i] && current.forward[i]!.score < min) {
        current = current.forward[i]!
      }
    }
    current = current.forward[0]!

    // 从 min 开始遍历到 max
    while (current && current.score <= max) {
      result.push(current)
      current = current.forward[0]!
    }
    return result
  }

  // 删除元素：O(log N) 平均时间
  delete(score: number): boolean {
    const update: (SkipListNode | null)[] = new Array(MAX_LEVEL).fill(null)
    let current = this.header

    for (let i = this.level; i >= 0; i--) {
      while (current.forward[i] && current.forward[i]!.score < score) {
        current = current.forward[i]!
      }
      update[i] = current
    }

    current = current.forward[0]!
    if (!current || current.score !== score) return false

    // 更新每层的 forward 指针
    for (let i = 0; i <= this.level; i++) {
      if (update[i]!.forward[i] !== current) break
      update[i]!.forward[i] = current.forward[i]
    }

    // 如果删除了最高层的节点，降低跳表层数
    while (this.level > 0 && !this.header.forward[this.level]) {
      this.level--
    }

    this.length--
    return true
  }

  get size(): number {
    return this.length
  }
}

2.2 使用示例与验证

// 跳表使用示例：模拟 Redis ZSet 操作
const skiplist = new SkipList()

// ZADD key score member（插入带分数的元素）
skiplist.insert(1.0, 1001)
skiplist.insert(2.5, 1002)
skiplist.insert(3.0, 1003)
skiplist.insert(5.5, 1004)
skiplist.insert(7.0, 1005)
skiplist.insert(8.5, 1006)
skiplist.insert(10.0, 1007)

// ZSCORE key member（查询分数）
const node = skiplist.search(5.5)
console.log(`查找 score=5.5: ${node ? '找到, value=' + node.value : '未找到'}`)
// 输出: 查找 score=5.5: 找到, value=1004

// ZRANGEBYSCORE key min max（按范围查询）
const range = skiplist.rangeByScore(2.0, 7.0)
console.log(`范围 [2.0, 7.0] 的元素: ${range.map(n => n.value).join(', ')}`)
// 输出: 范围 [2.0, 7.0] 的元素: 1002, 1003, 1004, 1005

// ZREM key member（删除元素）
const deleted = skiplist.delete(3.0)
console.log(`删除 score=3.0: ${deleted ? '成功' : '失败'}`)
// 输出: 删除 score=3.0: 成功

⚠️ **警告：**上面的实现使用 Math.random() 生成随机层数。在生产环境中，应该使用可复现的伪随机数生成器（PRNG），以确保在相同输入序列下产生相同的跳表结构——这对调试和一致性验证至关重要。Redis 源码中使用的是一个自定义的伪随机函数。

📊 三、跳表 vs 红黑树：Redis 为什么选择跳表

3.1 性能对比数据

这是很多面试和架构讨论中的经典问题：Redis 为什么用跳表而不是红黑树？答案不只是「实现简单」这么简单。

维度	跳表（Skip List）	红黑树（Red-Black Tree）	推荐
查找时间复杂度	O(log N) 平均	O(log N) 最坏	红黑树略优
插入时间复杂度	O(log N) 平均	O(log N) 最坏	持平
删除时间复杂度	O(log N) 平均	O(log N) 最坏	持平
范围查询	O(log N + M) 天然支持	O(log N + M·log N) 需要中序遍历	✅ 跳表
实现复杂度	~200 行代码	~500 行代码（含旋转）	✅ 跳表
内存占用	较高（多层指针）	较低（每个节点 2 个子指针 + 1 个颜色位）	红黑树略优
并发友好度	局部更新，易于加锁	全局旋转，难以细粒度加锁	✅ 跳表
可调性	可调整 P 和 MAX_LEVEL	结构固定	✅ 跳表

3.2 范围查询是决定性优势

Redis 的 ZSet 最常用的操作之一是 ZRANGEBYSCORE（按分数范围查询）和 ZRANGE（按排名范围查询）。跳表天然支持高效的范围查询：找到起始节点后，沿底层链表顺序遍历即可。而红黑树需要中序遍历（In-Order Traversal），在最坏情况下效率更低。

// 跳表范围查询：找到起点后 O(M) 顺序遍历
// 总复杂度: O(log N + M)，M 为结果集大小
rangeByScore(min: number, max: number): SkipListNode[] {
  // 第一阶段：O(log N) 定位到 min
  let current = this.header
  for (let i = this.level; i >= 0; i--) {
    while (current.forward[i] && current.forward[i]!.score < min) {
      current = current.forward[i]!
    }
  }
  current = current.forward[0]!

  // 第二阶段：O(M) 顺序收集结果
  const result: SkipListNode[] = []
  while (current && current.score <= max) {
    result.push(current)
    current = current.forward[0]!  // 沿底层链表前进
  }
  return result
}

⚡ 关键结论：Redis 选择跳表的核心原因不是「实现简单」，而是范围查询的天然优势和并发友好的局部更新特性。在 Redis 6.0 的多线程 I/O 模型下，跳表的局部更新特性使得并发读写更容易实现。

3.3 内存占用的工程权衡

跳表的内存开销确实比红黑树高。每个跳表节点平均有 1/(1-P) = 1/0.75 ≈ 1.33 个 forward 指针（当 P=0.25 时）。对于 N=100 万个元素：

跳表：每个节点平均 1.33 层 × 8 字节/指针 = 额外约 10.6 MB
红黑树：每个节点 2 个子指针 + 1 个父指针 + 1 位颜色 = 约 24 MB

实际上，由于红黑树的指针数量固定为 3 个（left、right、parent），在数据量大时红黑树反而占用更多内存。这是一个反直觉的结论。

🏗️ 四、Redis 源码中的跳表实现

4.1 Redis 跳表的核心定义

Redis 的跳表实现在 t_zset.c 和 server.h 中，核心结构如下（简化版）：

// Redis 跳表节点定义（简化自 server.h）
typedef struct zskiplistNode {
    sds ele;                    // 成员对象（SDS 字符串）
    double score;               // 分值
    struct zskiplistNode *backward;  // 后退指针（用于 ZREVRANGE）
    struct zskiplistLevel {
        struct zskiplistNode *forward;  // 前进指针
        unsigned long span;             // 跨度（用于计算排名）
    } level[];                  // 柔性数组，层高可变
} zskiplistNode;

// Redis 跳表定义
typedef struct zskiplist {
    struct zskiplistNode *header, *tail;  // 头尾节点
    unsigned long length;                  // 节点数量
    int level;                             // 当前最大层数
} zskiplist;

Redis 跳表的一个精巧设计是 span（跨度） 字段——它记录每个 forward 指针跨越了多少个节点。这使得 ZRANK（获取排名）操作也能在 O(log N) 时间内完成，而不需要遍历计数。

4.2 Redis 为什么用 P=0.25 而不是 P=0.5

论文原始版本的跳表使用 P=0.5（50% 概率晋升）。Redis 选择 P=0.25 是经过工程实验的最优值：

晋升概率 P	平均层数/节点	查找步数 (N=10⁶)	内存开销
P=0.5	2 层	~20 步	较高
P=0.25	1.33 层	~26 步	最优平衡
P=0.125	1.14 层	~40 步	最低

P=0.25 在查找步数和内存开销之间取得了最佳平衡。虽然比 P=0.5 多走了几步查找，但节省了约 33% 的内存——在 Redis 这种内存数据库中，这个权衡非常值得。

4.3 为什么不用 B+ 树

B+ 树是数据库索引的标准选择，但在 Redis 的场景下并不合适：

✅ B+ 树需要磁盘 I/O 优化（节点大小对齐磁盘页），Redis 是纯内存数据库
✅ B+ 树的节点分裂/合并操作涉及大量数据搬移，跳表只需修改指针
✅ B+ 树实现复杂度远高于跳表，Redis 追求代码简洁可维护
❌ 跳表的缓存局部性不如 B+ 树（但 Redis 不依赖 CPU 缓存优化）

📌 **记住：**没有「最好」的数据结构，只有「最适合场景」的数据结构。Redis 选择跳表是在内存数据库、有序集合、范围查询、实现简洁这四个约束下的最优解。

💡 五、跳表在工程中的其他应用

跳表不只是 Redis 的专利。以下是跳表在真实系统中的应用：

系统	用途	为什么选跳表
Redis	Sorted Set 底层结构	范围查询 + 实现简洁
LevelDB/RocksDB	MemTable 的一种实现选项	并发写入友好
Apache Lucene	有序字典的跳表实现	内存效率 + 范围查询
HBase	MemStore 内部结构	并发写入 + 有序遍历
WireGuard	路由表查找	轻量级 + 低延迟

// 实战示例：用跳表实现一个简单的排行榜系统
class Leaderboard {
  private skipList = new SkipList()
  private userScores = new Map<number, number>()

  // 更新用户分数（O(log N)）
  updateScore(userId: number, newScore: number): void {
    const oldScore = this.userScores.get(userId)
    if (oldScore !== undefined) {
      this.skipList.delete(oldScore)
    }
    this.skipList.insert(newScore, userId)
    this.userScores.set(userId, newScore)
  }

  // 获取 Top N 用户（O(log N + N)）
  getTopN(n: number): Array<{ userId: number; score: number }> {
    const results: Array<{ userId: number; score: number }> = []
    let current = this.skipList['header'].forward[0]
    let count = 0
    while (current && count < n) {
      results.push({ userId: current.value, score: current.score })
      current = current.forward[0]
      count++
    }
    return results.reverse()  // 从高到低
  }

  // 获取用户排名（O(log N)）
  getRank(userId: number): number {
    const score = this.userScores.get(userId)
    if (score === undefined) return -1
    // 简化实现：遍历计算排名
    // 生产环境中可利用 Redis 的 span 字段 O(log N) 获取排名
    let rank = 0
    let current = this.skipList['header'].forward[0]
    while (current && current.score < score) {
      rank++
      current = current.forward[0]
    }
    return rank + 1
  }
}

// 使用排行榜
const board = new Leaderboard()
board.updateScore(1001, 9500)
board.updateScore(1002, 8700)
board.updateScore(1003, 9900)
board.updateScore(1004, 7200)

console.log('Top 3:', board.getTopN(3))
// 输出: Top 3: [{userId: 1003, score: 9900}, {userId: 1001, score: 9500}, {userId: 1002, score: 8700}]
console.log('用户 1002 排名:', board.getRank(1002))
// 输出: 用户 1002 排名: 3

✅ 六、总结与最佳实践

跳表是一种被严重低估的数据结构。它用概率的方式获得了与平衡树相当的查找性能，同时在范围查询、实现简洁性、并发友好性上有着显著优势。

跳表适用的场景：

✅ 需要有序数据结构且频繁做范围查询
✅ 需要简单可维护的实现（相比红黑树的旋转逻辑）
✅ 内存数据库场景（不需要优化磁盘 I/O）
✅ 需要支持并发读写的有序结构

跳表不适用的场景：

❌ 需要最坏情况性能保证（跳表是概率性的）
❌ 磁盘存储场景（缓存局部性不如 B+ 树）
❌ 内存极度受限的场景（多层指针的额外开销）

⚡ **关键结论：**理解跳表不仅能帮你通过面试，更能帮你理解 Redis 的性能特征。当你在 Redis 中执行 ZADD、ZRANGE、ZRANGEBYSCORE 时，背后就是跳表在高效工作。下次做技术选型时，不要只想到红黑树——跳表可能是更好的选择。

相关工具推荐：

🔧 Redis 在线工具 — JSON 格式化与 Redis 数据查看
📖 Redis 源码 — 跳表实现在 t_zset.c
📄 Skip List 论文原文 — William Pugh 1990 年的经典论文
🔧 Redis Documentation: Sorted Sets — 官方文档