0

0

C++如何实现基于跳表的高性能有序索引?(数据库底层技术)

冰火之心

冰火之心

发布时间:2026-03-02 12:46:52

|

871人浏览过

|

来源于php中文网

原创

c++如何实现基于跳表的高性能有序索引?(数据库底层技术)

跳表在 C++ 中不是标准库组件,得自己写或选对第三方实现

标准 C++ 没有 skiplist,STL 的 std::setstd::map 是红黑树,平均 O(log n) 但常数小、缓存友好;跳表虽理论也是 O(log n),但随机指针跳跃导致 CPU 缓存不友好,实际吞吐未必更高——除非你明确需要高并发写入(跳表的插入可无锁)、或正在仿写 LevelDB / Redis Sorted Set 底层。

常见错误是直接照搬教科书伪代码写单线程跳表,结果发现比 std::map 慢 2–3 倍,原因在于指针跳转打乱内存局部性。真实数据库索引里用跳表,几乎都配套做了节点内存池 + 定长 slab 分配 + level 高度预裁剪。

  • 别从零手撸带随机数的 randomLevel():生产环境用 PCG 或 XorShift 替代 rand(),避免种子冲突和周期短
  • level 0 节点必须存完整 key-value,高层只存 key + 指针;否则范围查询时没法回溯
  • Redis 的 zset 跳表每个节点还挂一个 dict hash 表指针,用于 O(1) 查 rank —— 单纯跳表不支持按序号查元素

并发安全不能靠 std::mutex 粗粒度锁整个跳表

加一把全局锁会让跳表退化成链表级性能,尤其写多场景下,所有插入/删除都排队。LevelDB 和 RocksDB 的跳表实现默认禁用并发写,靠上层 WAL + memtable 切换规避;真要支持并发,得按 level 分段加锁,或用无锁技巧。

典型坑是认为“跳表天然适合无锁”,其实不然:compare_exchange_weak 在多层指针更新时极易 ABA 问题,尤其 level 数动态变化时。Facebook 的 Folly 库提供 folly::Synchronized 包装的跳表,但内部仍是 per-level mutex,不是完全无锁。

立即学习C++免费学习笔记(深入)”;

志设AI
志设AI

志设AI是一站式AI设计平台,集“AI生图 + 在线设计 + 素材交易 + 收益分成”于一体。

下载
  • 写操作只锁涉及的 level 范围,比如插入高度为 3 的节点,只需锁 level 0–3 对应的前驱节点
  • 读操作可完全无锁,但需保证指针读取的原子性(std::atomic<t></t>,不是裸指针)
  • 删节点时必须标记再回收(hazard pointer 或 epoch-based reclamation),否则其他线程正遍历该节点会 crash

std::set 够用就别硬上跳表,除非你要支持范围截断 + 并发写 + 内存可控

跳表唯一不可替代的场景是:既要 O(log n) 插入/查询,又要 O(1) 获取某段 rank 范围(如 “第 1000–1010 名”),且写入压力大到红黑树锁竞争明显。MySQL 的自增主键索引、PostgreSQL 的 B-tree 都不换跳表,因为 B-tree 更稳、更省内存、范围扫描更快。

如果你只是想做个本地缓存的有序结构,std::set + std::lower_bound 就行;想做分布式协同排序,那应该看 CRDT 或逻辑时钟,不是跳表。

  • 跳表内存占用通常是红黑树的 2–4 倍(每节点多个指针 + 随机 level)
  • 高度概率分布是关键参数:p = 0.5 时平均高度 log₂n,但实际常设 p = 0.25 控制内存
  • LevelDB 中跳表最大 level 写死为 12,避免极端情况爆炸,你也得设上限

调试跳表最常卡在指针误连和内存释放时机

跳表 debug 的噩梦不是逻辑错,而是指针连错一层、漏删中间 level、或提前 free 了还在被其他线程读的节点。AddressSanitizer 能抓野指针,但抓不到逻辑错位——比如 update[i] 数组没正确记录每层前驱,导致插入后链断裂。

建议在构造函数里开个 validate() 方法,每次增删后跑一遍:检查每层指针是否单调递增、各层节点数是否符合概率分布、level 0 是否包含全部元素。别等线上查不到数据才怀疑跳表。

  • std::shared_ptr 管理节点?不行,循环引用风险高;改用 std::unique_ptr + raw pointer 组合,所有权清晰
  • 打印调试时别只输出 key,要带 level 和各层 next 指针地址,比如:Node(42, level=3) -> [0xabc, 0xdef, nullptr, 0x123]
  • 单元测试必须覆盖高度为 1、最大值、重复 key、跨 level 删除等边界,否则上线后静默丢数据
跳表不是银弹,它把工程复杂度换成了理论简洁性。真正难的从来不是怎么写出来,是怎么让指针不出错、内存不泄漏、并发不撕裂——这些细节藏在每一行 next[level] 赋值里。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

682

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

452

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

286

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

264

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

541

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

663

2023.08.14

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

43

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10.5万人学习

C 教程
C 教程

共75课时 | 5.1万人学习

C++教程
C++教程

共115课时 | 20万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号