B-树核心是磁盘I/O优化,通过减少树高、节点多关键字、同层叶子实现高效读取;C++实现需体现分裂/合并、自底向上调整、键值有序三大本质特征。

理解B-树的核心设计目标
B-树不是为内存快速排序设计的,而是为磁盘I/O优化而生的数据结构。它的每个节点通常对应一次磁盘块读取(比如4KB),所以关键在于:减少树高、让单个节点容纳尽可能多的关键字和子指针,同时保持所有叶子节点在同一层。C++实现时,不能只关注“能跑通”,更要体现节点分裂/合并逻辑、自底向上调整、键值有序存储这三个本质特征。
定义节点结构与基础模板
一个典型的B-树节点包含:关键字数组、子指针数组、实际关键字数量、是否为叶子的标记。建议用模板支持任意可比较类型:
// 假设最小度数 t(即每个节点至少有 t−1 个关键字,最多 2t−1 个)
template
struct BTreeNode {
T keys[2 * t - 1];
BTreeNode* children[2 * t]; // 非叶子节点有最多 2t 个子指针
int n; // 当前关键字数量
bool leaf;
};
实现插入操作的关键步骤
插入不是简单塞进叶子——它必须维持B-树性质。核心是先递归到叶子,再自底向上处理满节点分裂:
立即学习“C++免费学习笔记(深入)”;
- 若当前节点已满(n == 2t−1),先调用 splitChild 把它劈成两个 t−1 关键字的节点,并把中间关键字上推给父节点
- 递归插入时,确保在进入子节点前,该子节点未满;否则提前分裂(这叫“top-down splitting”,避免回溯)
- 根节点满时,要新建根,树高+1 —— 这是B-树保持平衡的唯一扩容方式
搜索与删除需兼顾稳定性
搜索很简单:从根开始,根据key大小选择对应子树,直到找到或抵达空叶子。
删除更复杂,但原则明确:
- 总保证待删key所在节点关键字数 ≥ t(即不低于最小要求),否则从兄弟借或与兄弟合并
- 若key在内部节点,不直接删,而是用它的前驱/后继(必在叶子)替换,再删叶子——避免破坏结构
- 合并时注意:父节点失去一个子指针后,自身也可能低于t−1,需递归处理(但实际中常延迟合并,或仅在必要时做)
基本上就这些。真正写实操代码时,重点不是堆砌语法,而是把分裂时机、上推逻辑、借/合并边界条件想清楚。标准库没提供B-树,但STL的map/set底层是红黑树;数据库如SQLite的B-Tree模块(btree.c)是极好的参考——它用C写,但思想完全适用C++。










