0

0

SQL TiDB Region Split 的热点拆分阈值与手动干预时机

冷炫風刃

冷炫風刃

发布时间:2026-02-21 16:40:03

|

200人浏览过

|

来源于php中文网

原创

是的。tidb默认建表仅生成1个region,导致写入集中于单tikv节点形成热点;预切分是批量导入、日志表初始化等场景的必要前置动作,否则pd无法调度。

sql tidb region split 的热点拆分阈值与手动干预时机

新建大表写入前必须预切分 Region 吗?

绝大多数情况下,是的。TiDB 默认建表只生成 1 个 Region,所有写入都落在同一 TiKV 节点上,哪怕集群有 20 台 TiKV,初期写入也必然形成单点热点——这不是调度慢的问题,而是数据编码规则决定的:tablePrefix{tableID}_recordPrefixSep{rowID} 这一 Key 结构导致新行按 rowID 递增追加,而默认整型主键或隐式自增 rowID 都是顺序值。

预切分不是“可选优化”,而是应对批量导入、日志表初始化、订单号时间序主键等场景的必要前置动作。不预切分,PD 的 balance-regionbalance-leader 调度器根本无 Region 可调度。

  • 适用场景:批量导入 > 100 万行、日志类宽表建完即写、主键为 BIGINT 自增或 UNIX_TIMESTAMP 类时间戳
  • 不适用场景:小配置表(
  • 错误现象:tidb_server_handle_query_duration_seconds_bucket 99 分位突增、某 TiKV 实例 store_write_flow_bytes 持续高于其他节点 3 倍以上

用 BETWEEN 还是 BY 手动指定 Split 点?

看你的主键/分区键分布是否均匀。BETWEEN lower_value AND upper_value REGIONS region_num 是等距切分,假设你建表时用 id BIGINT PRIMARY KEY,且预计最终数据范围是 1 ~ 10 亿,想预切 64 个 Region,就写 BETWEEN 1 AND 1000000000 REGIONS 64——PD 会自动算出每段边界,但前提是数据真按这范围线性分布。

BY value_list... 更适合非均匀场景:比如按业务线拆分的订单表,华东 ID 段集中于 1~5000 万,华南集中在 5001 万~5050 万,其余稀疏,这时硬用 BETWEEN 会导致某些 Region 空载、某些仍热点。

Voicenotes
Voicenotes

Voicenotes是一款简单直观的多功能AI语音笔记工具

下载
  • BETWEEN:简单、适合整型主键 + 数据量可预估,但若实际写入远少于预期,会造成 Region 过碎,增加 region-meta 内存开销
  • BY:需人工分析数据分布(例如查 HISTOGRAM 或抽样 COUNT GROUP BY FLOOR(id/1000000)),切分点必须严格升序,且不能包含重复值
  • 参数差异:REGIONS N 是目标总数;BY (v1,v2,...) 切出的是 N+1 个 Region(N 个切点 → N+1 段)

split-region-size 调大能缓解热点吗?

不能,反而可能加剧。默认 split-region-size = 64MB 是触发自动分裂的阈值,它只影响“已有 Region 何时分裂”,不解决“初始只有一个 Region”的根本问题。调到 128MB 后,那个初始 Region 得写满 128MB 才分裂——意味着更长时间内所有写请求还在打同一个 TiKV。

真正该调的是预切分行为本身,以及配合 PD 的调度节奏。如果你观察到预切分后 Region 打散缓慢(tidb_wait_split_region_finish = 0 时返回快但实际没完成),说明 PD 正在排队调度,此时强行调大 split-region-size 只会让每个 Region 更“胖”,加重单点负载。

  • 正确做法:建表语句末尾加 SHARD_ROW_ID_BITS = 4(对非自增主键表)或显式 SPLIT REGION,再确认 pd-ctlregion status 显示 "approximate_size": 60 左右(单位 MB)且分布均匀
  • 错误操作:在热点已发时才去改 split-region-size,这属于“治标不治本”,且需滚动重启 TiKV 才生效
  • 性能影响:调得过大(如 512MB)会导致单 Region Raft 日志体积膨胀,影响 snapshot 传输和恢复速度

怎么确认预切分真的生效了?

别信 SQL 返回成功,要看 Region 实际分布。最直接的方式是用 pd-ctl 查表对应 Region 是否已分散到多个 Store:

pd-ctl region key "t_22_r"

其中 t_22_r 是表 ID 22 的 record 前缀(可通过 SELECT TIDB_TABLE_ID FROM information_schema.tables WHERE table_name='your_table' 查)。如果返回多个 Region,且每个的 leader.store_id 不同,才算打散成功。若多数 Region leader 都挤在 store_id=1 上,说明 PD 还没调度完,或该 Store 负载过高被调度器跳过。

  • 关键指标:执行 pd-ctl store 看各 store 的 leader_countregion_count 是否接近均值(偏差
  • 容易忽略的坑:tidb_wait_split_region_finish 默认为 1,但若设为 0,SQL 会立即返回,你以为切完了,其实只是把 Operator 提交给了 PD 队列,后续还需等 operator_status 变为 finished
  • 验证时机:建议在批量写入开始前 2 分钟检查,避免边写边切导致部分 Region 仍空载
预切分不是“设完就完”的开关,Region 打散完成与否取决于 PD 当前调度队列长度、目标 TiKV 的负载水位、以及是否存在 Label 约束冲突——这些都不会在 SQL 返回里告诉你。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1006

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

334

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

379

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1782

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

376

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1332

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

436

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

796

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 12.2万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号