0

0

SQL Sharding 分片键选择均匀性与热点规避的业务原则

舞夢輝影

舞夢輝影

发布时间:2026-02-23 17:45:36

|

564人浏览过

|

来源于php中文网

原创

首选user_id;因create_time易致写入热点和跨分片查询,而user_id支持高频等值查询、哈希后数据均匀且路由精准。

sql sharding 分片键选择均匀性与热点规避的业务原则

分片键选 user_id 还是 create_time?先看你的查询和写入模式

绝大多数业务该选 user_id,而不是 create_time。不是因为时间字段“不好”,而是它天然导致写入热点+范围查询跨片——新订单、新消息、新日志全往最新分片扎堆,单片 CPU 和 I/O 很快打满;而查“最近7天数据”这种需求,又得扫多个分片,延迟翻倍。

真正适合用 create_time 的场景极少:比如归档表只读、按月导出报表、冷数据分离。即便如此,也建议搭配二级分片键(如 user_id % 4)做复合路由,避免纯时间分片的雪崩风险。

  • 高频等值查询(如“查用户A所有订单”)→ user_id 是首选,哈希后均匀,路由精准
  • 高频范围查询(如“查某省所有门店昨日流水”)→ 可考虑 province_code + date 联合范围分片,但需配元数据表管理边界
  • 写多读少且 ID 自增 → 绝对不要直接用主键 id 做分片键,否则所有 INSERT 都压在最后一片

哈希取模时为什么必须用 2 的幂次?不是数学洁癖

MySQL 和多数分库中间件(如 ShardingSphere、MyCat)的哈希路由默认走位运算优化:shard_id = hash(key) & (n-1),这只有在分片数 n 是 2 的幂次(如 4、8、16、32)时才等价于 hash(key) % n。如果不是,要么触发慢路径(真取模),要么路由错片——线上出现“数据写了却查不到”基本就栽在这儿。

  • 扩容时别硬加到 12 片或 20 片,宁可先扩到 16,再平滑迁到 32
  • hash() 函数必须确定性:禁止用 UUID()NOW()RAND();推荐 fnv1a_64(user_id)MD5(user_id) % 18446744073709551615 后转整型
  • NULL 值必须提前拦截:WHERE user_id IS NOT NULL 要写进所有业务 SQL,否则所有 NULL 全落到第 0 片,秒变热点

状态码、性别、租户类型…这些字段为什么不能当分片键?

它们基数太低。比如 status 只有 0/1/2 三个值,哈希后最多分散到 3 个分片,剩下 5 片完全空转;gender 是 M/F,两片永远吃不饱,另 6 片干瞪眼。这不是“不够均匀”,是根本没发挥分片价值——你花 8 倍运维成本,只换来 2 倍物理资源利用率。

  • 判断基数是否够高:执行 SELECT COUNT(DISTINCT user_id) / COUNT(*) FROM orders,结果 > 0.95 才算健康
  • 如果只有低基数字段可用(比如 SaaS 系统只有 tenant_type),必须加扰动:改成 CONCAT(tenant_type, '_', user_id) 再哈希
  • 严禁把多个字段拼一起当“万能分片键”,如 CONCAT(user_id, '_', shop_id) —— 一旦 shop_id 缺失,整个路由失效

上线后发现数据倾斜了,还能救吗?

能,但代价远高于前期设计。没有“在线改分片键”的银弹,所有方案都绕不开双写+迁移+校验三步。最轻量的是“冗余分片键”补救:在原表加一列 shard_key_v2,用新规则(如 user_id * 1000000 + order_id % 1000000)填充,应用层逐步切流量到新路由逻辑,老数据不动,新写入走新键。

  • 绝对不要尝试 ALTER TABLE 直接改分片策略——ShardingSphere 会拒绝,MyCat 会路由错,MySQL 分区表会锁表数小时
  • 监控必须前置:上线首周盯死各分片的 data_lengthtable_rows,用 SELECT table_schema, table_name, data_length FROM information_schema.tables 定期采样
  • 真正的难点不在技术,而在业务协同:订单、支付、物流等系统必须同步改路由逻辑,漏一个,跨片 JOIN 就崩给你看

分片键定下的那一刻,你就已经给未来两年的数据流向画好了轨道。改轨道不是换轮胎,是拆铁轨重铺。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1026

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

335

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

379

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1802

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

377

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1374

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

437

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1127

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 12.3万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号