关于MySQL8.0 InnoDB并行执行的详解

藏色散人

发布时间：2020-03-27 08:58:32

3057人浏览过

来源于cnblogs

转载

概述

MySQL经过多年的发展已然成为最流行的数据库，广泛用于互联网行业，并逐步向各个传统行业渗透。之所以流行，一方面是其优秀的高并发事务处理的能力，另一方面也得益于MySQL丰富的生态。MySQL在处理OLTP场景下的短查询效果很好，但对于复杂大查询则能力有限。最直接一点就是，对于一个SQL语句，MySQL最多只能使用一个CPU核来处理，在这种场景下无法发挥主机CPU多核的能力。MySQL没有停滞不前，一直在发展，新推出的8.0.14版本第一次引入了并行查询特性，使得check table和select count(*)类型的语句性能成倍提升。虽然目前使用场景还比较有限，但后续的发展值得期待。

相关代码如下：

create_ranges(size_t depth, size_t level)
一次分区：
parallel_check_table
 add_scan
   partition(scan_range, level=0)  /* start at root-page */
     create_ranges(scan_range, depth=0, level=0)
   create_contexts(range, index >= split_point)
二次分区：                                                      
split()
 partition(scan_range, level=1)
   create_ranges(depth=0,level)

并行扫描

在一次分区后，将每个分区扫描任务放入到一个lock-free队列中，并行的worker线程从队列中获取任务，执行扫描任务，如果获取的任务带有split属性，这个时候worker会将任务进行二次拆分，并投入到队列中。这个过程主要包括两个核心接口，一个是工作线程接口，另外一个是遍历记录接口，前者从队列中获取任务并执行，并维护统计计数；后者根据可见性获取合适的记录，并通过上层注入的回调函数处理，比如计数等。

Parallel_reader::worker(size_t thread_id)

{

1.从ctx-queue提取ctx任务

2.根据ctx的split属性，确定是否需要进一步拆分分区(split())

3.遍历分区所有记录(traverse())

4.一个分区任务结束后，维护m_n_completed计数

5.如果m_n_compeleted计数达到ctx数目，唤醒所有worker线程结束

PaperFake

AI写论文

下载

6.根据traverse接口，返回err信息。

}

Parallel_reader::Ctx::traverse()

{

1.根据range设置pcursor

2.找到btree，将游标定位到range的起始位置

3.判断可见性(check_visibility)

4.如果可见，根据回调函数计算(比如统计)

5.向后遍历，若达到了页面的最后一条记录，启动预读机制(submit_read_ahead)

6.超出范围后结束

}

同时在8.0.17版本还引入了预读机制，避免因为IO瓶颈导致并行效果不佳的问题。目前预读的线程数不能配置，在代码中硬编码为2个线程。每次预读的单位是一个簇(InnoDB文件通过段，簇，页三级结构管理，一个簇是一组连续的页)，根据页面配置的大小，可能为1M或者2M。对于常见的16k页面配置，每次预读1M，也就是64个页面。worker线程在进行扫描时，会先判断相邻的下一个页面是否为簇的第一个页面，如果是，则发起预读任务。预读任务同样通过lock-free 队列缓存，worker线程是生产者，read-ahead-worker是消费者。由于所有分区页面没有重叠，因此预读任务也不会重复。

执行器交互(适配器)

实际上，MySQL已经封装了一个适配器类Parallel_reader_adapter来供上层使用，为后续的更丰富的并行执行做准备。首先这个类需要解决记录格式的问题，将引擎层扫描的记录转换成MySQL格式，这样做到上下层解耦，执行器不用感知引擎层格式，统一按MySQL格式处理。整个过程是一个流水线，通过一个buffer批量存储MySQL记录，worker线程不停的将记录从引擎层上读上来，同时有记录不停的被上层处理，通过buffer可以平衡读取和处理速度的差异，确保整个过程流动起来。缓存大小默认是2M，根据表的记录行长来确定buffer可以缓存多少个MySQL记录。核心流程主要在process_rows接口中，流程如下

process_rows

{

1.将引擎记录转换成MySQL记录

2.获取本线程的buffer信息(转换了多少mysql记录，发送了多少给上层)

3.将MySQL记录填充进buffer，自增统计m_n_read

4.调用回调函数处理(比如统计，聚合，排序等)，自增统计m_n_send

}

对于调用者来说，需要设置表的元信息，以及注入处理记录回调函数，比如处理聚集，排序，分组的工作。回调函数通过设置m_init_fn，m_load_fn和m_end_fn来控制。

总结

MySQL8.0引入了并行查询虽然还比较初级，但已经让我们看到了MySQL并行查询的潜力，从实验中我们也看到了开启并行执行后，SQL语句执行充分发挥了多核能力，响应时间急剧下降。相信在不久的将来，8.0的会支持更多并行算子，包括并行聚集，并行连接，并行分组以及并行排序等。

mysql如何进行跨版本数据恢复_mysql备份文件版本兼容处理

mysql如何查看存储引擎统计信息_mysql status变量监控

mysql如何限制特定SQL语句执行_mysql rewrite_rules黑名单设置

mysql如何排查特定Session持有的锁资源_mysql performance_schema锁追踪

mysql查询缓存与执行计划的结合使用

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：mysql如何自动生成大量数据下一篇：掌握四大MySQL知识点，就可吊打面试官！

作者最新文章

一文详解通过php+roadrunner实现grpc服务端

2023-04-21 15:57

分享redis多维度排行思路

2023-04-21 16:01

linux jboss是什么

2023-04-23 10:10

linux中yum是什么意思

2023-04-23 10:15

分享一个PHP免费验证码（附代码）

2023-04-23 17:33

详述file_get_contents、getimagesize严重耗时问题

2023-04-23 17:36

用八个demo搞懂Go语言defer的五大特性

2023-04-23 17:40

图文详解如何在Vue项目中集成Ace代码编辑器

2023-04-24 10:52

聊聊前端怎么获取电池信息

2023-04-24 10:55

分享接口设计文档的12个注意点

2023-04-24 10:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

178

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

532

2026.03.04