0

0

数据库事务日志(Redo Log/Undo Log)的作用与恢复机制

夜晨

夜晨

发布时间:2025-09-10 13:37:01

|

1115人浏览过

|

来源于php中文网

原创

数据库事务日志(redo log/undo log)的作用与恢复机制

数据库事务日志,无论是Redo Log(重做日志)还是Undo Log(撤销日志),它们的核心作用都是为了确保数据库事务的ACID特性,特别是持久性(Durability)原子性(Atomicity),同时Undo Log还间接支撑了隔离性(Isolation),尤其是在实现多版本并发控制(MVCC)时。简单来说,Redo Log是用来“向前看”,确保已提交的数据不会丢失;Undo Log是用来“向后退”,保证事务失败时能干净回滚,以及为并发读提供历史版本。它们是数据库在面对系统崩溃或并发操作时,依然能保持数据一致性和可靠性的基石。

解决方案

要深入理解Redo Log和Undo Log的作用与恢复机制,我们需要将它们视为数据库内部实现数据完整性和高可用性的两大法宝。它们协同工作,共同构筑了数据库事务处理的坚实防线。

Redo Log(重做日志)

Redo Log,顾名思义,是用来“重做”操作的日志。它的主要目标是确保事务的持久性。数据库系统在执行写操作时,通常会采用“WAL”(Write-Ahead Logging,预写式日志)策略。这意味着,任何数据页的修改在真正写入磁盘上的数据文件之前,其对应的Redo Log记录必须先被写入并持久化到磁盘。

工作流程大致是这样:当一个事务修改了数据,这些修改首先发生在内存中的数据页(buffer pool)。同时,这些修改的细节(比如“将数据页X的偏移Y处的值从A改为B”)会被记录到Redo Log Buffer中。当事务提交时,系统会确保Redo Log Buffer中的相关记录被刷新(flush)到磁盘上的Redo Log文件。只有当这些Redo Log记录安全地写入磁盘后,事务才被认为是真正“提交”了。此时,即使数据页尚未从内存刷回磁盘,系统也能保证数据不会丢失。

在数据库崩溃恢复时,Redo Log就派上了用场。系统重启后,会检查Redo Log。如果发现有已提交事务的Redo Log记录,但对应的数据页在崩溃前未能及时写入磁盘,系统就会“重做”这些操作,将数据页恢复到崩溃前的最新状态,从而保证所有已提交的事务修改都得以保留。

Undo Log(撤销日志)

Undo Log,则是用来“撤销”操作的日志。它的核心职责是保障事务的原子性隔离性

对于原子性,Undo Log扮演着事务回滚的关键角色。当一个事务修改数据时,它会先将数据修改前的“旧值”记录到Undo Log中。如果事务在执行过程中遇到错误,或者被用户显式地执行

ROLLBACK
操作,数据库系统就会利用Undo Log中的信息,将所有已做的修改“撤销”,把数据恢复到事务开始前的状态。这确保了事务要么全部成功,要么全部失败,不会留下中间状态。

对于隔离性,Undo Log在实现多版本并发控制(MVCC)方面发挥着至关重要的作用。在MVCC机制下,当一个事务修改一行数据时,它并不会直接覆盖原有的数据,而是创建一个新的版本。同时,原有的数据版本(或者说,指向原有数据版本的指针)会被记录到Undo Log中,并与新版本形成一个版本链。当其他事务需要读取这行数据时,它们会根据自己的隔离级别和事务开始时间,通过追溯Undo Log中的版本链,找到一个符合其“可见性”规则的历史版本进行读取。这样,读操作就不会被写操作阻塞,大大提高了数据库的并发处理能力。

为什么数据库需要Redo Log和Undo Log,它们解决了哪些核心问题?

在我看来,Redo Log和Undo Log的存在,是数据库系统在性能、可靠性和并发性之间寻求平衡的精妙设计。它们各自解决了几个非常核心且不可或缺的问题。

首先,Redo Log主要解决的是数据库的“持久性”问题。想象一下,如果一个事务已经成功提交,但它所修改的数据还在内存中,还没来得及写入磁盘,此时服务器突然断电或崩溃了,那么这些已经“提交”的数据就会凭空消失。这显然是不可接受的。Redo Log通过“预写式日志”的机制,保证了只要事务提交,其对应的变更记录就一定已经安全地写入了磁盘上的日志文件。这样,即使数据文件本身在崩溃时没有更新,数据库也能在重启后通过重放Redo Log来恢复到崩溃前的最新状态,确保已提交的数据“永不丢失”。这是一种“先记录,后修改”的策略,是数据库可靠性的基石。

其次,Undo Log主要解决的是数据库的“原子性”和“隔离性”问题

  • 原子性:一个事务要么全部成功,要么全部失败。如果事务执行到一半失败了,或者用户主动回滚,如何将已经执行的修改撤销掉,回到事务开始前的状态?Undo Log就提供了这个“后悔药”机制。它记录了数据修改前的旧值,使得数据库能够准确无误地执行回滚操作。没有Undo Log,事务的“全有或全无”特性将难以保证。
  • 隔离性:在并发环境下,多个事务同时读写数据是常态。如何避免一个事务的中间状态被其他事务看到,同时又尽量减少锁竞争,提高并发度?Undo Log在这里扮演了MVCC的“历史记录簿”角色。它保存了数据在不同时间点的旧版本。当一个读事务需要一个特定时间点的数据视图时,它可以沿着Undo Log的版本链找到那个时间点的正确数据版本。这使得读事务可以不加锁地读取数据,而写事务也不必等待读事务完成,从而极大地提升了数据库的并发处理能力,减少了锁带来的性能瓶颈。

所以,Redo Log和Undo Log并非简单的日志文件,它们是数据库实现ACID特性,尤其是面对复杂并发和不可预测的系统故障时,能够保持数据完整性和高可用性的核心技术手段。

Powtoon
Powtoon

AI创建令人惊叹的动画短片及简报

下载

数据库在崩溃后是如何利用Redo Log进行恢复的?

数据库在遭遇崩溃(比如服务器宕机、进程异常终止等)后,其恢复过程是一个精细而复杂的操作,Redo Log在此过程中扮演着不可替代的角色。这个恢复过程通常可以概括为几个阶段,其中Redo Log主要用于“重做”阶段。

  1. 分析阶段(Analysis Phase) 数据库重启后,首先会扫描Redo Log文件,从一个被称为“检查点”(Checkpoint)的位置开始。检查点是数据库定期记录的一个状态点,它表明在这个点之前的所有已提交事务的数据页都已安全地写入了磁盘。从检查点开始扫描,系统会识别出在崩溃前所有活跃(未提交)的事务,以及所有在崩溃时处于“脏”状态(即在内存中被修改但尚未写入磁盘)的数据页。这个阶段的主要目标是确定需要恢复的起点(通常是最近的检查点或者更早的某个日志点),并构建一个关于崩溃前事务状态和数据页状态的视图。

  2. 重做阶段(Redo Phase / Forward Recovery) 这是Redo Log发挥核心作用的阶段。系统会从分析阶段确定的恢复起点开始,顺序地读取Redo Log中的记录,并将其中的所有数据修改操作重新应用到数据文件中。这个过程会重放所有已提交的事务,无论这些事务的数据在崩溃前是否已经写入磁盘。其目的是将数据库的状态“向前推进”,恢复到崩溃发生时的最新状态。也就是说,即使某个已提交事务的数据页在崩溃前没有及时刷盘,Redo Log也会确保这些修改被重新执行,从而保证所有已提交事务的持久性。这个阶段可能会将一些未提交事务的修改也重做进去,这没有关系,因为接下来的撤销阶段会处理它们。

  3. 撤销阶段(Undo Phase / Backward Recovery) 在重做阶段完成后,数据库的状态已经恢复到崩溃发生的那一刻,包含了所有已提交和未提交事务的修改。此时,系统会利用Undo Log来处理在崩溃时仍处于活跃状态(即未提交)的事务。对于这些未提交的事务,数据库会读取其对应的Undo Log记录,将这些事务在崩溃前所做的所有修改进行“撤销”,回滚到事务开始前的状态。这确保了事务的原子性——只有完全提交的事务才会被保留,未完成的事务会被彻底抹去,仿佛它们从未发生过。

通过这三个阶段的协同作用,数据库系统能够在崩溃后,利用Redo Log和Undo Log,将数据库恢复到一个一致且可靠的状态。Redo Log保证了已提交事务的持久性,而Undo Log则保证了未提交事务的原子性,共同构筑了数据库的高可用性和数据完整性。

Undo Log如何支撑事务回滚与多版本并发控制(MVCC)?

Undo Log在数据库中扮演着双重角色,它既是事务回滚的“时光机”,也是实现多版本并发控制(MVCC)的“历史记录仪”。这两者都依赖于它记录数据旧值的特性。

事务回滚的支撑

当一个事务开始对数据进行修改时,在修改实际数据之前,数据库系统会智能地将受影响数据行的“旧值”(即修改前的数据)记录到Undo Log中。这些Undo Log记录会与当前的事务ID关联起来。

如果事务在执行过程中遇到任何问题(比如违反了约束、死锁、程序错误),或者用户主动发出

ROLLBACK
命令,数据库系统就会启动回滚机制。它会找到当前事务在Undo Log中生成的所有记录,然后根据这些记录中保存的“旧值”,将数据逐一恢复到事务开始前的状态。这个过程是逆向执行的,确保了事务的原子性:要么所有操作都成功提交,要么所有操作都像从未发生过一样被撤销。可以说,Undo Log是实现“全有或全无”这一事务特性的核心技术支撑。

多版本并发控制(MVCC)的实现

MVCC是现代数据库系统提高并发性能的关键技术之一,而Undo Log正是MVCC的基石。

在MVCC模式下,当一个事务修改一行数据时,它并不会直接覆盖原有的数据。相反,它会:

  1. 记录旧版本: 将该行数据当前的“旧版本”信息(包括数据本身和一些事务元数据,如创建该版本的事务ID、删除该版本的事务ID等)写入到Undo Log中。
  2. 创建新版本: 在数据文件中创建该行数据的新版本,并更新其指针,使其指向Undo Log中的旧版本。这样,就形成了一个从最新版本到最旧版本的版本链。

当不同的事务并发执行时:

  • 写事务: 总是操作最新的数据版本,并创建新的版本。
  • 读事务: 当一个读事务需要读取数据时,它会根据自己的事务开始时间或隔离级别,沿着这个版本链追溯。如果最新版本是由一个在当前读事务开始之后才提交的事务修改的,那么这个读事务就会通过Undo Log找到并读取更早的、对它而言“可见”的旧版本。

举个例子,事务A在T1时刻读取了一行数据,事务B在T2时刻修改了这行数据并提交。如果事务A的隔离级别允许它看到T1时刻的数据快照,那么当事务A在T3时刻再次读取这行数据时,它不会看到事务B在T2时刻的修改。相反,它会通过Undo Log找到T1时刻该行的旧版本并读取。这样,事务A的读取就不会被事务B的写入所阻塞,事务B的写入也不会等待事务A的读取完成,极大地提升了并发性能,避免了读写锁的冲突。

Undo Log中保存的这些历史版本并不会永久存在。当没有任何活跃事务需要访问某个旧版本时,这些Undo Log记录就会被垃圾回收机制清除,以释放存储空间。这个过程通常是异步进行的,确保了数据库资源的有效利用。

总而言之,Undo Log通过保存数据修改前的状态,不仅为事务回滚提供了可靠的依据,更通过构建数据版本链,巧妙地支撑了MVCC,使得数据库能够在高并发环境下,既保证数据的一致性,又实现高效的并行操作。

相关专题

更多
数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

352

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2075

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

347

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

255

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

324

2023.10.09

数据库对象名无效怎么解决
数据库对象名无效怎么解决

数据库对象名无效解决办法:1、检查使用的对象名是否正确,确保没有拼写错误;2、检查数据库中是否已存在具有相同名称的对象,如果是,请更改对象名为一个不同的名称,然后重新创建;3、确保在连接数据库时使用了正确的用户名、密码和数据库名称;4、尝试重启数据库服务,然后再次尝试创建或使用对象;5、尝试更新驱动程序,然后再次尝试创建或使用对象。

410

2023.10.16

vb连接access数据库的方法
vb连接access数据库的方法

vb连接access数据库方法:1、使用ADO连接,首先导入System.Data.OleDb模块,然后定义一个连接字符串,接着创建一个OleDbConnection对象并使用Open() 方法打开连接;2、使用DAO连接,首先导入 Microsoft.Jet.OLEDB模块,然后定义一个连接字符串,接着创建一个JetConnection对象并使用Open()方法打开连接即可。

405

2023.10.16

vb连接数据库的方法
vb连接数据库的方法

vb连接数据库的方法有使用ADO对象库、使用OLEDB数据提供程序、使用ODBC数据源等。详细介绍:1、使用ADO对象库方法,ADO是一种用于访问数据库的COM组件,可以通过ADO连接数据库并执行SQL语句。可以使用ADODB.Connection对象来建立与数据库的连接,然后使用ADODB.Recordset对象来执行查询和操作数据;2、使用OLEDB数据提供程序方法等等。

221

2023.10.19

Golang 性能分析与pprof调优实战
Golang 性能分析与pprof调优实战

本专题系统讲解 Golang 应用的性能分析与调优方法,重点覆盖 pprof 的使用方式,包括 CPU、内存、阻塞与 goroutine 分析,火焰图解读,常见性能瓶颈定位思路,以及在真实项目中进行针对性优化的实践技巧。通过案例讲解,帮助开发者掌握 用数据驱动的方式持续提升 Go 程序性能与稳定性。

9

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 11.5万人学习

Node.js 教程
Node.js 教程

共57课时 | 9.1万人学习

CSS3 教程
CSS3 教程

共18课时 | 4.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号