MySQL 是如何实现 ACID 的?
阅读本文大概需要 8 分钟。
来自:https://llc687.top/131.html
本文主要探讨MySQL InnoDB 引擎下ACID的实现原理,对于诸如什么是事务,隔离级别的含义等基础知识不做过多阐述。
ACID
(Atomicity)原子性: 事务是最小的执行单位,不允许分割。原子性确保动作要么全部完成,要么完全不起作用; (Consistency)一致性: 执行事务前后,数据保持一致; (Isolation)隔离性: 并发访问数据库时,一个事务不被其他事务所干扰。 (Durability)持久性: 一个事务被提交之后。对数据库中数据的改变是持久的,即使数据库发生故障。
隔离性
隔离级别 | 说明 |
---|---|
读未提交 | 一个事务还没提交时,它做的变更就能被别的事务看到 |
读提交 | 一个事务提交之后,它做的变更才会被其他事务看到 |
可重复读 | 一个事务中,对同一份数据的读取结果总是相同的,无论是否有其他事务对这份数据进行操作,以及这个事务是否提交。InnoDB默认级别。 |
串行化 | 事务串行化执行,每次读都需要获得表级共享锁,读写相互都会阻塞,隔离级别最高,牺牲系统并发性。 |
隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
读未提交 | 可以出现 | 可以出现 | 可以出现 |
读提交 | 不允许出现 | 可以出现 | 可以出现 |
可重复读 | 不允许出现 | 不允许出现 | 可以出现 |
序列化 | 不允许出现 | 不允许出现 | 不允许出现 |
锁
粒度
行锁的种类
共享锁:读锁,允许其他事务再加S锁,不允许其他事务再加X锁,即其他事务只读不可写。 select...lock in share mode
加锁。排它锁:写锁,不允许其他事务再加S锁或者X锁。 insert、update、delete、for update
加锁。
行锁的实现算法
Record Lock
Gap Lock
Next-Key Lock
锁之于隔离性
MVCC
版本链
DATA_TRX_ID:数据行版本号。用来标识最近对本行记录做修改的事务 id。 DATA_ROLL_PTR:指向该行回滚段的指针。该行记录上所有旧版本,在 undo log
中都通过链表的形式组织。
undo log : 记录数据被修改之前的日志,后面会详细说。
ReadView
trx_ids: 当前系统活跃(未提交)事务版本号集合。 low_limit_id: 创建当前 read view 时“当前系统最大事务版本号+1”。 up_limit_id: 创建当前read view 时“系统正处于活跃事务最小版本号” creator_trx_id: 创建当前read view的事务版本号;
开始查询
DATA_TRX_ID
DATA_TRX_ID >= low_limit_id:
说明该数据是在当前read view 创建后才产生的,数据不显示。
不显示怎么办,根据 DATA_ROLL_PTR 从 undo log 中找到历史版本,找不到就空。 up_limit_id
<low_limit_id :就要看隔离级别了。
RR 级别的幻读
事物 1 | 事物 2 |
---|---|
begin | begin |
select * from dept | |
- | insert into dept(name) values("A") |
- | commit |
update dept set name="B" | |
commit |
id name
1 A
2 B
id name
1 B
2 B
原子性
对于每个 insert,回滚时会执行 delete; 对于每个 delete,回滚时会执行insert; 对于每个 update,回滚时会执行一个相反的 update,把数据改回去。
持久性
一条SQL更新语句怎么运行
redo log
大小固定,循环写 crash-safe
Buffer Pool
当读取数据时,会先从Buffer Pool中读取,如果Buffer Pool中没有,则从磁盘读取后放入Buffer Pool; 当向数据库写入数据时,会首先写入Buffer Pool,Buffer Pool中修改的数据会定期刷新到磁盘中。
刷脏页是随机 IO,redo log 顺序 IO 刷脏页以Page为单位,一个Page上的修改整页都要写;而redo log 只包含真正需要写入的,无效 IO 减少。
binlog
层次:redo log 是 innoDB 引擎特有的,server 层的叫 binlog(归档日志) 内容:redolog 是物理日志,记录“在某个数据页上做了什么修改”;binlog 是逻辑日志,是语句的原始逻辑,如“给 ID=2 这一行的 c 字段加 1 ” 写入:redolog 循环写且写入时机较多,binlog 追加且在事务提交时写入
binlog 和 redo log
update T set c=c+1 where ID=2;
执行器先找引擎取 ID=2 这一行。ID 是主键,直接用树搜索找到。如果 ID = 2 这一行所在数据页就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,再返回。 执行器拿到引擎给的行数据,把这个值加上 1,N+1,得到新的一行数据,再调用引擎接口写入这行新数据。 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。 执行器生成这个操作的 binlog,并把 binlog 写入磁盘。 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成
先 redo 后 bin : binlog 丢失,少了一次更新,恢复后仍是0。 先 bin 后 redo : 多了一次事务,恢复后是1。
一致性
总结
https://learnku.com/articles/39212
https://www.cnblogs.com/rjzheng/p/10841031.html
https://www.cnblogs.com/kismetv/p/10331633.html
推荐阅读:
内容包含Java基础、JavaWeb、MySQL性能优化、JVM、锁、百万并发、消息队列、高性能缓存、反射、Spring全家桶原理、微服务、Zookeeper......等技术栈!
⬇戳阅读原文领取! 朕已阅
评论