数据库事务处理
整理一下事务处理相关内容。
一个典型场景就是我们需要删掉一个用户,跟这个用户相关其他的东西也应当一并删除。 这堆东西可能会跨几张表,就要好几个语句。 但是因为这个用户可能在两个客户端上同时操作同一个账号,就会产生并发问题。 如果有的语句成功,有的失败,也就是删不干净,那这个用户因为黑历史没有抹杀掉,但他号又没了根本登不上,他就会非常难受。 所以这个时候,就要用到事务处理。
事务处理的目的就是简化并发情况下访问数据库避免爆炸的问题。
ACID
一般情况下,一个事务应当具有这四个特性:原子性、一致性、隔离性、持久性。
原子性就是说一个事务内的语句要么全部成功,要么全部失败。 比如说在一个事务里删一个用户的所有相关信息,成功的话就全部删干净,失败的话就保持原样,避免用户登录不上去了结果黑历史还留着删不掉的尴尬情况。
一致性就是指事务之前与事务之后数据库应当保持一致性。 可以理解成这些数据在经历了一个事务之后,仍然遵守某种规则。 最简单的就是要遵守表的结构,当然一条记录必定会满足这个条件。 更多的情况是,这些数据应当遵守程序员在业务逻辑上规定的条件。 比方说两个用户之间赠送物品,总归是一个用户甲失去物品,另一个用户乙得到物品。 那么规则就是这个物品只能有一个,不能出现甲失去物品时宕机结果这个物品就丢了,或者乙得到物品时宕机然后这个物品就甲和乙都持有这类的情况。 所以保证一致性实际上是需要数据库跟程序员共同完成的,程序员需要合理设计事务才能保持数据的一致性。
隔离性就很简单了,就是事务与事务之间是相对独立的,可以减少事务之间的互相干扰。 但是隔离是有等级的,不同的等级隔离的效果也不一样,后面会提到。
持久性,事务处理成功结束后应当将对数据的修改持久化,此后就不会受到宕机的影响。
锁
因为并发读写操作是可能产生冲突的,因此我们需要用锁机制来避免并发的时候爆炸。 锁机制的实现是非常复杂的。 如果要谈到排他锁、共享锁、更新锁、意向锁这些锁的类型,必须要结合数据库的具体实现来谈,不一定具有普适性,而且也不是两三句话能讲清楚的。 这里为了简单,我们考虑从锁的粒度来进行分类。
-
行锁。
就是对一条记录加锁,比如说修改一条记录时就要加行锁。
-
间隙锁。
对一段区间内的数据加锁,比如说更新一个范围内的所有数据时就需要间隙锁。 注意,间隙锁需要索引的支持,如果这个范围的字段没有建好合适的索引,那它就会升级为表锁。 而且也不是所有的数据库都支持间隙锁,这个也要看具体实现。
-
表锁。
直接锁住整张表,实现会比较简单,上锁的开销也比较小,但是显然并发能力很弱。
隔离级别
有四种级别:未提交读、已提交读、可重复读、串行。 首先假设我们有两个数据库连接,然后每个连接各跑一个事务,分别为事务甲和事务乙。 然后在各个隔离级别下分别介绍它们的隔离效果。
-
未提交读。
事务甲与乙都没有提交,它们的修改双方都能读到。
-
已提交读。
事务甲与乙只能读到提交后的修改。 但是如果甲先读了一条记录,乙修改这条记录提交后,甲再读这个记录就会发现它被改变了,这就是不可重复读问题。
-
可重复读。
一个事务对于提交后的修改都无法感知,除了新记录的插入。 一个事务能够感知到新纪录的插入,这就是幻读问题。
-
串行。
就是甲和乙只能一个一个排队执行。 不会有并发的问题,因为是串行的。
我怎么感觉是废话。
并发问题
其实隔离级别里面已经说的差不多了,但是还是来总结一下。 还是假设我们有两个数据库连接,每个连接各跑一个事务,分别为事务甲和事务乙。
-
脏读。
未提交之前,甲和乙之间都能够互相读到对方的修改。
-
不可重复读。
乙读一条记录,甲修改完这条记录之后提交了,乙再读结果发现跟之前读的不一致。
-
幻读。
乙查询总记录数,甲插入了一条新纪录后提交了,乙再读就发现记录数量多了一条。
实现思路
数据库中应用最广泛的就是平衡树,事务处理要解决的问题实际上大部分都是并发访问平衡树的问题。
TODO: 有空填坑。