濮阳杆衣贸易有限公司

主頁 > 知識庫 > 一次Mysql死鎖排查過程的全紀錄

一次Mysql死鎖排查過程的全紀錄

熱門標簽:遂寧400電話申請 邯鄲400電話注冊辦理 哈爾濱云外呼系統(tǒng)運營商 永州智能外呼系統(tǒng) 南寧智能電銷機器人價格 電銷機器人市場價 dq8 全地圖標注 地圖標注直通車 趙縣地圖標注

前言

之前接觸到的數據庫死鎖,都是批量更新時加鎖順序不一致而導致的死鎖,但是上周卻遇到了一個很難理解的死鎖。借著這個機會又重新學習了一下mysql的死鎖知識以及常見的死鎖場景。在多方調研以及和同事們的討論下終于發(fā)現(xiàn)了這個死鎖問題的成因,收獲頗多。雖然是后端程序員,我們不需要像DBA一樣深入地去分析與鎖相關的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對我們的日常開發(fā)還是大有裨益的。

PS:本文不會介紹死鎖的基本知識,mysql的加鎖原理可以參考本文的參考資料提供的鏈接。

死鎖起因

先介紹一下數據庫和表情況,因為涉及到公司內部真是的數據,所以以下都做了模擬,不會影響具體的分析。

我們采用的是5.5版本的mysql數據庫,事務隔離級別是默認的RR(Repeatable-Read),采用innodb引擎。假設存在test表:

CREATE TABLE `test` (
 `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
 `a` int(11) unsigned DEFAULT NULL,
 PRIMARY KEY (`id`),
 UNIQUE KEY `a` (`a`)
) ENGINE=InnoDB AUTO_INCREMENT=100 DEFAULT CHARSET=utf8;

表的結構很簡單,一個主鍵id,另一個唯一索引a。表里的數據如下:

mysql> select * from test;
+----+------+
| id | a |
+----+------+
| 1 | 1 |
| 2 | 2 |
| 4 | 4 |
+----+------+
3 rows in set (0.00 sec)

出現(xiàn)死鎖的操作如下:

步驟 事務1 事務2
1 begin
2 delete from test where a = 2;
3 begin
4 delete from test where a = 2; (事務1卡?。?/td>
5 提示出現(xiàn)死鎖:ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction insert into test (id, a) values (10, 2);

然后我們可以通過SHOW ENGINE INNODB STATUS;來查看死鎖日志:

------------------------
LATEST DETECTED DEADLOCK
------------------------
170219 13:31:31
*** (1) TRANSACTION:
TRANSACTION 2A8BD, ACTIVE 11 sec starting index read
mysql tables in use 1, locked 1
LOCK WAIT 2 lock struct(s), heap size 376, 1 row lock(s)
MySQL thread id 448218, OS thread handle 0x2abe5fb5d700, query id 18923238 renjun.fangcloud.net 121.41.41.92 root updating
delete from test where a = 2
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BD lock_mode X waiting
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32
 0: len 4; hex 00000002; asc ;;
 1: len 4; hex 00000002; asc ;;
*** (2) TRANSACTION:
TRANSACTION 2A8BC, ACTIVE 18 sec inserting
mysql tables in use 1, locked 1
4 lock struct(s), heap size 1248, 3 row lock(s), undo log entries 2
MySQL thread id 448217, OS thread handle 0x2abe5fd65700, query id 18923239 renjun.fangcloud.net 121.41.41.92 root update
insert into test (id,a) values (10,2)
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock_mode X locks rec but not gap
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32
 0: len 4; hex 00000002; asc ;;
 1: len 4; hex 00000002; asc ;;
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock mode S waiting
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32
 0: len 4; hex 00000002; asc ;;
 1: len 4; hex 00000002; asc ;;
*** WE ROLL BACK TRANSACTION (1)

分析

閱讀死鎖日志

遇到死鎖,第一步就是閱讀死鎖日志。死鎖日志通常分為兩部分,上半部分說明了事務1在等待什么鎖:

170219 13:31:31
*** (1) TRANSACTION:
TRANSACTION 2A8BD, ACTIVE 11 sec starting index read
mysql tables in use 1, locked 1
LOCK WAIT 2 lock struct(s), heap size 376, 1 row lock(s)
MySQL thread id 448218, OS thread handle 0x2abe5fb5d700, query id 18923238 renjun.fangcloud.net 121.41.41.92 root updating
delete from test where a = 2
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BD lock_mode X waiting
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32
 0: len 4; hex 00000002; asc ;;
 1: len 4; hex 00000002; asc ;;

從日志里我們可以看到事務1當前正在執(zhí)行delete from test where a = 2,該條語句正在申請索引a的X鎖,所以提示lock_mode X waiting。

然后日志的下半部分說明了事務2當前持有的鎖以及等待的鎖:

*** (2) TRANSACTION:
TRANSACTION 2A8BC, ACTIVE 18 sec inserting
mysql tables in use 1, locked 1
4 lock struct(s), heap size 1248, 3 row lock(s), undo log entries 2
MySQL thread id 448217, OS thread handle 0x2abe5fd65700, query id 18923239 renjun.fangcloud.net 121.41.41.92 root update
insert into test (id,a) values (10,2)
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock_mode X locks rec but not gap
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32
 0: len 4; hex 00000002; asc ;;
 1: len 4; hex 00000002; asc ;;
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock mode S waiting
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32
 0: len 4; hex 00000002; asc ;;
 1: len 4; hex 00000002; asc ;;

從日志的HOLDS THE LOCKS(S)塊中我們可以看到事務2持有索引a的X鎖,并且是記錄鎖(Record Lock)。該鎖是通過事務2在步驟2執(zhí)行的delete語句申請的。由于是RR隔離模式下的基于唯一索引的等值查詢(Where a = 2),所以會申請一個記錄鎖,而非next-key鎖。

從日志的WAITING FOR THIS LOCK TO BE GRANTED塊中我們可以看到事務2正在申請S鎖,也就是共享鎖。該鎖是insert into test (id,a) values (10,2)語句申請的。insert語句在普通情況下是會申請排他鎖,也就是X鎖,但是這里出現(xiàn)了S鎖。這是因為a字段是一個唯一索引,所以insert語句會在插入前進行一次duplicate key的檢查,為了使這次檢查成功,需要申請S鎖防止其他事務對a字段進行修改。

那么為什么該S鎖會失敗呢?這是對同一個字段的鎖的申請是需要排隊的。S鎖前面還有一個未申請成功的X鎖,所以S鎖必須等待,所以形成了循環(huán)等待,死鎖出現(xiàn)了。

通過閱讀死鎖日志,我們可以清楚地知道兩個事務形成了怎樣的循環(huán)等待,再加以分析,就可以逆向推斷出循環(huán)等待的成因,也就是死鎖形成的原因。

死鎖形成流程圖

為了讓大家更好地理解死鎖形成的原因,我們再通過表格的形式闡述死鎖形成的流程:

步驟 事務1 事務2
1 begin
2 delete from test where a = 2; 執(zhí)行成功,事務2占有a=2下的X鎖,類型為記錄鎖。
3 begin
4 delete from test where a = 2; 事務1希望申請a=2下的X鎖,但是由于事務2已經申請了一把X鎖,兩把X鎖互斥,所以X鎖申請進入鎖請求隊列。
5 出現(xiàn)死鎖,事務1權重較小,所以被選擇回滾(成為犧牲品)。 insert into test (id, a) values (10, 2); 由于a字段建立了唯一索引,所以需要申請S鎖以便檢查duplicate key,由于插入的a的值還是2,所以排在X鎖后面。但是前面的X鎖的申請只有在事務2commit或者rollback之后才能成功,此時形成了循環(huán)等待,死鎖產生。

拓展

在排查死鎖的過程中,有個同事還發(fā)現(xiàn)了上述場景會產生另一種死鎖,該場景無法通過手工復現(xiàn),只有高并發(fā)場景下才有可能復現(xiàn)。

該死鎖對應的日志這里就不貼出了,與上一個死鎖的核心差別是事務2等待的鎖從S鎖換成了X鎖,也就是lock_mode X locks gap before rec insert intention waiting

我們還是通過表格來詳細說明該死鎖產生的流程:

步驟 事務1 事務2
1 begin
2 delete from test where a = 2; 執(zhí)行成功,事務2占有a=2下的X鎖,類型為記錄鎖。
3 begin
4 【insert第1階段】insert into test (id, a) values (10, 2); 事務2申請S鎖進行duplicate key進行檢查。檢查成功。
5 delete from test where a = 2; 事務1希望申請a=2下的X鎖,但是由于事務2已經申請了一把X鎖,兩把X鎖互斥,所以X鎖申請進入鎖請求隊列。
6 出現(xiàn)死鎖,事務1權重較小,所以被選擇回滾(成為犧牲品)。 【insert第2階段】insert into test (id, a) values (10, 2); 事務2開始插入數據,S鎖升級為X鎖,類型為insert intention。同理,X鎖進入隊列排隊,形成循環(huán)等待,死鎖產生。

總結

排查死鎖時,首先需要根據死鎖日志分析循環(huán)等待的場景,然后根據當前各個事務執(zhí)行的SQL分析出加鎖類型以及順序,逆向推斷出如何形成循環(huán)等待,這樣就能找到死鎖產生的原因了。

好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作能帶來一定的幫助,上述分析都是基于經驗的推斷,希望其他小伙伴們能夠指出當中的錯誤以及不足指出,謝謝大家對腳本之家的支持。

您可能感興趣的文章:
  • 詳解MySQL中的死鎖情況以及對死鎖的處理方法
  • mysql 數據庫死鎖原因及解決辦法
  • 查找MySQL線程中死鎖的ID的方法
  • MySQL數據庫的一次死鎖實例分析
  • 一個mysql死鎖場景實例分析
  • 細說MySQL死鎖與日志二三事
  • MYSQL性能優(yōu)化分享(分庫分表)
  • MyBatis實現(xiàn)Mysql數據庫分庫分表操作和總結(推薦)
  • MYSQL數據庫數據拆分之分庫分表總結
  • mysql死鎖和分庫分表問題詳解

標簽:浙江 南寧 上海 張家界 鄂州 阿里 中衛(wèi) 定西

巨人網絡通訊聲明:本文標題《一次Mysql死鎖排查過程的全紀錄》,本文關鍵詞  一次,Mysql,死鎖,排查,過程,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《一次Mysql死鎖排查過程的全紀錄》相關的同類信息!
  • 本頁收集關于一次Mysql死鎖排查過程的全紀錄的相關信息資訊供網民參考!
  • 推薦文章
    通化县| 六枝特区| 巴彦县| 石门县| 前郭尔| 栾川县| 民和| 义马市| 通榆县| 永泰县| 望奎县| 阳曲县| 汉阴县| 清流县| 连南| 安溪县| 夏河县| 洛宁县| 石柱| 馆陶县| 绥滨县| 南宁市| 广昌县| 许昌市| 临清市| 揭西县| 青海省| 防城港市| 华蓥市| 元朗区| 贞丰县| 都昌县| 通榆县| 景泰县| 庄浪县| 郧西县| 秀山| 新郑市| 察哈| 余姚市| 盈江县|