delete\update where… in语句 导致死锁问题分析

1、问题描述
测试中发现delete\update语句在并发测试时经常会导致发生死锁。
2、问题分析
在mariadb中,update或delete使用 where(…,…,…) in (…,…,..) 的写法会导致全表扫描,加大锁冲突的概率,造成死锁。
例1:

场景1:

当会话1:start transaction;
delete from b where (a,b,c,d,e) in ((1,1,1,1,1));
会话2:start transaction;
delete from b where (a,b,c,d,e) in ((1,1,2,1,1));
此时会话2会产生锁等待。
而场景2:
当会话1:start transaction;
delete from b where where a=1 and b=1 and c=1 and d=1 and e=1;
会话2:start transaction;
delete from b where where a=1 and b=1 and c=2 and d=1 and e=1;
不会产生锁等待。
例2:

3、解决办法

不使用delete\update where… in的写法,改为delete\update where … and …or
4、半一致性读仍会死锁问题
在read-committed隔离级别下,update会使用半一致性读,为什么还是有几率发生死锁?
根据场景复现后,show engine innodb status查看死锁信息,发现发生死锁的事务会占有很多锁,不符合innodb半一致读的特性:

5、Mariadb处理逻辑

在RC隔离级别下,在执行计划为全表扫描或全索引扫描的情况下innodb处理update的流程如下图:
6、源码分析
遍历记录的主函数为row_search_for_mysql()
调用sel_set_rec_lock()尝试加锁
如果加锁时产生锁等待,即:

进行半一致性读:


如果在半一致读时,等待的锁已被释放,则锁读当前版本

如果读取到历史版本则设置did_semi_consistent_read = TRUE;
根据did_semi_consistent_read的值设置prebuilt->row_read_type

调用解锁函数ha_innobase::unlock_row()


但是由于在上面的代码中prebuilt->new_rec_locks的值为0,所以不会对记录解锁!!!

测试MySQL不存在上述问题,应该是这块逻辑与MariaDB不同。

Mysql主备延时监控工具pt-heartbeat

pt-heartbeat是percona toolkit里带的一个监控Mysql主备延时的工具。
       编译、安装:
       perl Makefile.PL
       make
       make install
       工具原理:
  1. 在主上建立一张heartbeat表,定时向该表插入当前时间戳。
  2. 在备机上定时查询该表的时间戳,并与当前系统时间对比,计算出的差值即为从落后主的时间。
  3. 使用前提:主备系统时间必须一致。可以使用ntp服务同步。
使用步骤:
  1. 在主上运行:pt-heartbeat –user=root –host=10.47.160.26 –create-table -D lzk –interval=1 –update –daemonize 初始化表并建立后台进程定时更新heartbeat表
  2. 在备上运行:pt-heartbeat -D lzk –table=heartbeat –monitor –user=root –host=10.47.160.26 –interval=1 –port=5182 监控
[lzk2@redhat64-26 ~]$ pt-heartbeat -D lzk –table=heartbeat –monitor –user=root –host=10.47.160.26 –interval=1 –port=5182
184.00s [  3.07s,  0.61s,  0.20s ]
185.00s [  6.15s,  1.23s,  0.41s ]
186.00s [  9.25s,  1.85s,  0.62s ]
187.00s [ 12.37s,  2.47s,  0.82s ]
186.95s [ 15.48s,  3.10s,  1.03s ]
187.95s [ 18.61s,  3.72s,  1.24s ]
188.95s [ 21.76s,  4.35s,  1.45s ]
189.95s [ 24.93s,  4.99s,  1.66s ]
190.95s [ 28.11s,  5.62s,  1.87s ]
191.95s [ 31.31s,  6.26s,  2.09s ]
192.95s [ 34.53s,  6.91s,  2.30s ]
193.95s [ 37.76s,  7.55s,  2.52s ]
当前延时   1分钟   5分钟  15分钟的平均值

MariaDB&MySQL数据库及操作系统字符集设置及关系

1         LINUX操作系统

1.1       系统LANG变量

可以使用locale -a查看系统支持的字符集。
使用export LANG=zh_CN.utf8或zh_CN.gbk进行设置。
如使用ssh客户端连接服务器,如SecrueCRT等,需要设置与服务器相同的字符集才能正常显示。

2         数据库

2.1       数据库字符集变量

查看数据库系统字符集信息:
这些变量都可以通过set 及set global进行修改,重启后失效。

以下为每个变量介绍:

  • character_set_client :客户端字符集,可以通过修改my.cnf中[client]段中的default-character-set,重启客户端生效。
  • character_set_connection:连接字符集,可以通过修改my.cnf中[client]段中的default-character-set,重启客户端生效。
  • character_set_database:数据库默认字符集,创建数据库时指定,不指定则默认使用服务器字符集。建表时如不指定字符集则继承数据库默认字符集。Load data时数据文件字符集需与该值一致。
  • character_set_filesystem :文件系统字符集,linux系统默认为binary。该值不会影响乱码。
  • character_set_results:结果字符集,可以通过修改my.cnf中[client]段中的default-character-set,重启客户端生效。
  • character_set_server:服务器默认字符集,可以通过修改my.cnf中[mysqld]段中的character-set-server,重启服务端生效。如果不配置,则以编译代码时的-DDEFAULT_CHARSET选择为默认值。默认为latin1。
  • character_set_system:MariaDB系统自用字符集,恒为utf8。该值不会影响乱码。
SET NAMES ‘utf8’;  它相当于下面的三句命令:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;

2.1.1    表以及列字符集

创建表时指定表和列的字符集,如果不指定,则列从表继承,表从character_set_database继承。后期也可通过alter table命令修改。

2.2       SQL脚本

一个用户请求字符集转换完整流程:

1、Mysql客户端以character_set_client解析SQL语句

2、转化为character_set_connection发送到服务端(character_set_connection字符集必须大于等于character_set_client,否则会丢失数据。如utf8>gbk>latin1)

3、服务端转化为内部字符集

(同理,内部字符集必须大于等于character_set_connection,否则会丢失数据。
按照如下规则:
    A. 转化为每个数据字段的CHARACTER SET设定值;
    B. 若上述值不存在,则继承对应数据表的CHARACTER SET设定值
    C. 若上述值不存在,则继承对应数据库的 character_set_database设定值;
    D. 若上述值不存在,则继承character_set_server设定值。)

4、最后服务端将操作结果从内部操作字符集转换为character_set_results返回客户端。

sql脚本编码必须与character_set_client一致,否则会出现乱码。

2.3       LOAD导入数据文件

LOAD命令字符集转换完整流程:

1、以LOAD命令里指定的CHARACTER SET解析数据文件(如没有指定,则以character_set_database设定值解析)

2、服务端转化为内部字符集(规则同2.2)

如不在LOAD命令中指定,则数据文件编码必须与character_set_database一致,否则会出现编码错误无法导入。

2.4       导出数据文件

如不在导出命令中指定字符集,则不进行转换,以数据列的字符集直接导出。(如果表的不同字段设置的字符集不同,会导致同一数据文件存在多种编码格式,如:字段a以utf8编码,b以gbk编码。)
如在命令中指定字符集,则按照指定的字符集导出到文件中。