前些天公司论坛的一个从数据库报了一次
Duplicate entry(1062)
错误,现在的论坛都搭建了双从库,而登录另一台从库看到是同步正常的,这就有些诡异了。起初以为是mysql版本问题导致,但是检查后发现同步正常的那台机器的mysql版本跟主库不一致,而恰恰是出问题的机器与主库的版本是一致的。出错的语句是一个合并帖子的UPDATE
操作,由此引出了这个问题,问题最初是顺安发现的。
1 问题描述
论坛从Discuz 7.2升级到X3.2,并基于Discuz X3.2版本做了许多的定制和插件开发,用到的MySQL版本为5.1,存储引擎为MyISAM,binlog_format为STATEMENT。这个问题简单描述就是:论坛里面有个帖子表,在合并帖子的时候会对帖子的位置信息进行更新,在执行位置更新语句的时候主库和另一个从库没有报错,而其中一个从库报错了。为了方便描述,这里先创建一个测试表post,
CREATE TABLE `post` (
`i` int(11) DEFAULT NULL,
`p` int(11) NOT NULL,
PRIMARY KEY (`p`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1
然后在里面插入几条数据 insert into post values (1,1), (2,3), (3,4)
。在论坛里面合并帖子的时候会执行一个帖子位置更新的操作 update post set p=p+1;
,这样我们看到这个操作就报错了。
mysql> insert into post values(1,1), (2,3),(3,4);
Query OK, 3 rows affected (0.00 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> update post set p=p+1;
ERROR 1062 (23000): Duplicate entry '4' for key 'PRIMARY'
mysql> select * from post;
+------+---+
| i | p |
+------+---+
| 1 | 2 |
| 2 | 3 |
| 3 | 4 |
+------+---+
3 rows in set (0.00 sec)
2 解决方案
看到这里相比大家都发现了,这是因为UPDATE的顺序问题导致出现了键值冲突,因为我们并没有指定UPDATE的顺序,而恰好我们看到的顺序是按照p=1, 3, 4
的顺序来执行,因此,第一条记录(1,1)成功更新成了(1,2)
,而执行到p=3
的时候,因为p+1=4与已有的值4冲突报错。要解决这个问题的方式也很简单,在更新位置信息时指定顺序为DESC
,这样从大到小执行更新就不会出错了,update post set p=p+1 order by p desc
(ps:之前很少在UPDATE语句中用ORDER BY 语句,还以为不支持,查了下手册确认了下是OK的)。MySQL手册里面还特意提到过这个问题,可能Discuz开发人员没有注意到这一页,当然Discuz里面数据库操作有许多有性能问题的SQL语句,我们已经修过很多BUG了。
If an UPDATE statement includes an ORDER BY clause, the rows are updated in the
order specified by the clause. This can be useful in certain situations that might
otherwise result in an error. Suppose that a table t contains a column id that has
a unique index. The following statement could fail with a duplicate-key error,
depending on the order in which rows are updated:
UPDATE t SET id = id + 1;
For example, if the table contains 1 and 2 in the id column and 1 is updated to 2
before 2 is updated to 3, an error occurs. To avoid this problem, add an ORDER BY
clause to cause the rows with larger id values to be updated before those with
smaller values:
UPDATE t SET id = id + 1 ORDER BY id DESC;
3 几个问题
1)MySQL的SELECT和UPDATE语句的默认顺序是怎么样的?
这个问题mysql手册中也有提到过,SELECT/UPDATE语句的默认顺序跟数据文件以及存储引擎等相关,在写SQL语句的时候千万不要依赖默认顺序,如有需要,请加上ORDER BY.
2)为什么版本一致,但是主库没有报错而从库报错?
这就是第一个问题里面说的,虽然主库和从库版本相同,但是由于数据组织不同导致主库UPDATE的顺序跟从库不同,巧合的避过了重复键的错误。如果本身主库和从库的UPDATE顺序一致,那么主库本身就会只执行部分更新并报错,从之前的那篇 MySQL binlog格式解析可以知道,这种情况下binlog里面是会记录一个错误码的,那么从库在执行的时候虽然也会有一个
Duplicate entry(1062)
错误,但是对比binlog的错误码是一致的,所以同步并不会出错。