简介
每个使用关系型数据库的程序都可能遇到数据死锁或不可用的情况,而这些情况需要在代码中编程来解决;本文主要介绍与数据库事务死锁等情况相关的重试逻辑概念,此外,还会探讨如何避免死锁等问题,文章以DB2(版本9)与Java为例进行讲解。
什么是数据库锁定与死锁
锁定(Locking)发生在当一个事务获得对某一资源的“锁”时,这时,其他的事务就不能更改这个资源了,这种机制的存在是为了保证数据一致性;在设计与数据库交互的程序时,必须处理锁与资源不可用的情况。锁定是个比较复杂的概念,仔细说起来可能又需要一大篇,所以在本文中,只把锁定看作是一个临时事件,这意味着如果一个资源被锁定,它总会在以后某个时间被释放。而死锁发生在当多个进程访问同一数据库时,其中每个进程拥有的锁都是其他进程所需的,由此造成每个进程都无法继续下去。
如何避免锁
我们可利用事务型数据库中的隔离级别机制来避免锁的创建,正确地使用隔离级别可使程序处理更多的并发事件(如允许多个用户访问数据),还能预防像丢失修改(Lost Update)、读“脏”数据(Dirty Read)、不可重复读(Nonrepeatable Read)及“虚”(Phantom)等问题。
隔离级别 问题现象
丢失修改 读“脏”数据 不可重复读 “虚”
可重复读取 No No No No
读取稳定性 No No No Yes
光标稳定性 No No Yes Yes
未提交的读 No Yes Yes Yes
表1:DB2的隔离级别与其对应的问题现象
在只读模式中,就可以防止锁定发生,而不用那些未提交只读隔离级别的含糊语句。一条SQL语句当使用了下列命令之一时,就应该考虑只读模式了:
1、JOIN
2、SELECT DISTINCT
3、GROUP BY
4、ORDER BY
5、UNION
6、UNION ALL
7、SELECT
8、FOR FETCH ONLY (FOR READ ONLY)
9、SELECT FROM
如果包含上述任一命令,可以说你的SQL语句有歧义性,因此,锁可能就是造成其中资源问题的源头。
另外,以下是一些可降低锁数目的建议:
1、 将CURRENTDATA设为NO。这条命令告诉DB2模糊光标为只读。
2、 在适当的时候,尽可能使用User Uncommitted Read(用户未提交的读)。
3、 尽可能关闭所有光标。
4、 有一个正确的提交策略。确保程序不再使用资源时就立即释放它。
如何处理死锁与超时
在程序中使用重试逻辑,可处理以下三种SQL错误代码:
1、 904:返回这个代码表示一条SQL语句是因为已达到资源限度而结束的。程序中可提交或回滚更改,并执行重试逻辑。
2、 911:程序收到这个SQL代码,表示因为没有为锁列表分配足够的内存,现在已达到数据库的最大锁数目。
3、 912:程序收到这个SQL代码,表示死锁或超时,依照904中的方法来解决。
以下是一段Java代码,其捕捉返回的-911、-912、-904代码,并进行重试:
for (int i = 0; i < MAX_RETRY_ATTEMPTS; i++) {
//以下代码模拟一次事务
try {
stmt = conn.createStatement();
System.out.println(“Transaction started…”);
stmt.executeUpdate(“UPDATE 1…”); //SQL语句1
stmt.executeUpdate(“UPDATE 2…”); // SQL语句2
stmt.executeUpdate(“UPDATE 3…”); // SQL语句3
stmt.executeUpdate(“UPDATE 3…”); // SQL语句4
//提交所有更改
conn.commit();
System.out.println(“事务已完成。”);
//确保只运行了一次。
i = MAX_RETRY_ATTEMPTS;
} catch (SQLException e) {
/**
*如果返回的SQL代码为-911,回滚会自动完成,程序回滚至前一次的提交状态。
*程序将进行重试。
*/
if (-911 == e.getErrorCode()) {
//等待RETRY_WAIT_TIME
try {
Thread.sleep(RETRY_WAIT_TIME);
} catch (InterruptedException e1) {
//即使休眠被打断,但仍要重试。
System.out.println(“休眠被打断。”);
}
}
/**
*如果返回的SQL代码为-912,表示死锁及超时。
*如果是-904,代表已达到资源限度。
*在这种情况下,程序将回滚并进行重试。
*/
else if (-912 == e.getErrorCode() || -904 == e.getErrorCode()) {
try {
//需要回滚
conn.rollback();
} catch (SQLException e1) {
System.out.println(“无法回滚。”; color:black’> + e);
}
try {
//等待RETRY_WAIT_TIME
Thread.sleep(RETRY_WAIT_TIME);
} catch (InterruptedException e1) {
//即使休眠被打断,但仍要重试。
System.out.println(“休眠被打断。” + e1);
}
} else {
//如果是其他错误,就不进行重试。
i = MAX_RETRY_ATTEMPTS;
System.out.println(“有错误发生,错误代码:”
+ e.getErrorCode() + ” SQL状态:”
+ e.getSQLState() + “其他信息:” + e.getMessage());
}
从上面也可看到,程序对死锁、超时、最大锁数目将会进行MAX_RETRY_ATTEMPTS次重试;其次,当“最大锁数目”的情况发生时 (-911),程序不必手工进行回滚,因为此时的回滚是自动完成的;最后,无论何时返回-911、-904、-912代码,程序应在下次重试前等待 RETRY_WAIT_TIME一段时间。