在JAVA使用JDBC连接数据库进行操作时,有可能为了避免语句运行超时,而设置超时时长。
这里有一个问题是,假设一个事务有两条DML SQL语句,会话在执行第一条SQL成功后,执行第二条SQL超时而中止时,事务处于什么样的状态?通常来说,一个SQL报错,只会进行语句级回滚,整个事务不会进行回滚。我们来进行一下测试。
测试环境:Oracle 11.2.0.2 for Windows。
首先在TEST用户下生成测试表和数据。
TEST@xj11g> create table t1 ( id number primary key,name varchar2(20)); 表已创建。 TEST@xj11g> create table t2 ( id number primary key,name varchar2(20)); 表已创建。 TEST@xj11g> insert into t2 values (1,'a'); 已创建 1 行。 TEST@xj11g> commit; 提交完成。
编译如下的JAVA代码(TestTimeout.java):
import java.sql.*; public class TestTimeout { public static Connection getConnection() throws Exception { String driver = "oracle.jdbc.driver.OracleDriver"; String url = "jdbc:oracle:thin:@localhost:1521:xj11g"; Class.forName(driver); return DriverManager.getConnection(url, "test", "test"); } public static void main(String args[]) { test1(); } public static void test1() { Connection conn = null; Statement pstmt = null; try { conn = getConnection(); conn.setAutoCommit(false); pstmt = conn.createStatement(); pstmt.setQueryTimeout(60); pstmt.execute("insert into t1 values (1,'xx')"); pstmt.execute("update t2 set name='x' where id=1"); conn.commit(); } catch (Exception e) { e.printStackTrace(); try { Thread.sleep(300000); } catch (Exception f) { } } finally { try { pstmt.close(); conn.close(); } catch (SQLException e) { e.printStackTrace(); } } } }
编译JAVA代码:
E:\JavaCode>d:\works\java\jdk1.5.0_21\bin\javac TestTimeout.java
在一个会话里面将T2表中ID=1的行进行UPDATE操作,但是不提交。
TEST@xj11g> update t2 set name='y' where id=1; 已更新 1 行。
然后运行测试用JAVA程序:
E:\JavaCode>set CLASSPATH=ojdbc14.jar;. E:\JavaCode>d:\works\java\jdk1.5.0_21\jre\bin\java TestTimeout
可以预见的是,在执行update表T2时会被锁住:
SYS@xj11g> select sid,event,sql_id from v$session where sid=206; SID EVENT SQL_ID ----------- ----------------------------- ------------- 206 enq: TX - row lock contention 3b3b7s22dv13t
一会儿后JAVA程序报如下的错误:
java.sql.SQLException: ORA-01013: 用户请求取消当前的操作 at oracle.jdbc.driver.DatabaseError.throwSqlException(DatabaseError.java:112) at oracle.jdbc.driver.T4CTTIoer.processError(T4CTTIoer.java:331) at oracle.jdbc.driver.T4CTTIoer.processError(T4CTTIoer.java:288) at oracle.jdbc.driver.T4C8Oall.receive(T4C8Oall.java:743) at oracle.jdbc.driver.T4CStatement.doOall8(T4CStatement.java:207) at oracle.jdbc.driver.T4CStatement.executeForRows(T4CStatement.java:946) at oracle.jdbc.driver.OracleStatement.doExecuteWithTimeout(OracleStatement.java:1160) at oracle.jdbc.driver.OracleStatement.executeInternal(OracleStatement.java:1679) at oracle.jdbc.driver.OracleStatement.execute(OracleStatement.java:1645) at TestTimeout.test1(TestTimeout.java:23) at TestTimeout.main(TestTimeout.java:12)
可以看到,JAVA程序自己CANCEL掉了SQL的执行。
在JAVA代码中长时间的SLEEP是为了便于观察SQL报错后,事务的状态。
SYS@xj11g> select xidusn,xidslot,xidsqn,status from v$transaction where ses_addr=(select saddr from v$session where sid=206); XIDUSN XIDSLOT XIDSQN STATUS ----------- ----------- ----------- ---------------- 4 28 4117 ACTIVE SYS@xj11g> select * from v$lock where sid=206; SID TY ID1 ID2 LMODE REQUEST CTIME BLOCK ----- -- ----------- ----------- ----------- ----------- ----------- ----------- 206 AE 100 0 4 0 203 0 206 TM 63075 0 3 0 203 0 206 TX 262172 4117 6 0 203 0 SYS@xj11g> select owner,object_name,object_type from dba_objects where object_id=63075; OWNER OBJECT_NAME OBJECT_TYPE -------- ------------ ------------ TEST T1 TABLE
可以看到JAVA程序的会话(此时还没断开连接),仍然是在事务中,并且在表T1上加了锁。
此时如果向T1表插入ID值为1的数据,会被锁阻塞。
SYS@xj11g> insert into test.t1 values (1,'xx');
不过奇怪的是,过几分钟后(JAVA中的SLEEP 300000表示休眠300秒,即5分钟),上述的INSERT语句报错了。查询发现JAVA代码中的INSERT的数据提交了:
insert into test.t1 values (1,'xx') * 第 1 行出现错误: ORA-00001: 违反唯一约束条件 (TEST.SYS_C0011027) SYS@xj11g> select * from test.t1; ID NAME ----------- -------------------- 1 xx
其实想想就能明白,这个并不奇怪,因为JAVA代码的最后正常断开了数据库连接,在默认情况下,正常断开的数据库连接会自动提交没有提交的事务。这也是一种很难排查的产生数据不一致的原因之一。
小结:这个测试JAVA程序,可以表明,JDBC中的语句超时,只会使当前的SQL中止运行,但如果是在一个事务中,之前运行的DML语句并没有提交。这造成的后果有两种:
1. 如果是连接池,那么超时之前更新的数据可能会被其他请求重用时得以提交,或者是在连接释放时得以提交,这造成数据的不一致,因为不是一个逻辑上有效的事务。
2. 由于数据被更新而没有及时回滚,可能会导致应用重新发起相同的事务时被锁住。如果被锁住的会话仍然有超时中止的机制,那么这种情况就会越来越严重。
为了避免以上的两种问题,在超时后,应该主动发起一次ROLLBACK操作。
最后是JAVA程序测试时数据库会话的SQL TRACE记录:
PARSING IN CURSOR #356760536 len=33 dep=0 uid=52 oct=6 lid=52 tim=36160405140 hv=2229109881 ad='7ff55ce8608' sqlid='3b3b7s22dv13t' update t2 set name='x' where id=1 END OF STMT PARSE #356760536:c=0,e=675,p=0,cr=0,cu=0,mis=1,r=0,dep=0,og=1,plh=2789547903,tim=36160405139 *** 2013-09-09 00:51:01.836 WAIT #356760536: nam='enq: TX - row lock contention' ela= 63181195 name|mode=1415053318 usn<<16 | slot=589851 sequence=4123 obj#=63077 tim=36223613008 EXEC #356760536:c=0,e=63208180,p=0,cr=2,cu=1,mis=0,r=0,dep=0,og=1,plh=2789547903,tim=36223613365 ERROR #3:err=1013 tim=36223613426 STAT #356760536 id=1 cnt=0 pid=0 pos=1 obj=0 op='UPDATE T2 (cr=0 pr=0 pw=0 time=4 us)' STAT #356760536 id=2 cnt=1 pid=1 pos=1 obj=63078 op='INDEX UNIQUE SCAN SYS_C0011028 (cr=1 pr=0 pw=0 time=10 us cost=1 size=25 card=1)' WAIT #356760536: nam='SQL*Net break/reset to client' ela= 3586 driver id=1952673792 break?=0 p3=0 obj#=63077 tim=36223617262 WAIT #356760536: nam='SQL*Net message to client' ela= 2 driver id=1952673792 #bytes=1 p3=0 obj#=63077 tim=36223617407 *** 2013-09-09 00:56:01.903 WAIT #356760536: nam='SQL*Net message from client' ela= 300048871 driver id=1952673792 #bytes=1 p3=0 obj#=63077 tim=36523666376 CLOSE #356760536:c=0,e=62,dep=0,type=0,tim=36523666818 XCTEND rlbk=0, rd_only=0, tim=36523666956
在上面可以看到,在最后的确有一个事务事交(XCTEND rlbk=0, rd_only=0)。
很喜欢你的风格,有一副专心研究技术的范。
就这个问题,我的看法:
异常处理的时候,只打印错误就不够的,应该有事物回退语句。那样的话,应该就不会出现语句提交的情况了。
[回复]