日期:2014-05-17  浏览次数:21179 次

求教oracle出现ORA-03135后程序不能重新连接数据库的问题!!!
各位大神:

我用OTL(开源的、用C++封装的操作数据库的类库)连接oracle数据库,并实时提交记录。程序用多个线程(最多5个)连接数据库。最近发现程序在运行一段时间(22个小时左右)后,出现假死的情况,所有的连接线程都在,但是连接线程好像在哪里卡住了,用VS附加上去也不能看到在哪里卡住了(因为连接线程已经卡住了,不能继续执行)。

查看程序日志,发现OTL捕获的异常信息是:ORA-03135:连接失去联系
查看oracle的alert日志,发现有以下错误:
Fatal NI connect error 12638, connecting to:
(DESCRIPTION=(ADDRESS=(PROTOCOL=BEQ)(PROGRAM=oracle)(ARGV0=oraclencsoft)(ARGS='(DESCRIPTION=(LOCAL=YES)(ADDRESS=(PROTOCOL=beq)))'))(CONNECT_DATA=(SID=ncsoft)(CID=(PROGRAM=D:/oracle/product/10.2.0/db_2/bin/sqlplus.exe)(HOST=YEXY1)(USER=yexy1))))

  VERSION INFORMATION:
TNS for 32-bit Windows: Version 10.2.0.1.0 - Production
Oracle Bequeath NT Protocol Adapter for 32-bit Windows: Version 10.2.0.1.0 - Production
  Time: 07-7月 -2010 13:33:07
  Tracing not turned on.
  Tns error struct:
    ns main err code: 12638
    TNS-12638: 身份证明检索失败
    ns secondary err code: 0
    nt main err code: 0
    nt secondary err code: 0
    nt OS err code: 0

我尝试http://blog.csdn.net/yexianyi/article/details/5724267上面的解决方法及在服务器上设置SQLNET.EXPIRE_TIME=5,但是仍没有解决。

程序中连接的使用流程是(根据程序日志,怀疑在这个函数卡住了):提交记录时如果捕获到异常,则会尝试不停地重新连接数据库直到连接成功,以下是重新连接的代码:
void ReConnect(otl_connect &otlConnect, const char *pConnStr, int iAutoCommit)
{
 if (1 == otlConnect.connected)
 {
  otlConnect.logoff();
 }

Retry:
 try
 {
  otlConnect.rlogon(pConnStr, iAutoCommit);
 }
 catch (otl_exception &e)
 {
  Sleep(1000);
  goto Retry;
 }
 //保存重新连接成功的日志           //卡住时没有执行到这里
}

这个问题困扰我两天了,即便出现ORA-03135错误,连接relogon就可以了,为什么会卡住呢?求各位指点,非常感谢!

------解决方案--------------------
提交频率是多少。看一下log有没有对应的日志,看一下监听日志的大小