日期:2014-05-16  浏览次数:20575 次

oracle如何查询和停止正在运行的job
  今天遇到一个问题,有一个JOB会一直不停的执行,不能按照设定的间隔来执行。通过查询相关资料发现原来如此:

         当一个oracle job运行时返回一个error时,oracle会再次设法执行它,第一次尝试是在一分钟后,第二次是在2分钟后,第三次是4分钟后,以此类推。每次尝试的周期加倍,直到下一次的运行时刻来到,又再次尝试,当尝试执行失败16次时,oracle自动标示此job为broken,不再执行此任务。

     由于这是一个不能重复跑的JOB,就查找如何停止正在运行的JOB,操作如下:   

1. 首先确定要停止的JOB号

    在10g中可通过Dba_Jobs_Running进行确认。

    查找正在运行的JOB:

    select sid from dba_jobs_running;


    查找到正在运行的JOB的spid:

    select a.spid from v$process a ,v$session b where a.addr=b.paddr and b.sid in (select sid from dba_jobs_running);



2. Broken你确认的JOB   
    注意使用DBMS_JOB包来标识你的JOB为BROKEN。

    SQL> EXEC DBMS_JOB.BROKEN(job#,TRUE);

   注意:当执行完该命令你选择的这个JOB还是在运行着的。


3. Kill 对应的Oracle Session

    应为BROKEN后该JOB还在运行,如果要求该JOB立刻停止,就需要找到该job的对应SESSION(SID,SERIAL#),然后执行以下命令:

    ALTER SYSTEM KILL SESSION 'sid,serial#';

     或者直接KILL对应的操作系统的SESSION,如果使用ALTER SYSTEM KILL SESSION执行很长时间,其实可以使用OS的命令来快速KILL掉SESSION.

     For Windows, at the DOS Prompt: orakill sid spid

     For UNIX at the command line> kill –9 spid

   注意:ALTER SYSTEM KILL SESSION 'sid,serial#';  有时候是关闭不掉了,杀掉只有又会自动执行,因此建议直接啥系统线程

4. 检查你的JOB是否还在运行

   检查你要停止的JOB是否还在运行,其实多数情况下,应该都已经停止了。尤其执行的第三步的“杀手”命令。如果真的还是没有停止,只好从第一道第三步重新做一下了。


5. 将Job Queue Processes的数目修改为0 

    首先确认当前的Job Queue Processes的数目

    SQL> col value for a10

    SQL> select name,value from v$parameter where name ='job_queue_processes';    

    然后将Job Queue Processes的数目修改为0

    SQL> ALTER SYSTEM SET job_queue_processes = 0;

     保证所有的JOB都会停止。


6. 修改你要修改的任何东西,甚至是JOB内的内容。


7. 修改完成后,将job的BROKEN状态停止。

SQL>EXEC DBMS_JOB.BROKEN(job#,FALSE):


8. 恢复job_queue_processes的原始值

     ALTER SYSTEM SET job_queue_processes = original_value;

    至此整个停止并修改JOB完成.

    

    但是需要另外注意一下的是,在MARK一个BROKEN状态的时候,因为JOB内部执行SQL的原因,所以执行时或许要“煎熬”一段时间。所以在建立JOB时一定要仔细考虑,同时如果可能可以在你设计的PL/SQL代码中,增加一些判断“停止信号”的部分。来避免费力执行上面的步骤。

    毕竟,ORACLE在执行JOB时,还是很“倔强”的 -:)


4      附件:ORAKILL用法
很多时候遇到某个session一直处于active,使得CPU一直处于搞使用状态,虽然kill 了,但是却不能够使得使得线程结束。 kill session只是kill这个进程,但是线程一直处于活动状态。需要真正的kill线程才能够解决cpu使用率高的问题。

os :windows2003

ORAKILL用法是 orakill sid spid 其中sid为实例名,spid为线程号。

怎么样取得这个spid呢?

以下给出查找spid的语句。

select spid, osuser, s.program from v$process p, v$session s

where p.addr=s.paddr and s.sid = XXX;

--说明:XXX为session的sid (不是数据库SID 呵呵)。自己输入就可以。
orakill instance_name spid

这样就能够成功解决cpu使用率高的问题