日期:2014-05-17  浏览次数:20912 次

该sql语句该如何优化,两张表都是大数据量,急!!!
update cfg_custrisk r set r.needrecognise='1', r.recognisetype=vc_libtype
  where exists(select 1 from ta_ack_acct t
  where t.businesscode='103' 
  and t.transactioncfmdate>to_char((sysdate-to_number(arrchar(1))),'yyyymmdd')
  and r.tano = t.tano and r.taaccountid = t.taaccountid 
  group by t.tano, t.taaccountid 
  having count(1) > to_number(arrchar(2)));


其中表cfg_custrisk 和表ta_ack_acct 数据量都上万级

求高手们赐招!!!

------解决方案--------------------
--试试这个,没有测试,因为没有数组arrchar定义和变量vc_libtype定义
--使用GROUP BY 应该不会影响速度,才万级数据。我用我自己的表做的测试,一千四百万行数据查询时间大约是50秒。
UPDATE
(SELECT r.needrecognise,
r.recognisetype,
t.tano,
t.taaccountid,
count(1)
FROM cfg_custrisk r,
ta_ack_acct t
WHERE r.tano = t.tano
AND r.taaccountid = t.taaccountid
AND t.businesscode ='103'
AND t.transactioncfmdate > TO_CHAR((sysdate-to_number(arrchar(1))),'yyyymmdd')
GROUP BY r.needrecognise,
r.recognisetype,
t.tano,
t.taaccountid
HAVING COUNT(1) > to_number(arrchar(2) ) a
SET a.needrecognise='1',
a.recognisetype =vc_libtype;
------解决方案--------------------
才上万 绝对要不了多少时间呢 秒杀



用Where子句替换HAVING子句: 

避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤。这个处理需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销。(非oracle中)on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后,因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,where也应该比having快点的,因为它过滤数据后才进行sum,在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where可以使用rushmore技术,而having就不能,在速度上后者要慢如果要涉及到计算的字段,就表示在没计算之前,这个字段的值是不确定的,根据上篇写的工作流程,where的作用时间是在计算之前就完成的,而having就是在计算后才起作用的,所以在这种情况下,两者的结果会不同。在多表联接查询时,on比where更早起作用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里。