ORACLE在执行SQL时如果使用成本方式分析则所有的成本分析信息来源依托于系统的统计分析表(DBA_TABLES、DBA_INDEXES、DBA_TAB_COLUMNS)数据,如果说统计分析的数据是不精确的,那可能会使ORACLE分析出来的路径执行功用极差,所以统计分析数据是影响ORACLE功用极重要的信息。
统计分析次要包括产生表及索引的统计信息
表的统计信息次要包括表的行数,每行的平均长度(字节),空闲块,统计时间等信息
索引的统计信息次要包括行数、层数、叶块数、统计时间等信息。
另外ORACLE还可以统计列及数据不对称信息,9i还可以统计系统信息(CPU,I/O)
ORACLE执行成本分析时首先取出所使用表及索引的统计数据进行分析,其中数据行数是一个重要的参数,由于ORACLE在分析表大小时行数为次要参数,如果进行两个表联合时,ORACLE会通过分析表的大小,决定使用小表进行全表查询,而大表执行联合查询,这种功用明显高于先大表进行全表扫描。索引的统计信息对分析也产生比较大的影响,如ORACLE通过统计可以分析产生多个索引的优先级及索引的实用性来确定最优的索引策略。ORACLE还可以统计列及数据对称信息以产生更精确的分析。如一个表有A字段的索引,其中A共有两种值1和0,共10000条记录,为0的记录有10条,为1的记录有9990条,这时如果没有进行列数据不对称的统计信息,那么ORACLE对A=0及A=1条件查询都会进行索引,但实际使用对A=0的索引功用得到了很大的提高,而A=1的索引反而使功用下降。所以说索引特征值分析信息对使用索引产生严重影响,精确的信息使ORACLE不会使用不应该用的索引。
实际分析
zl_cbqc和zl_yhjbqk都没有建立统计信息,执行如下两个SQL ORACLE将产生不同的执行计划。
1 select * from dlyx.zl_cbqc b, dlyx.zl_yhjbqk a where a.qc_bh=b.qc_bh
执行计划:
SELECT STATEMENT, GOAL = CHOOSE
NESTED LOOPS
TABLE ACCESS FULL DLYX ZL_YHJBQK
TABLE ACCESS BY INDEX ROWID DLYX ZL_CBQC
INDEX UNIQUE SCAN DLYX 抄表区册主键
2 select * from dlyx.zl_yhjbqk a,dlyx.zl_cbqc b where a.qc_bh=b.qc_bh
执行计划:
SELECT STATEMENT, GOAL = CHOOSE
NESTED LOOPS
TABLE ACCESS FULL DLYX ZL_CBQC
TABLE ACCESS BY INDEX ROWID DLYX ZL_YHJBQK
INDEX RANGE SCAN DLYX 区册索引
在对两个表进行了统计分析后
3 select * from dlyx.zl_yhjbqk a,dlyx.zl_cbqc b where a.qc_bh=b.qc_bh
执行计划:
SELECT STATEMENT, GOAL = CHOOSE 159 72853 9689449
HASH JOIN 159 72853 9689449
TABLE ACCESS FULL DLYX ZL_CBQC 1&