哪个SQL执行效率高?
两张表
T_3G_TEST(PRD_INST_ID,BYTES_3G) PRD_INST_ID上聚簇索引
T_QD_HLF(PRD_INST_ID,AREA_NAME,...) PRD_INST_ID上聚簇索引、AREA_NAME上非聚簇索引
两张表都有500W左右数据,想要对AREA_NAME为'ZL'的PRD_INST_ID对应的BYTES_3G进行求和,三种做法执行计划完全一样,我表示不理解。
第1种:
SELECT SUM(a.BYTES_3G)
FROM dbo.T_3G_TEST a ,
dbo.T_QDHLF b
WHERE a.PRD_INST_ID = b.PRD_INST_ID
AND b.AREA_NAME = 'ZL'
第2种:
SELECT SUM(a.BYTES_3G)
FROM dbo.T_3G_TEST a
WHERE EXISTS ( SELECT 1
FROM T_QDHLF b
WHERE a.PRD_INST_ID = b.PRD_INST_ID
AND b.AREA_NAME = 'ZL' )
第3种:
SELECT SUM(a.BYTES_3G)
FROM dbo.T_3G_TEST a
WHERE PRD_INST_ID IN ( SELECT PRD_INST_ID
FROM T_QDHLF b
WHERE b.AREA_NAME = 'ZL' )
------解决方案--------------------都一样,
主要是你的where 条件不复杂
而且返回的结果也只有一个聚合值
所以对三个语句优化后的方案都是一样的。
------解决方案--------------------不要光看语句,因为索引、统计信息等等都会影响查询。打开set statistics io on 来监控io,并打开执行计划,然后两者做对比,由于查询优化器会做一些调整,所以不排除多个查询在交给存储引擎的时候已经变成了同一个查询。另外由于数据分布的不同,简单的修改可能有非常大的性能差异。比如order by是asc还是desc,经常会有很大的差异。