日期:2014-05-16 浏览次数:20514 次
今天在MSDN查询优化建议中看到这样一条信息:SQL Server 会自动考虑索引交集并可以在同一查询中对同一个表使用多个索引(可能跟大家的理解有偏差)。
在解释之前我们先看一个例子:
useAdventureWorks
go
select soh.*
from sales.SalesOrderHeaderASsoh
WHERE soh.SalesPersonID= 276
and soh.OrderDatebetween'4/1/2002'and '7/1/2002'
查看执行计划:
虽然我们建立了SalesPersonID的非聚集索引,但是SQL Server并没有使用,因为OrderDate并没有包含在索引中。 相信这时候大部分的人会在索引上面加一列OrderDate.其实可以还可以有另外一种方法,不改变现在的索引,而新添加一个新索引。 这样SQL Server可以使用多个索引来完成本次查询,这个过程就是索引交集。
那么我们现在OrderDate上面创建一个索引:
CREATE NONCLUSTEREDINDEX[ix_orderdate]ON [Sales].[SalesOrderHeader]( [OrderDate]ASC)
增加索引后我们会看到下面的执行计划:
这次SQL Server使用了两个Non-clustered index seek,然后获得两个子集的索引交集,最后通过Keylookup获得所有输出字段.而通常我们认为一个对一个表的查询不会用到多个索引。其实SQLServer 优化引擎是可以使用到多个索引的优势。
上面的测试给我们一种启示,有的时候不一定要通过一个宽索引列(多个索引键值)提高性能,也可以通过多个窄索引键提升性能。另外如果你发现索引没有覆盖到所以的查询条件,但是你又不能直接改索引时,添加另外一个索引也可以满足你的要求。
而索引联接是索引交集的一个变种,如果查询能够从索引中直接获得所需要的数据,就会称为Index join(上面我们看到数据还是需要Key Lookup中获取,Index无法提供所有的数据).
更多信息可以参考:
http://msdn.microsoft.com/zh-cn/library/ms188722(v=sql.105).aspx
http://msdn.microsoft.com/zh-cn/library/aa226170(v=sql.70).aspx