日期:2014-05-16  浏览次数:20448 次

mysql处理百万级数据库常识(转载)

最近一段时间参与的项目要操作百万级数据量的数据,普通SQL查询效率呈直线下降,而且如果where中的查询条件较多时,其查询速度简直无法容忍。之前数据量小的时候,查询语句的好坏不会对执行时间有什么明显的影响,所以忽略了许多细节性的问题。

?

????经测试对一个包含400多万条记录的表执行一条件查询,其查询时间竟然高达40几秒,相信这么高的查询延时,任何用户都会抓狂。因此如何提高sql语句查询效率,显得十分重要。以下是结合网上流传比较广泛的几个查询语句优化方法:

?

??? 首先,数据量大的时候,应尽量避免全表扫描,应考虑在 where 及 order by 涉及的列上建立索引,建索引可以大大加快数据的检索速度。但是,有些情况索引是不会起效的:

?

1、应尽量避免在?where?子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。

?

2、应尽量避免在?where?子句中对字段进行?null?值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:
?????select id from t where num is null
?????可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:
?????select id from t where num=0

?

3、尽量避免在?where?子句中使用?or?来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:
?????select id from t where num=10 or num=20
?????可以这样查询:
?????select id from t where num=10
?????union all
?????select id from t where num=20

?

4、下面的查询也将导致全表扫描:

??? select id from t where name like ‘%abc%’

????若要提高效率,可以考虑全文检索。

?

5、in?和?not in?也要慎用,否则会导致全表扫描,如:
?????select id from t where num in(1,2,3)
?????对于连续的数值,能用?between?就不要用?in?了:
?????select id from t where num between 1 and 3

?

6、如果在?where?子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时;它必须在编译时进行选择。然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句将进行全表扫描:
?????select id from t where num=@num
?????可以改为强制查询使用索引:
?????select id from t with(index(索引名)) where num=@num

?

7、应尽量避免在?where?子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:
?????select id from t where num/2=100
?????应改为:
?????select id from t where num=100*2

?

8