日期:2014-05-16 浏览次数:20429 次
今天针对手机号运营商归属进行一个统计,由于数据量较多(500万),用正则进行手机运营商的判断发现速度很慢,就做了一番分析比较,记录如下:
场景: t_mobile 表有500多万条记录,手机号码上有索引,需要统计出三个运营商的数量;
方法:
1:select count(*)
from t_mobile
where REGEXP_LIKE(mobile_no,'^(133|153|180|189)[0-9]{8}|1349[0-9]{7}$');
耗时:37.471秒,结果 176693
执行计划:
2:select count(*)
from t_driver
where substr(mobile_no, 1, 3) in ('133', '153', '180', '189')
or substr(mobile_no, 1, 4) = '1349'
耗时:4.356秒,结果 176693