大量IP数据比对，用什么方法效率高呢？解决方法-MSSQL教程-爱易网页

大量IP数据比对，用什么方法效率高呢？解决方法

日期：2014-05-18　浏览次数：20506 次

大量IP数据比对，用什么方法效率高呢？
主要是要比对拿到的IP数据之间，比如国家，经纬度之类的信息是否一致，不一样则取多数为正确值。

有的数据是这样记录的：

第一个文件：
startIpNum endIpNum locId
16777216 16777471 17
第二个文件：
locId country region city postalCode latitude longitude metroCode areaCode
1 O1 0 0
2 AP 35 105
这样

有的是
IPNUM city latitude longitude
23986432 Milano 45.45 9.16667
16843008 Sexau 48.1 7.9167
26778880 Marseille 43.3 5.4
33523968 Milan 45.45 9.16667
这样

即有按段的也有按单个IP的。
我把它们都导入到了SQL SERVER里，然后
SELECT A.startIpNum,A.endIpNum,B.startIpNum,B.endIpNum,A.country,B.country
FROM A INNER JOIN a ON A.locId=a.locId,IPligence
WHERE B.startIpNum>=A.startIpNum
AND B.endIpNum<=A.endIpNum
AND a.country != B.country;

（因为A数据有两部分，一部分是IP段，另一部分是实际地理数据，所以又用到了a即地理数据）
也就是单就A的段包含B的情况，判断国家不一样的拿出来，然后跑了蛮久没结果。

数据库是我这个学期才学的，有学长建议我直接用语言文本处理的方式比对，灵活、效率可控。但是我觉得这么大量的数据应该可以用数据库吧？
只是简单的这么写查询语句似乎不太实际，是否有优化方法呢？
其实IP都是从小到大的，比对不需要从都到尾都找一遍。但是我不知道怎么写。用程序语言文本处理我也想不太明白怎么写比较可行。

------解决方案--------------------

SQL code

--连接不是这样写的.
--试试:
select t1.startIpNum,t1.endIpNum,t2.startIpNum,t2.endIpNum,t1.country,t2.country
from a t1 inner join a t2 on t1.locid=t2.locid
where t1.startipnum>=t1.startipnum
and t1.endipnum<=t2.endipnum
and t1.country<>t2.country

------解决方案--------------------

SQL code
-- 假设总共有3个表:tab1,tab2,tab3

with t as
(select * from tab1 union all
 select * from tab2 union all
 select * from tab3
) 
select * 
from t a
inner join t b 
on (a.起始IP between b.起始IP and b.终止IP
or a.终止IP between b.起始IP and b.终止IP
or b.起始IP between a.起始IP and a.终止IP
or b.终止IP between a.起始IP and a.终止IP)
and a.国家代码<>b.国家代码

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

大量IP数据比对，用什么方法效率高呢？解决方法

相关资料更多>

推荐阅读更多>