100分求最优算法根据地址反查行政区代码 (面试题之一.)解决思路-C#教程-爱易网页

100分求最优算法根据地址反查行政区代码 (面试题之一.)解决思路

日期：2014-05-18　浏览次数：21321 次

100分求最优算法根据地址反查行政区代码 (面试题之一.)
110000 北京市
110100 北京市市辖区
110101 北京市东城区
110102 北京市西城区
110103 北京市崇文区
110104 北京市宣武区
110105 北京市朝阳区
110106 北京市丰台区
110107 北京市石景山区
110108 北京市海淀区
110109 北京市门头沟区
110111 北京市房山区
110112 北京市通州区
....略
120000 天津市
120100 天津市市辖区
120101 天津市和平区
120221 天津市宁河县
120223 天津市静海县
120225 天津市蓟县
130000 河北省
130100 河北省石家庄市
130101 河北省石家庄市市辖区
....
130107 河北省石家庄市井陉矿区
130108 河北省石家庄市裕华区
130121 河北省井陉县
.....
==========================
大概4000多行
以上是地址行政区代码文件

要求用 C# Framework 2.0
根据客户提供的地址找到行政区编码

例地址：北京市朝阳区南湖南路15号院甲1号应返回 110105

要求效率最高的一种方法

行政区文件可以导入数据库也可以导成 XML 或者就普通文本

请大家支个招...

------解决方案--------------------
生成树.

然后把地址拆分试探.
------解决方案--------------------
Dictionary<string, string> dict = new Dictionary<string, string>();

var ret = from kp in dict where "北京市朝阳区南湖南路15号院甲1号".IndexOf(kp.Key)> 0 select kp;

效率不是最高但代码最少的方法
------解决方案--------------------
假设是查行政区代码的话，那么就从左向右查是最快的。比如只要是有“北”开头的行政区，那么就不可能再去考虑从“京”这个字以后的任何字符开始查找了。而从“北”开头的行政区中有几个与这个字符串相匹配，实际上很容易找到，你保留字符最多的一个行政区作为结果就行了。

这有一个数据结构的问题，就是假设先把4000行数据创建为单字的“倒排序”全文检索索引树，那么就可以非常快地搜索到。

------解决方案--------------------
在数据库中 select top 1 code
from mytable
where '北京市朝阳区南湖南路15号院甲1号'
like name +"%"
order by name desc
------解决方案--------------------
楼主,把这些放在数据库中处理吧,别说4000条数据,
我做了个测试,七百万条数据(大小400兆),不需要任何索引,1秒钟之内搞定:
(这个sql算法如果再稍加优化,还能应付上亿级的数据)

SQL code

--比如说:Create table t2(Code1 CHAR(6),Code2 NVARCHAR(50);
DECLARE @se NVARCHAR(100);
SET @se=N'北京市朝阳区南湖南路15号院甲1号';
SELECT * FROM(
    SELECT * FROM t2
    WHERE left(Code2,3)= LEFT(@se,3)) t
WHERE Code2=left(@se,len(Code2));

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

100分求最优算法根据地址反查行政区代码 (面试题之一.)解决思路

相关资料更多>

推荐阅读更多>

100分 求最优算法根据地址反查行政区代码 (面试题之一.)解决思路

相关资料更多>

推荐阅读更多>

100分求最优算法根据地址反查行政区代码 (面试题之一.)解决思路