日期:2014-05-17  浏览次数:20800 次

如何采集名索网数据
http://www.mingsuo.com/MainPage/ListPage/SearchList_Company.aspx?keyword=%u5929%u6D25%u5E02%u84DF%u53BF%u9876%u91D1%u670D%u88C5%u5E97
这个查询结果是:
天津市蓟县顶金服装店
注册号: 120225600009964 
法定代表人: 赵秀珍 
企业类型: 个体 开业 
住址类型: 马伸桥镇大街 
经营范围: 服装、鞋;零售。 

我想采集这个网页中的“企业类型: 个体 开业”这个内容,请问如何采集下来?
难点:采集一般是根据网页的源代码,但查看这个页面的源代码,并未发现有“企业类型: 个体 开业”这几个字。

请高手帮忙,谢谢。

------解决方案--------------------
应该是用AJAX取回数据来的

要分析是怎么用AJAX请求的
------解决方案--------------------
自己写正则 爬去网页
还有httpClient 开源的 你可以研究下