如何采集名索网数据
http://www.mingsuo.com/MainPage/ListPage/SearchList_Company.aspx?keyword=%u5929%u6D25%u5E02%u84DF%u53BF%u9876%u91D1%u670D%u88C5%u5E97
这个查询结果是:
天津市蓟县顶金服装店
注册号: 120225600009964
法定代表人: 赵秀珍
企业类型: 个体 开业
住址类型: 马伸桥镇大街
经营范围: 服装、鞋;零售。
我想采集这个网页中的“企业类型: 个体 开业”这个内容,请问如何采集下来?
难点:采集一般是根据网页的源代码,但查看这个页面的源代码,并未发现有“企业类型: 个体 开业”这几个字。
请高手帮忙,谢谢。
------解决方案--------------------
应该是用AJAX取回数据来的
要分析是怎么用AJAX请求的
------解决方案--------------------
自己写正则 爬去网页
还有httpClient 开源的 你可以研究下