日期:2014-05-17  浏览次数:20979 次

动态获取网页上面的所有数据(C#)
大家帮个忙吧
这个网址:http://ent.qq.com/star/shouye2012/gangtai.htm我想要获取到所有分页的数据,现在我已经能够获取当前页上面的数据了其他页面的怎么获取呀...
这个网站有多少页怎么获取呀?因为这个网站上面每天都会更新数据,页数在不断变化,我想动态获取它有多少页,怎么获取呀?是使用正则表达式吗?
行业数据 C# 正则表达式 分页

------解决方案--------------------
能不用自己的程序情况下采集直接用火车头之类的,也方便,自己写累人不~
------解决方案--------------------
动态地址
http://ent.qq.com/c/gtxw_{page}.htm
------解决方案--------------------
引用:
动态地址
http://ent.qq.com/c/gtxw_{page}.htm


获取一次 地址,在获取的html字符串中 找到
<script type="text/javascript">
var getString = new SplitPages('getString','pageZone');
getString.pageCount = 50;//这个是总页数啊
getString.Output(); 
</script>
------解决方案--------------------
你 网页下一页的时候在执行你获取数据的那个方法呗
------解决方案--------------------
干脆外包给我做吧。
威客-冷盖天QQ:1518289692
------解决方案--------------------
var getString = new SplitPages('getString','pageZone');
getString.pageCount = 50; //总页数
getString.Output(); 

每一页它是用ajax请求的,请求地址:

http://ent.qq.com/c/gtxw_1.htm?0.5782192110404865

gtxw_1.html 中的1就是页数,循环抓取即可。


------解决方案--------------------
辛苦费还是要的。
到时候源码给你,你可以学得很多东西。