日期:2014-05-17  浏览次数:20520 次

跪求asp.net截取网站指定div标签内容的思想和基本算法代码
RT:如果我想用asp.net抓取某个新闻网站的的新闻内容,读取到该条新闻的网页源码,怎么才能取出这个新闻详细页源码中的新闻内容,求思想和算法先谢谢了
------最佳解决方案--------------------
抓取他的网页啊。看看里面有没有特定的标记,然后分析这个标记就好了。
------其他解决方案--------------------
用WebClient之类的发送请求,然后返回http响应,你可以拿到一个string,然后剩下就是在这个string里,想办法用正则取出特定的内容了。你先看一下MSDN里WebClient,再看一下正则
------其他解决方案--------------------
至于正则表达式的写法,具体你可以看下这个http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx
------其他解决方案--------------------
一般用正则截取
------其他解决方案--------------------
观察他源码里面那些标记的规律,然后做正则尝试匹配,然后分一下组取出来就好了
------其他解决方案--------------------
引用:
观察他源码里面那些标记的规律,然后做正则尝试匹配,然后分一下组取出来就好了
能不能具体点呢??
------其他解决方案--------------------
引用:
引用:观察他源码里面那些标记的规律,然后做正则尝试匹配,然后分一下组取出来就好了能不能具体点呢??

你自己就提供了这点信息,你让人家怎么给你具体。。。。