日期:2014-05-18  浏览次数:20592 次

.net采集技术
我要在各个论坛上采集学习信息,得分了的才采集,因为各个论坛的布局不一致,希望高手出来提个方案,让我尽量方便点,主要是标题很难判断

------解决方案--------------------
这个得自己写正则。。。。。。。。
------解决方案--------------------
不同网站的标题设置的不一样,规则也不一样。
------解决方案--------------------
探讨

不同网站的标题设置的不一样,规则也不一样。

------解决方案--------------------
[Quote=引用:]

那太麻烦了 有没普及点的方法
[/Quote]
没有
------解决方案--------------------
写不同的正则规则
webclient
------解决方案--------------------
只能自己去尽量封装了~~
------解决方案--------------------
探讨
那太麻烦了 有没普及点的方法

------解决方案--------------------
这个没办法吧,都没共同规律,只能自己具体网站具体分析了吧
------解决方案--------------------
学习
------解决方案--------------------
每个人的布局,命名都有自己的风格!
所以只能针对你要采集的网页进行分析然后用正则匹配!
------解决方案--------------------
好像,只能针对每个网站的结构自己去写正则表达式,应该没有通用的
------解决方案--------------------
留个脚印!