.net采集技术
我要在各个论坛上采集学习信息,得分了的才采集,因为各个论坛的布局不一致,希望高手出来提个方案,让我尽量方便点,主要是标题很难判断
------解决方案--------------------这个得自己写正则。。。。。。。。
------解决方案--------------------不同网站的标题设置的不一样,规则也不一样。
------解决方案--------------------
------解决方案--------------------[Quote=引用:]
那太麻烦了 有没普及点的方法
[/Quote]
没有
------解决方案--------------------写不同的正则规则
webclient
------解决方案--------------------只能自己去尽量封装了~~
------解决方案--------------------
------解决方案--------------------这个没办法吧,都没共同规律,只能自己具体网站具体分析了吧
------解决方案--------------------学习
------解决方案--------------------每个人的布局,命名都有自己的风格!
所以只能针对你要采集的网页进行分析然后用正则匹配!
------解决方案--------------------好像,只能针对每个网站的结构自己去写正则表达式,应该没有通用的
------解决方案--------------------留个脚印!