C#抓取网页中含有特定字符串的链接解决办法-C#教程-爱易网页

C#抓取网页中含有特定字符串的链接解决办法

日期：2014-05-17　浏览次数：21323 次

C#抓取网页中含有特定字符串的链接
如题

如腾讯NBA页面http://sports.qq.com/nba/
我要获取该页面所有含有“/a/201301”的链接地址，存储到c:/sport_url.txt

请问如何实现

------解决方案--------------------
用正则表达式

------解决方案--------------------

引用:

引用:用正则表达式
正则得写死吧？
我要想实现的是给用户一个text输入框，用户可以自定义这个字符串，然后爬取含有此字符串的所有链接。

拼接正则表达式
------解决方案--------------------
  string url = "http://sports.qq.com/nba/";
            string html = GetHtml(url, Encoding.GetEncoding("gb2312"));
            string str = "/a/201301";
            string pattern = @"(?is)(?<=<a[^>]*?href=[""'])[^""']*?" + str + @"[^""']*[""'](?=[^>]*>)";
            var ary = Regex.Matches(html, pattern).OfType<Match>().Select(t => t.Value).ToArray();

------解决方案--------------------
还是正则比较方便
------解决方案--------------------
先匹配出所有连接地址，然后IndexOf，如果用户输入的有些字符不太规范的话，拼接正则有可能会出现错误的表达式额~
------解决方案--------------------
应该用正则表达式

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

有关字符窜的截取有关问题

Ｃ＃　Textbox在获取焦点时怎么显示说明

怎么防止小弟我的窗口被最小化

imagebutton按钮如何实现返回功能

从xml文件读取值并绑定多个控件，控件互相干扰的有关问题

C#做报表，报表这块才学不久，不太懂！有做过的都来给上意见

vs2005获取数据库表中获取到一个信息解决方案

LINQ to SQL Debug Visualizer,该怎么处理

小妹求教！DataTable里应用SQL语句！解决方案

C#抓取网页中含有特定字符串的链接解决办法

相关资料更多>

推荐阅读更多>