日期:2014-05-18  浏览次数:20990 次

正则表达式无法正确匹配html内容,是怎么回事
System.Net.WebClient wc = new WebClient();
string url = "http://search.china.alibaba.com/selloffer/offer_search.htm?keywords=%B1%E4%CB%D9%CF%E4&n=y"
  Byte[] pageData = wc.DownloadData(url);
  string webHtml = Encoding.GetEncoding("gb2312").GetString(pageData); 
  richTextBox2.Text = webHtml;
  Regex memberidRegex = new Regex("\bmemberid\b", RegexOptions.None);
  MatchCollection mc = memberidRegex.Matches(webHtml);
  int count = mc.Count;
  MessageBox.Show(count.ToString());

我利用上面抓取网页,分析里面的内容,利用正则表达式匹配“memberid”无结果。

该页面中有很多memberid,匹配结果 count 为0 是怎么回事

我利用正则表达式软件检查 能通过,能查找出memberid相关数据。


各位大侠是怎么回事??

------解决方案--------------------
new Regex(@"\bmemberid\b", RegexOptions.None);