日期:2014-05-17  浏览次数:20543 次

.net抓取网页内容回来怎么用正则匹配出来
.net抓取网页内容回来怎么用正则匹配出来 内容抓回来了 我需要用正则怎么匹配出来里面的内容 求大神

主要代码如下:
try
            {
                HttpWebRequest request = (HttpWebRequest)WebRequest.Create(Capture);
                //HttpWebRequest请求
                request.Headers.Set("Pragma", "no-cache");

                HttpWebResponse response = (HttpWebResponse)request.GetResponse();

                Stream streamReceive = response.GetResponseStream();

                Encoding encoding = Encoding.GetEncoding("GB2312");
                //StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); 

                StreamReader streamReader = new StreamReader(streamReceive, encoding);

                strResult = streamReader.ReadToEnd(); //strResult是抓取出来的源代码 我需要匹配

            }
                
            catch
            {

            }
            return;

------解决方案--------------------
http://zhoufoxcn.blog.51cto.com/792419/595344
------解决方案--------------------
引用:
引用:问题是你抓取回来的内容是什么,匹配结果又是什么例如一则新闻 把标题 和内容匹配出来

你贴点html示例和需要的结果嘛~
------解决方案--------------------
引用:
引用:string str = GetHtml("http://news.sina.com.cn/c/2013-01-22/051926089895.shtml", Encoding.GetEncoding("gb2312"));
            Match m = Regex.Match(str, @"(?is)<h1[^>]*……


Regex需要using System.Text.RegularExpressions;