小弟我抓取网页内容如何把不符合要求的也给抓出来了？正则式有有关问题-C#教程-爱易网页

小弟我抓取网页内容如何把不符合要求的也给抓出来了？正则式有有关问题

日期：2014-05-17　浏览次数：21376 次

我抓取网页内容怎么把不符合要求的也给抓出来了？正则式有问题？
我想取得一些双色球开奖的数据想在"http://trend.baidu.lehecai.com/ssqZst!ssqjbzs.jhtml?flag=jbzs 这个网页中抓取一些数据 :
<td style="background-color: #FEFFEF;" class="chartBall01 ">06</td> //红球数据
<td style="background-color: #EEF5FD;" class="chartBall02 ">01</td> //篮球数据
经分析主要应该是 class 的不同可是我写的程序竟然把：<td class="yl01" style="background-color: #FEFFEF;">3</td>
也抓取下来了！不知道是哪出了问题我的代码如下：或者谁有更简便的获取开奖数据的方法？

C# code



    class Program
    {
        static string url = "http://trend.baidu.lehecai.com/ssqZst!ssqjbzs.jhtml?flag=jbzs";
        static void Main(string[] args)
        {
            WebClient wc = new WebClient();
            wc.Encoding = Encoding.UTF8;
            string s = wc.DownloadString(url);
            //Console.Write(s);
            //<td style="background-color: #FEFFEF;" class="chartBall01 ">06</td>
            //<td style="background-color: #EEF5FD;" class="chartBall02 ">01</td>
            s = s.Replace("\r", " ").Replace("\n", " ");
            MatchCollection matches = Regex.Matches(s, "<td(.*?)class=\"chartBall01 \"(.*?)>(\\d+)</td>", RegexOptions.IgnoreCase | RegexOptions.Multiline);
            List<string> list = new List<string>();
            for (int i = 0; i < matches.Count; i++)
            {
                Match match = matches[i];
                Console.WriteLine(match.Value);
            }

       
            Console.ReadKey();
        }
}

------解决方案--------------------

C# code

MatchCollection matches = Regex.Matches(s, "<td([^>]*?)class=\"chartBall01 \"(.*?)>(\\d+)</td>", RegexOptions.IgnoreCase | RegexOptions.Multiline);

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

小弟我抓取网页内容如何把不符合要求的也给抓出来了？正则式有有关问题

相关资料更多>

推荐阅读更多>

小弟我抓取网页内容 如何把不符合要求的也给抓出来了？正则式有有关问题

相关资料更多>

推荐阅读更多>

小弟我抓取网页内容如何把不符合要求的也给抓出来了？正则式有有关问题