日期:2014-05-17  浏览次数:20690 次

asp.net 正则表达式 问题!
HTML code

  <div class="layAB">
<ul class="list" id="list">
<li>
<i class="tit"><em class="date">2012-07-10</em><a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117318.html">孕期进补有度 注意5个进补误区</a></i>
<i class="des">对准妈妈来说,怀孕之后是一个人吃两个人的饭,这是身为母亲甜蜜的负担。不少家庭条件很不错,因此也不想亏待肚子里的宝宝,因此,天天营养品、补药三餐从不间断,但孕……<a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117318.html">查看全文>></a></i>
<i class="pic"><a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117318.html" target="_blank"><img src="http://img0.pcbaby.com.cn/pcbaby/1207/09/1117318_45286969.jpg" alt="孕期进补不是越多越好"></a></i>
<i class="keyword"><a href="http://www.pcbaby.com.cn/qzbd/hyshbk/1205/1105581.html" target="_blank">怀孕注意事项</a>&nbsp;<a rel="nofollow" href="http://ks.pcbaby.com.cn/?q=孕期进补" target="_blank">孕期进补</a>&nbsp;<a href="http://www.pcbaby.com.cn/tlist/1494.html" target="_blank">孕期营养</a>&nbsp;<a href="http://www.pcbaby.com.cn/qzbd/hysjd/hy12week/" target="_blank">怀孕12周</a>&nbsp;</i>
</li>
<li>
<i class="tit"><em class="date">2012-07-10</em><a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117208.html">从头到脚 轻松解决孕期小麻烦</a></i>
<i class="des">怀孕期间,孕妈的身体会发生许多的变化,比如肚子增大、乳房会变得更加敏感、手脚浮肿、视力下降等等,这些小麻烦总是不合时宜地冒出来影响准妈咪的心情。本篇小编为您……<a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117208.html">查看全文>></a></i>
<i class="pic"><a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117208.html" target="_blank"><img src="http://img0.pcbaby.com.cn/pcbaby/1207/09/1117208_5236869.jpg" alt="孕妈头部的小麻烦"></a></i>
<i class="keyword"><a rel="nofollow" href="http://ks.pcbaby.com.cn/?q=孕妇头晕" target="_blank">孕妇头晕</a>&nbsp;<a rel="nofollow" href="http://ks.pcbaby.com.cn/?q=孕期牙龈出血" target="_blank">孕期牙龈出血</a>&nbsp;<a href="http://www.pcbaby.com.cn/qzbd/hyjbbk/1008/951817.html" target="_blank">孕早期浮肿</a>&nbsp;<a href="http://www.pcbaby.com.cn/qzbd/hysjd/hy12week/" target="_blank">怀孕12周</a>&nbsp;</i>
</li>
</ul>
</div>




我想通过正则表达式获取这一句
<i class="tit"><em class="date">2012-07-10</em><a href="http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117318.html">孕期进补有度 注意5个进补误区</a></i>

只要 a标签里面的 href值 和 标签内的值
条件是 <i class="tit"> 需要的值是 http://huaiyun.pcbaby.com.cn/yunqi/baojian/1207/1117318.html 和 孕期进补有度 注意5个进补误区

这一句能获取 i标签下面的所有内容 但是我只需要 a标签的 href值 和 标签内的值
<i class="tit"[^>]*>(?<text>.+?)</i>

那位大哥帮忙改下!谢谢了。




------解决方案--------------------
C# code

            System.IO.StreamReader reader = new System.IO.StreamReader("e:\\1.txt",System.Text.Encoding.Default);
            string str = reader.ReadToEnd();
            Regex reg = new Regex(@"(?is)(?<=<i class=""tit"">)[\s\S]*?href=""([\s\S]*?)"">([\s\S]*?)(?=</a></i>)");
            Match m = reg.Match(str);
            MessageBox.Sh