.Net采集正则有关问题？-C#教程-爱易网页

.Net采集正则有关问题？

日期：2014-05-18　浏览次数：20928 次

.Net采集正则问题？急
<table class="ProductSubDetailsText" border="0" cellpadding="10" style="width: 530px; ">
<tr align="left" >
<td class="ProductSubDetailsHead" valign="bottom" style="height:25px;">产品介绍</td>
</tr>
<tr>
<td align="left"><ul>
<li>消除细菌引起的恼人气味</li>
<li>持久保持肌肤光滑</li>
<li>适用於运动後或出汗後不便洗澡的尴尬情况</li>
<li>具怡人的玫瑰气味</li>
</ul></td>
</tr>
</table>

我现在要取出：
消除细菌引起的恼人气味
持久保持肌肤光滑
适用於运动後或出汗後不便洗澡的尴尬情况
具怡人的玫瑰气味

string Productinfo = GetRegValue("<td align=\"left\"><ul>(.*)</ul></td>", jg1);

一直取不到数据，不知道正则错在那里了?

------解决方案--------------------

C# code

string Productinfo = GetRegValue("<td align=\"left\">\s*<ul>(\s*<li>([^<]*)</li>\s*)*</ul></td>", jg1);

------解决方案--------------------
"<td align=\"left\"><ul>(.*)</ul></td>"

=》

"<td align=\"left\"><ul>([\s\S]*?)</ul></td>"


------解决方案--------------------
为什么要用正则？为什么不通过HTML DOM解析获取？

------解决方案--------------------
'.'的话需要指定单行模式，可以在正则表达式开头附加"(?s)"子串指定单行模式。

------解决方案--------------------
 List<string> list = new List<string>();
Regex reg = new Regex("<(?<tag>li)[^>]*.*?>(?<content>.*?)</\k<tag>>
", RegexOptions.IgnoreCase | RegexOptions.Singleline);
           MatchCollection mc = reg.Matches(html);
           if (mc.Count > 0)
           {
               foreach (Match m in mc)
               {
                   list.Add(m.Groups["content"].Value);
               }
               return list.ToArray();
           }

------解决方案--------------------
我个人认为，关于处理 XML 的地方，如果不涉及到非常特殊的数据，能用 Linq To XML 就用 Linq To XML。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

.Net采集正则有关问题？

相关资料更多>

推荐阅读更多>