日期:2014-05-17  浏览次数:20662 次

asp.net用正则表达式取<td>里面<span>标签的值
如:

string str = @"<table id=""tableId"">

  <tr><td><span>2</span>期</td></tr>

  <tr><td ><span>第一期</span><span>第二期</span><span>第三期</span><span>第四期</span><span>第五期</span><span>第六期</span><span>第七期</span></td></tr>

  <tr><td><label>时间: 2012-09-16 21:30</label></td></tr></table>";



我现在只会取到<td>里面的值,把<span>标签也给取出来了。这样实现的:

Regex reg = new Regex(@"(?is)<table[^>]*?id=""tableId""[^>]*?>(?:\s*<tr>(?:\s*<td[^>]*?>(.*?)</td>){1}\s*</tr>)*\s*</table>");

  foreach (Capture c in reg.Match(strHtml).Groups[1].Captures)

  {

  result += c.Value + "|";

  }

而我想得到<span>里面的值(取值的时候不带<span>标记,直接取里面的值),请问如何写正则表达式,谢谢!


------解决方案--------------------
C# code
string strHtml = @"<table id=""tableId"">

  <tr><td><span>2</span>期</td></tr>

  <tr><td ><span>第一期</span><span>第二期</span><span>第三期</span><span>第四期</span><span>第五期</span><span>第六期</span><span>第七期</span></td></tr>

  <tr><td><label>时间: 2012-09-16 21:30</label></td></tr></table>";

            string result=string.Empty;
            

            string pattern = @"(?i)(?<=<table[^>]*?id=['""]?tableId['""]?[^>]*?>(?:(?!</?table>)[\s\S])*?<span>)[^<>]+?(?=</span>)";

            result = string.Join("|", Regex.Matches(strHtml,pattern).Cast<Match>().Select(a=>a.Value));
            //2|第一期|第二期|第三期|第四期|第五期|第六期|第七期