日期:2014-05-18  浏览次数:20671 次

关于用正则匹配HTML指定的内容
<tbody><tr>
  <td align="right"> 2012-05-04&nbsp;&nbsp;&nbsp;17:29:00
  </td>
  <td class="middle_border">丽水市莲都区速递物流分公司莲都揽投部</td><td>
  </td>
  </tr>
  <tr>
  <td class="backcolor" align="right">2012-05-04&nbsp;&nbsp;&nbsp;18:44:43
  </td>
  <td class="backcolor middle_border" align="center">丽水市
  </td>
  <td class="backcolor" align="center">

 请问下如何用正则匹配出里面的表的信息 2012-05-04 17:29:00
丽水市莲都区速递物流分公司莲都揽投部
  2012-05-04 18:44:43
  丽水市

------解决方案--------------------
探讨

(?is)(?<=<td[^>]*?>).*?(?=</td>)

取m.Value

------解决方案--------------------
C# code
string tempStr = File.ReadAllText(@"C:\Users\M\Desktop\Test.txt", Encoding.GetEncoding("GB2312"));


            string pattern = @"(?<=<tbody>[\s\S]*?<tr>[\s\S]*?<td[^>]*?>\s*)((?!</td>)[^\s])+";

            foreach (Match m in Regex.Matches(tempStr, pattern))
            {
                string result = m.Value;//循环输出 


            }