日期:2014-05-19  浏览次数:20925 次

求一正则表达式的改进
现有一读取标签 <bt> 中内容的正则表达式.
MatchCollection   mc   =   Regex.Matches(str,   @ " <td[^> ]*> \s*(? <content> [\s\S]*?)[\s]* </td> ",   RegexOptions.IgnoreCase)
可以取出 <td> 中的内容,但是此内容的最后面有不需要的字符串&nbsp;   不知道能否过滤掉.

我的解决方法有点问题
  @ " <td[^> ]*> \s*(? <content> [\s\S]*?)[\s&nbsp;]* </td> ".这样的话有的时候就过滤掉了一些有用的单个字符比如N,S或者B.

请达人指点,谢谢!

------解决方案--------------------
呵呵,先替換了再提取嘛。