日期:2014-05-17  浏览次数:20882 次

求助,c#正则,获取所有HTML标签
如题,我想以@"<(?<tagName>[a-z]+).+?</\k<tagName>>"读取HTML页中的所有标签,然后有选择的删除或替换,可是测试发现对标签跨行的情况下,找不到结果,RegexOptions.Multiline选项也己经使用了。
二三年没做过开发了,最近又拾起来,好多知识都忘了。

------解决方案--------------------
接分~~
------解决方案--------------------
一般用正则解析html文档,都要开启单行模式、忽略大小写模式。
@"(?is)<(?<tagName>[a-z]+).+?</\k<tagName>>"

(?is)这种内联的写法比较简单,i就是忽略大小写、s就是单行模式。这样写你就无需设置那个枚举参数了。