html解析的正则表达式-C#教程-爱易网页

html解析的正则表达式

日期：2014-05-17　浏览次数：21005 次

html解析的正则表达式，求助
C#读取了一个网页，其中片段：
。。。。
<div>
<ul>
<dt>a</dt>
<dd>a1</dd>
<dt>b</dt>
<dd>b1</dd>
<dt>c</dt>
<dd>c1</dd>
</ul>
</div>
。。。
如何通过正则表达式，获取以下片段？
<dt>a</dt>
<dd>a1</dd>
<dt>b</dt>
<dd>b1</dd>

------解决方案--------------------
你有什么规则么我就随便写个了也许不是你想要的
<(dt
------解决方案--------------------
dd)>(a1?
------解决方案--------------------
b1?)</(dt
------解决方案--------------------
dd)>

------解决方案--------------------
(?i)<(d[td])>[^<>]+</\1>
------解决方案--------------------
(?s)(?<=<ul[^>]*>)(?:\s*<dt\b[^>]*>(?:(?!</dd\b).)*</dd>\s*){2}

------解决方案--------------------
string str="字符串";
str = Regex.Match(str, @"(?is)(?<=<ul>)(\s*<(\w+)[^>]*>.*?</\2>){1,4}").Value;

------解决方案--------------------

引用:

html解析的正则表达式

html解析就是html解析，不要扯上“正则”。

你可以搜索一下“.net平台html解析工具”，看看都有什么解析html的软件包可以在编程中调用。

反之，如果你是问正则表达式，那么就不要说什么“html解析”了。只是匹配简单的字母，跟进行正确的语法分析从而得到html elements树相比，实在是“泥土与陶瓷”的区别。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

，SQL语句稍微有些复杂的查询谢了谢了，

疑难有关问题~ 请高手指教

HiddenField的ValueChanged事件没有触发？解决办法

，循环内部定义的变量会影响到外部，这是咋回事

哪位高手能帮帮小弟我，高难度的正则表达式

放GIF图片，怎么只将它播放1次

C#高性能大容量SOCKET并发（4）：缓存设计

问个简单有关问题。

2003系统死循环出现了,超时,是什么有关问题?100分另外开帖送.已经问了三次了都没人回答

html解析的正则表达式

相关资料更多>

推荐阅读更多>