日期:2014-05-17  浏览次数:20671 次

谁帮改个正则?
这是要匹配的内容:

 

<dl>
<dt>2013</dt>
<dd>row1</dd>
<dd>row2</dd>
<dd>row3</dd>
</dl>
<dl>
<dt>2014</dt>
<dd>row1</dd>
<dd>row2</dd>
</dl>


要匹配dl,并且匹配dl下的dt,和所有的dd,

我是这样写的:

<dl>\s+<dt>(.*?)</dt>(\s+<dd>(.*?)</dd>\s+)*?</dl>


但是这个匹配出的结果不太对,dd始终只匹配到了最后一个。这个表达式应该怎么修改呢?
正则

------解决方案--------------------
分开匹配吧,dl 匹配一次,里面的dt和dd再匹配一次。
------解决方案--------------------
变通一下(待匹配的项数不定,形式语言基本无法实现)
preg_match_all('#<(d[dt])>\s*([^<]+)</\\1>#is', $s, $r);
print_r($r);
Array
(
    [0] => Array
        (
            [0] => <dt>2013</dt>
            [1] => <dd>row1</dd>
            [2] => <dd>row2</dd>
            [3] => <dd>row3</dd>
            [4] => <dt>2014</dt>
            [5] => <dd>row1</dd>
            [6] => <dd>row2</dd>
        )

    [1] => Array
        (
            [0] => dt
            [1] => dd
            [2] => dd
            [3] => dd