日期:2014-05-16  浏览次数:20522 次

这种正则表达式怎么写?求高手解答!
有一个网页中的代码如下:

<span class="1">
      <h3 class="title">testtesttesttesttesttestt</h3>
      <div class="con">
            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>
      </div>
</span>
<div class="2">
      <h3 class="title">testtesttesttesttesttestt</h3>
      <div class="con">
            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>
      </div>
</div>
<div class="3">
      <h3 class="title">testtesttesttesttesttestt</h3>
      <div class="con">
            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>
      </div>
</div>
<span class="4">
      <h3 class="title">testtesttesttesttesttestt</h3>
      <div class="con">
            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>
      </div>
</span>
...

大家注意到没有 class="1",class="2",class="3",...是有规律的,但是前面的标签没有规律,有时是span,有时是div,我想要的是用php如何写正则表达式获取class="1",class="2",class="3",...的内容,正则表达式这方面学的不好,试了半天都写不出来,求高手解答!

------解决方案--------------------
html或xml的东西有专门的dom api,特别是标签嵌套的html,尽量不要尝试用正则去获取,尤其是php的正则,这里涉及到正则的递归,即使php能有象其它语言提供的正则平衡组,也最好不要用。
------解决方案--------------------
<(span
------解决方案--------------------
div)\s+class=\"\d\">\s+<h3\s+class=\"title\">(.*?)<\/h3>\s+<div\s+class=\"con\">\s*(.*?)\s*<\/div>\s*<\/(span
------解决方案--------------------
div)>