日期:2014-05-20  浏览次数:20769 次

正则获取<div>间的数据
现在抓取到页面信息,需要只获取到想要的div元素和li元素间的天气信息数据,
<div class="weather_div" style="margin: 8px 2px;">
  <div class="name">06月01日<br>星期五</div>
<div class="weather">
<ul class="ui_top">
<li class="day">白天</li>
<li class="icon"><div class="spritesweather" id="d04"></div></li>
<li class="temp font_high">高温26℃</li>
<li class="weather_desc">雷阵雨</li>
<li class="wind">微风</li>
</ul>
<ul class="ui_bottom">
<li class="day">夜晚</li>
<li class="icon"><div class="spritesweather" id="n04"></div></li>
<li class="temp">低温15℃</li>
<li class="weather_desc">雷阵雨</li>
<li class="wind">微风</li>
</ul>
  </div>
</div>
请问这个正则该怎么写呢?

------解决方案--------------------
那先问一句,什么叫想要的,总要有个规则吧
------解决方案--------------------
(?is)<div\sclass="weather_div"[^>]*>(?><div[^>]*>(?<o>)|</div>(?<-o>)|(?:(?!</?div\b).)*)*(?(o)(?!))</div>