如何提取网页中的数字?
本帖最后由 chzbv1984 于 2013-04-25 17:03:46 编辑
下面这段字符串是网页中一部分,<span class="pl">季数:<a href="http://movie.douban.com/subject/3401355/reviews">更多评论(共109条)</a>
dfs<a href="http://movie.douban.com/subject/6973376/reviews">
共
<span property="v:count">109</span>
条
</a><a href="http://movie.douban.com/subject/6537486/reviews">全部 109 条</a>,如何使用正则表达式提取出109三个数字,$p_search='/<a href="(.*?)\/reviews">(.*)(\S*)|(\d+).*<\/a>/';这个有什么错误?
------解决方案--------------------$s='<span class="pl">季数:<a href="http://movie.douban.com/subject/3401355/reviews">更多评论(共109条)</a>
dfs<a href="http://movie.douban.com/subject/6973376/reviews">
共
<span property="v:count">109</span>
条
</a><a href="http://movie.douban.com/subject/6537486/reviews">全部 109 条</a>';
$p_search='#(\d+)(</span>)?\s*条#s';
preg_match_all($p_search,$s,$m);
print_r($m[1]);
Array
(
[0] => 109
[1] => 109
[2] => 109
)