日期:2014-05-17  浏览次数:20485 次

如何提取网页中的数字?
本帖最后由 chzbv1984 于 2013-04-25 17:03:46 编辑
下面这段字符串是网页中一部分,<span class="pl">季数:<a href="http://movie.douban.com/subject/3401355/reviews">更多评论(共109条)</a>
        dfs<a href="http://movie.douban.com/subject/6973376/reviews">

<span property="v:count">109</span>

</a><a href="http://movie.douban.com/subject/6537486/reviews">全部 109 条</a>,如何使用正则表达式提取出109三个数字,$p_search='/<a href="(.*?)\/reviews">(.*)(\S*)|(\d+).*<\/a>/';这个有什么错误?

------解决方案--------------------
$s='<span class="pl">季数:<a href="http://movie.douban.com/subject/3401355/reviews">更多评论(共109条)</a>
        dfs<a href="http://movie.douban.com/subject/6973376/reviews">

<span property="v:count">109</span>

</a><a href="http://movie.douban.com/subject/6537486/reviews">全部 109 条</a>';
$p_search='#(\d+)(</span>)?\s*条#s';
preg_match_all($p_search,$s,$m);
print_r($m[1]);

Array
(
    [0] => 109
    [1] => 109
    [2] => 109
)