日期:2014-05-17  浏览次数:20527 次

求一正则表达式, 谢谢
本帖最后由 phpisshow 于 2013-03-29 15:23:27 编辑

<body>

<a href="/news/news-list.php?id=5">标题名称</a>

<a 
href="
/news/news-list.php?id=6">标题名称</a>

<a class="bds_qzone"></a> <a class="bds_tsina"></a> <a class="bds_tqq"></a> <a href="/news/news-list.php?id=7">标题名称</a>

</body>



匹配页面中所有带有href链接的A标签,不带href的不需要,

需要提出三个参数, 1, <a href="/news/news-list.php?id=5">标题名称</a>这一整段  2,/news/news-list.php?id=5链接地址  3,标题名称

我之前这样的 

preg_match_all('/<a(?:[\s\S]*?)href\s*?=\s*?[\'"](((?:http(?:s?):\/\/)?([^\"\'\/]+))?(?:[^\"\']*))[\'"](?:[^>]*?)>([\s\S]*?)<\/a>/i'

但第三种没有href的就一直匹配下去了。把整个没带href的A标签也匹配进去了.但这又不是贪婪匹配

求个能解决的正则啊啊,谢谢各位了

------解决方案--------------------
$s=<<<html

<body>

<a href="/news/news-list.php?id=5">标题名称</a>

<a 
href="
/news/news-list.php?id=6">标题名称</a>

<a class="bds_qzone"></a> <a class="bds_tsina"></a> <a class="bds_tqq"></a> <a href="/news/news-list.php?id=7">标题名称</a>

</body>
html;
preg_match_all('/<a[^>]+href="(.+)"[^>]*>(.+)<\/a>/isU',$s,$m);
print_r($m);