正则获取网页源码keyword跟description ，蛋有点疼-PHP教程-爱易网页

正则获取网页源码keyword跟description ，蛋有点疼

日期：2014-05-16　浏览次数：20762 次

正则获取网页源码keyword和description ，蛋有点疼
情况一：

<META NAME="description" CONTENT="华尔街债券（bond.wswire.com）是全球第一债券网站，为您提供全球债券市场最迅速最专业的债券资讯和全天候的债券理财、债券评级及报价服务，华尔街债券覆盖交易所债券市场、银行间债券市场、银行同业拆借及公开市场等各方面的债券信息服务。华尔街债券汇聚多家顶级专业机构分析研究报告、每日两次的精确数据分析以及图文并茂的市况报道。">



<META NAME="keywords" CONTENT="华尔街，电讯，华尔街电讯，全球债券，国债，债券，债市，企业债，企债，可转债，回购，正回购，赎回，债券公告，利率，金融债，央行，短期融资券，记账式国债，货币政策，财经，汇率，票据，公开市场，稳定收益，公债，柜台交易，银行间债市，同业拆借，债券资讯，融资债，债券理财，债券评级，银行间市场，交易所市场，海外市场，央行票据">

情况二:

<meta name=keywords content="微波炉使用高火档能耗低更节能(图),环保新知,,,微波炉,,,高火,,,节能,,,省电,,">



<meta name=description content="微波炉使用高火档能耗低更节能(图)">

注意：可能大小写，还有就是name，和content属性[color=#FF6600] 位置不一样[/color]

小弟试着写了一下，只能匹配一写网页，不知道有什么问题。大牛请解答，拜谢！
keyword：



 1.preg_match("/<meta[\s]+name=['\"]keywords['\"] content=['\"](.*)['\"]/isU",$this->tmpHtml,$inarr);

2.preg_match("/<meta[\s] content=['\"](.*)['\"] name=['\"]keywords['\"]/isU",$this->tmpHtml,$inarr2);



1.preg_match("/<meta[\s]+name=['\"]description['\"] content=['\"](.*)['\"]/isU",$this->tmpHtml,$inarr);

2.preg_match("/<meta[\s]+content=['\"](.*)['\"] name=['\"]description['\"]/isU",$this->tmpHtml,$inarr2);

说明：一些网页能匹配，一些不能

------解决方案--------------------
不是有个get_meta_tags函数么
------解决方案--------------------

引用:

不是有个get_meta_tags函数么

+1，可以返回一个meta的数组的，再提取需要的就是了

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

正则获取网页源码keyword跟description ，蛋有点疼

相关资料更多>

推荐阅读更多>