日期:2014-05-17 浏览次数:20452 次
今天没事完善了一个php采集类,这给大家分享下。
本实例,可以,自动下载远程图片,并替换文章中的图片地址。。。
实例下载地址 http://download.csdn.net/detail/open520yin/4899183
实例:
<?php header("Content-Type: Text/Html"); $url = "http://sh.sina.com.cn/travel/message/2012-12-16/191225659_5.html"; include("Snoopy.class.php"); $snoopy = new Snoopy; $snoopy->fetch($url); //获取所有内容 $html = $snoopy->results; //显示结果 $title = $snoopy->getTitle();//获取标题 $text = $snoopy->getCent('<div class=\"(.*)\" id=\"artibody\">','<p class=\"page\">');//获取主体 //替换规则 $arr = array( 0=>'<span id=\"_function_code_page\">(.*?)</span>', 1=>'<a href=\"(.*)html#page_pic\">', 2=>'</a>', 3=>'<div class=\"article-video artice-pic\" vid=\"\"></div>', 4=>'</div>', 5=>'<a name=\"page_pic\">', 6=>'<!--(.*)-->', 7=>'<span class=\"img_descr\">(.*?)</span>', ); $text = $snoopy->replace($text,$arr);//过滤 echo $snoopy->saveImg($text); //下载远程图片,并替换文章图片地址 ?>