日期:2014-05-17  浏览次数:20678 次

采集中遇到的小问题
今天弄一下采集的小功能,遇到了个问题,被采集的站点无法fsockopen,也没办法file_get_contents。

报错:HTTP/1.0 503 Service UnavailableServer
请问要如何处理,对HTTP协议不太理解。

被采集站点URL:
http://www.milanoo.com/fr/producttags/A/1.html

想采集此页面中的单词。

------解决方案--------------------
稍候再试,这个网站服务器暂时出问题了
------解决方案--------------------
 可以  file_get_contents
------解决方案--------------------
为什么不可以呢?
$url = 'http://www.milanoo.com/fr/producttags/A/1.html';
echo file_get_contents($url);

......
<li><a href='http://www.milanoo.com/fr/producttags/A-assassin′s-creed'>assassin′s creed</a></li>

<li><a href='http://www.milanoo.com/fr/producttags/A-arme-de-sora'>arme de sora</a></li>

<li><a href='http://www.milanoo.com/fr/producttags/A-akatsuki-deidara'>akatsuki deidara</a></li>

<li><a href='http://www.milanoo.com/fr/producttags/A-appareil-cheveux'>appareil cheveux</a></li>

<li><a href='http://www.milanoo.com/fr/producttags/A-age-de-glace'>age de glace</a></li>

....