爱易网
IT新闻
IT新闻
爱易资讯
网站搭建
云虚拟主机教程
云服务器教程
Apache教程
IIS教程
Nginx教程
网站策划
站长文章
推广教程
淘宝客教程
网页设计
HTML教程
XHTML教程
CSS教程
HTML5教程
CSS3教程
JavaSript基础
JQuery教程
Node.js教程
前端技术
Ajax教程
Js特效
Xml教程
平面设计
页面UI设计
photoshop教程
程序开发
AI人工智能
Asp教程
Php教程
Asp.Net教程
Net Core教程
C#教程
Java教程
Jsp教程
开发技术
微信小程序教程
Uniapp开发教程
微信公众号开发
Andriod教程
IOS教程
DOS教程
Python教程
Docker教程
Windows Container教程
数据库
MSSQL教程
MySQL教程
Redis教程
Access教程
Oracle教程
数据库教程
操作系统
Linux教程
Windows教程
MAC教程
Cisco教程
交换机教程
防火墙教程
搜索
爱易网页
PHP教程
php 网络爬虫,该如何解决
php 网络爬虫,该如何解决
日期:2014-05-17 浏览次数:20520 次
php 网络爬虫
有开发过类似程序的高手吗?能够给点指点哦。功能需求是从网站自动获取相关数据,然后存入数据库。
PHP
网络爬虫
数据库
行业数据
分享到:
------解决方案--------------------
curl爬取目标网站,正则或者DOM获取相应的数据,然后存数据库或者文件。
也没有太难的东西吧。你需要考虑的有:
爬取的策略(只抓取特定域名的,深度优先还是广度优先)。
爬取的效率(可开多线程去爬取,如何分配各个爬虫的任务)
等。。。。。。。。
上一篇:DEDE如何去除dede_feedback表写入功能 关闭留言表写入功能
下一篇: 建站的有关问题
免责声明:
本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
相关资料
更多>
Apache服务器配置全攻略(五)_PHP安装
压缩、解压缩类
关于php执行时间的限制有关问题的解决
PHP header发送各种类型文件上载
新人求教解决方案
PHP下简单的AES加解密算法使用及例子(256位)
来问一个有关问题,正则匹配创建数据库SQL的数据库名称
GBK编码PHP脚本导致语法错误
php 部类运算符instanceof
推荐阅读
更多>
PHP的计数器程序:解决全部可能遇到的问题
PHP中经过正则查找字符串
[泪汪汪求帮助]htaccess转移后不能用了
linux云主机,smarty程序,如若设置404页面?
PHP全概率运算函数(优化版) Webgame开发必备
自己写的一个UBB转换的函数
php的exec()中不能使用net use获取权限么?该怎么处理
有人用过ganglia吗解决方案
php导入当地excel到在线数据库
Zend Framework载入页头和页脚的有关问题
关于面向对象设计方式
、dede被挂马.100分球高人
文本框输入有关问题
JSON数据编码,该怎么处理
一个大型网站的开发团队,网上邀请小弟我去参与他们的开发。但小弟我并没有这方面的开发经验,进来咱们讨论下
在win server上透过exec调用exe只能单进程么?不能并发调用吗
求 匹配多个a标签连接和名字 正则表达式解决方案
mysql怎的查询不包括某个字符的结果
众好汉,洒家含泪求一帮助。关于正则替换。整整浪费洒家一个上午解决办法
技巧:PHP+MYSQL动态网页编程纠错指南