日期:2014-05-17  浏览次数:20830 次

【高分求助】如何获得外部网站某个目录下的所有文件目录,并进行读取分析。
我想用ASP做一个东西,需要解决以下问题,希望高手能够帮我参考参考,分数不够可以另外开贴!谢谢
1、如何使用ASP对另一个网站的某个目录进行遍历,以获得所有文件的文件名。

2、如何用ASP读取另一个网站的某个网页内容,以便对其内容进行分析,比如地址为http://www.sina.com/index.htm

3、第2点中,能否做到仅读取前面部分数据,比如说,我只要分析网页文件的<title></title>中的内容,以便减少数据传输的量。

以上问题请给出相应的实现的代码,并附一点说明。

谢谢大家参与。

------解决方案--------------------
采集??
------解决方案--------------------
采集程序,网上多了去了.随便下个研究一下.
------解决方案--------------------
你需要一个html解析器,网上很多
------解决方案--------------------
引用楼主 comefirst 的帖子:
我想用ASP做一个东西,需要解决以下问题,希望高手能够帮我参考参考,分数不够可以另外开贴!谢谢
1、如何使用ASP对另一个网站的某个目录进行遍历,以获得所有文件的文件名。

2、如何用ASP读取另一个网站的某个网页内容,以便对其内容进行分析,比如地址为http://www.sina.com/index.htm

3、第2点中,能否做到仅读取前面部分数据,比如说,我只要分析网页文件的 <title> </title>中的内容,以便减少数据传输的量。



------解决方案--------------------
结合正则表达和字典,可以对网站内互相链接的文件进行一定程度的扫描,但仅仅限于互有链接的文件,可以参考网站下载软件。运算量和流量非常大,不适合网站做。