【高分求助】如何获得外部网站某个目录下的所有文件目录,并进行读取分析。
我想用ASP做一个东西,需要解决以下问题,希望高手能够帮我参考参考,分数不够可以另外开贴!谢谢
1、如何使用ASP对另一个网站的某个目录进行遍历,以获得所有文件的文件名。
2、如何用ASP读取另一个网站的某个网页内容,以便对其内容进行分析,比如地址为http://www.sina.com/index.htm
3、第2点中,能否做到仅读取前面部分数据,比如说,我只要分析网页文件的<title></title>中的内容,以便减少数据传输的量。
以上问题请给出相应的实现的代码,并附一点说明。
谢谢大家参与。
------解决方案--------------------采集??
------解决方案--------------------采集程序,网上多了去了.随便下个研究一下.
------解决方案--------------------你需要一个html解析器,网上很多
------解决方案--------------------
------解决方案--------------------结合正则表达和字典,可以对网站内互相链接的文件进行一定程度的扫描,但仅仅限于互有链接的文件,可以参考网站下载软件。运算量和流量非常大,不适合网站做。