日期:2014-05-20  浏览次数:20710 次

我希望编写一个下载www.tianya.cn论坛煮酒论史所有的网页
我希望编写一个下载www.tianya.cn论坛煮酒论史所有的网页并整理成txt文件以便在电子书上阅读,txt文件名为网页的标题,如http://www.tianya.cn/publicforum/content/no05/1/215040.shtml

这个文章,它所有的39页内容的txt内容要整理出来,并且把39页内容连接成一个txt文件,该文件名为: "鲜血与风流——两晋南北朝的是是非非"。因为包含大量txt文件,每50个文件在一个以数字为名的小目录里,如35. 每50个小目录放在一个大目录里面,该大目录名称为数字,如20. 除了可以下载www.tianya.cn的文章外,还可以下载其他很多网站的文章,相当于一个简单的离线浏览器,但是不要求下载图片和所有文件,只要求下载我感兴趣的特定的网页并自动整理成txt文件。如还可以自动下载http://tech.qq.com/上的科技文章并整理成txt文件。所有阅读过的文章以后不会再次下载。

我的email是 gearss@126.com。有意请联系,根据软件的实际难度和功能强大程度来报价。时间为2个月。

------解决方案--------------------
so easy,I can do it