用纯C语言写了一个HtmlParse(网页分析器)外带采集功能,大小只有200K(免费+开源+操作示意图)
用纯C语言写了一个HtmlParse(网页分析器)外带采集功能,大小只有200K(免费+开源+操作示意图)
下载地址: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-ff11da70f37b11dd8000354100003541.html
用法很简单,比如:你把网页分析器保存到D:\那你直接在 dos 窗口下输入:
d:\czhtmlparse "http://tieba.cangzhuo.com/"
然后回车就可以了!
运行需要一个参数,
第一个参数
"http://tieba.cangzhuo.com/"
表示要下载的地址
目前测试过的大型网站有
http://www.csdn.net/
http://www.google.cn/
目前支持 GB2312编码、UTF-8编码自动转换、ISO-8859-1 及无编码类型网页!
下一版本将增加对BIG5编码类型网页的转换支持!
我打算等有 200人回复说好的时候就开源!大家要是喜欢就回复哈!
------解决方案--------------------
------解决方案--------------------强人,支持!
------解决方案--------------------这个要顶...
------解决方案--------------------希望尽快开源,ding
------解决方案--------------------这个技术含量很高啊,期待源码!
------解决方案--------------------顶一个先!