日期:2014-05-16  浏览次数:20776 次

如何用libxml2 默认解析器解析HTML文件
自己定义htmlSAXHandler时可以调用libxml2库的htmlSaxParseFile函数进行HTML文件解析。但是它提供的那么多不需要定义外部解析器的HTML解析函数:比如htmlParseFile ,htmlParseDoc,htmlParseDocument,htmlParseChunk ,htmlReadDoc,htmlReadFile,htmlReadMemory,htmlCtxtReadDoc,htmlCtxtReadFile,htmlCtxtReadMemory,为什么都不可用呢?我的解析总是报错,比如HTML Parser Error:Element script embeds close tag 之类的。设置了option进行relaxed parse也不行,到底怎么回事?怎样使用这下函数解析我的HTML文件呢?

------解决方案--------------------
使用指南:http://www.blogjava.net/wxb_nudt/archive/2008/01/29/161340.html
------解决方案--------------------
就用过tinyxml,觉得挺好用的