能不能把不标准的html该成标准的
例如
<P align=left> 10月25日的大幅度反对反对大幅度法反对法的, </p>
<img src=dfdfm.jpg> dddddddddddfffffff <a href=dfdf> </a>
该成
<P align= 'left "> 10月25日的大幅度反对反对大幅度法反对法的, </p>
<img src= 'dfdfm.jpg '> dddddddddddfffffff <a href= 'dfdf '> </a>
------解决方案--------------------正则是不二选择,但是你得枚举出所有的html元素,才能保证100%准确
实际上,这样没有什么意义
------解决方案--------------------jf
------解决方案--------------------使用xml读取,再重写它的属性