远程抓取的页面内容为乱码
我在jsp页面中通过远程抓取页面内容,如果源文件没有乱码,抓取的内容也不会出现乱码.如果那个页面的源文件就有乱码的话,我用什么方法能把它转换过来呢.在线等,解决了马上给各位加分...........
------解决方案--------------------你问的问题太专业了, 只能顶你一下好了
------解决方案--------------------有个开源的东西你可以试试.httpParser.这个东西就是专门解析html页面的
------解决方案--------------------你可以换你抽取的页面内容转换成xml格式!其实用nekohtml就可以抽网页并转成xml格式的!
然后你可以用jdom进行解析你所想要的了!