日期:2014-05-20  浏览次数:20618 次

Httpclien 请求页面出现UTF8乱码
最近动手写了个抓取网页内容的小程序,测试后发现gbk编码返回的字符串正常,但是utf8返回的字符串却出现了乱码现象。请问大家是哪里出了问题呢?
如果有解决的请贴出代码,大家一起分享,谢谢。

------解决方案--------------------
http://bbs.csdn.net/topics/390372335
上面的是解决前台和后台的乱码问题的。
当然,感觉你说的问题有可能是下面这种:
因为你页面编码格式就是gbk的,所以你用UTF-8来读就有可能出问题
String newStr = new String(oldStr.getBytes(), "UTF-8");  
转码一下就行了
------解决方案--------------------
httpclient可以自动判读编码的吧? 只要设置一下默认编码就行,在判断不出编码的时候会按默认编码返回