用到字符集的部分包括
1、浏览器页面编码
2、浏览器url
3、页面做dopost方法传输的数据
4、tomcat服务器url编码
5、java服务器后台String类
6、hibernate连mysql字符集
7、mysql内置字符集
8、windows或者linux控制台字符集
9、回显页的jsp或者servlet字符集。
每一个字符集的配置不正确,都有可能导致字符乱码。。。。
我建议在每个工程开始之前,就先统一好字符集,推荐使用utf-8。
1、jsp页面用在页开头顶格插入<%@ page contentType="text/html;charset=utf-8"%>
2、html页面字符集设置在<head></head>标签之中插入。
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
3、在servlet子类文件(你编写的请求接收类),实现doPost(HttpServletRequest req, HttpServletResponse resp)方法
在此方法首行加入req.setCharacterEncoding("utf-8");
设置页面做dopost方法传输的数据的解析格式。
4、tomcat服务器url编码的设置在$tomcat_home\conf\server.xml文件中。
<Connector>项加入属性 <Connector URIEncoding='utf-8' (……原有属性保持不变)></Connector>
5、java服务器后台String类,默认都是使用的unicode就是utf-8的字符集,每字符都是双字节的可以存储汉字。更改的话使用
byte b[];
Stirng s=new String(b,"utf-8");
比如从socket流读入进来的byte序列,就可以这样解析。尤其是C的socket传过来的数据。
6、用到hibernate的情况下需要在hibernate.cfg.xml文件中加入
?? <property name="connection.url">
??? jdbc:mysql://localhost:3306/logistics?useUnicode=true&characterEncoding=UTF-8
?? </property>
直接把原有的url改成这样也行,注意&是html的转义字符可以试一下&或者“&”
7、mysql内置字符集,处理起来比较麻烦了,参见
http://hi.baidu.com/zp9450/blog/item/db6d21515358826e85352499.html
注意对于原有数据的数据库,字符集更改生效以后不会影响原有数据,所以一定要在建库之前就改好字符集。
对于已经有数据的情况,需要导出数据,再删除原有数据库,新建以后,再导入数据。
所以建议一定是在工程开始之前就把这些准备工作做好。
8、windows控制台的字符集比较杯具,到现在没发现怎么改,建议不要用控制台直接插入数据到mysql数据库,原有的数据做查询的时候,显示出来的也是乱码,但数据是对的。
linux下没试过,不懂的就不写了。