日期:2014-05-16  浏览次数:20602 次

如何处理Linux汉字乱码

Linux下,你有没有这样的经历,文本文件里面的汉字显示都是正常的,可一插到数据库里就变成了乱码;文件名在本机显示都很正常,一传到服务器上显示的都变成乱码了,最近就差点被这个问题搞死,最后还算小有收获,这里写一下心得:

  1,首先要知道文件自己的编码方式,就是文件是以utf8还是以gbk等编码方式存储的,因为这是根本。以xxxdat文件为例
  用vi命令打开xxxdat文件
  在命令行模式:输入set fileencoding 这时会在终端的底部显示文件的编码方式,显示的结果如果是cp936(等同于gbk)或者utf8等,那说明文件的编码方式已经被正确判断出来了,如果是latin1,我们就可能要设定VIfileencodings这个环境变量的值,打开vimrc这个文件,RHEL的这个文件在/etc目录下、Ubuntu/etc/vim目录下;或者你也可以建一个~/vimrc文件
  然后把里面merge成:set fileencodingsucsbomutf8cp936gb18030