设置linux字符集,解决解析文件汉字乱码问题
在Windows中编辑的文档在linux中显示为乱码,原因是Linux中默认的字符集和Windows的字符集不一致导致,所以只要修改linux中的字符集的显示或转换字符集即可显示中文字符。
1. 修改linux字符集
Linux字符集的设置: 打开/etc/sysconfig 中i18n文件,例如本人Windows中使用gb2312字符集,在i18n中的设置如下:
LANG="zh_CN.GB2312"
SUPPORTED="zh_CN.GB2312:zh_CN.UTF-8:zh_CN:zh:en_US.UTF-8:en_US:en"
SYSFONT="latarcyrheb-sun16"
2. 转换文件中的字符集
字符转换使用 iconv命令,用法如下:iconv -f GBK -t GB2312 -o i.txt h.txt # 把文件 h.txt 从 GBK 编码格式转换为 GB2312 编码格式,并保存为 i.txt