日期:2014-05-16  浏览次数:20640 次

Linux/Windows系统UTF-8编码问题
       从Windows往Linux拷贝文件,有时会呈现中文文件名乱码的现象,出现这种问题的原因是因为,windows的文件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致的原因,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

      今天,介绍一个Linux的小工具:convmv。它可以帮助你完成文件名编码的转换,将文件名从GBK转换成UTF-8编码,也能从UTF-8转换到GBK。

      首先看一下你的系统上是否安装了convmv,假如没安装的话用:

                       yum -y install convmv 安装。

                       下面看一下convmv的详细用法:
                                           convmv -f 源编码 -t 新编码 [选项] 文件名
                                          常用参数:
                                                                -r 递归处理子文件夹
                                                                –notest 真正执行转码,请注意在默认情况下文件名不是真正转码,而只是试验。
                                                                –list 显示所有支持的编码
                                                                –unescap 可以做一下转义,好比把%20变为成空格

      现在,我们有一个utf8编码的文件名,转换成GBK编码,命令如下:
                                         convmv -f UTF-8 -t GBK –notest   utf8编码的文件名

      这样转换今后”utf8编码的文件名”会被转换成GBK编码(只是文件名编码的转换,文件内容不会产生变革)

       对于Linux下SVN工作副本中文乱码的问题,同样能解决,不错的小工具