日期:2014-05-18  浏览次数:20622 次

再谈字符集
一直对字符集都理解的不是很清楚,有时候遇到就是不停的试,但好象结果经常不一样,
这里举XML为例, XML的头、XML文字的字符集和XML文件的字符集(就是另存为时可以看到的文件字符集)之间是什么关系?

下面是XML中有中文时的情况:
如果文件头是UTF-8,文件字符集ANSI,文件文字是UTF-8,这样XML就会无法解析,是一个不正确的XML格式;
如果文件头是GB2312,文件字符集是UTF-8,文件文字是UTF-8,里面的中文会乱码...

反正经常是不同的组合有不同的现象;

JAVA文件中,如果String s = "abc"; 那么这个abc是什么字符集? 跟操作系统字符集一样还是ISO8859-1? 
有什么方法查询一个字符串的字符集吗?

------解决方案--------------------
参考这个 一段检测字节数组的编码方式的代码

很准确的