请问一个字符编码的有关问题(unicode)-Java教程-爱易网页

请问一个字符编码的有关问题(unicode)

日期：2014-05-20　浏览次数：20657 次

请教一个字符编码的问题(unicode)
程序如下：
public class CharsetTest {
public static void main(String[] args)
{
String str = new String( "好 ");
byte[] bt = str.getBytes( "Unicode ");
for(int i=0;i <bt.length;i++)
{
System.out.println(bt[i]);
}
}

以上程序用Unicde字符集解码为字符序列时，会解码成4个字节，Unicode不是两个字节的编码的吗？
如果用GBK解码就没有问题。

请指教，谢谢！

------解决方案--------------------
一般用Unicode编码会在前面多出两个字节，即FF、FE
如果你多加几个汉字，你会发现仍是多这两个字节，所以Unicode就是两个字节的
而gbk没有多加什么东西
------解决方案--------------------
前面两个字节（0xFF 0xFE）可能是 Unicode 的前缀，不知道为什么会这样。

解码两个字时，是 6 个字节。
------解决方案--------------------
补充下楼上的。

big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前面？如果将6C写在前面，就是big endian。还是将49写在前面，就是little endian。

前面多的FFFE或者FEFF就表示高字节在前还是低字节在前。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

请问一个字符编码的有关问题(unicode)

相关资料更多>

推荐阅读更多>