：怎么把文本里保存的utf8编码&x4E2D;&x6587;读出来转成汉字-Java教程-爱易网页

：怎么把文本里保存的utf8编码&x4E2D;&x6587;读出来转成汉字

日期：2014-05-20　浏览次数：20827 次

紧急求助：如何把文本里保存的utf8编码中文读出来转成汉字
文本里保存的是utf8的原码，怎么样读出来，转换成可读的汉字？

比如，文本内容：中文编码
还原成：中文编码

谢谢！！

------解决方案--------------------
楼主这是unicode 编码。不是utf-8.
------解决方案--------------------
写了一个，楼主参考：

Java code


public class StringToUnicode
{
    public static void main(String[] args) throws Exception
    {
        String str="&#x4E2D;&#x6587;&#x7F16;&#x7801;";
        str=str.replace("&#x","");                    //去掉多余的字符。"&#x"
        str=str.replace(";","");                    //去掉";"

        String UnicodeString=null;
        UnicodeString=stringToUnicode(str);
        System.out.println(UnicodeString);
    }

    //把字符串转换成Unicode字符串，输入的字符串中只能是0-9数字或者是A--F字母，不能有任何其他字符
    //输入字符串要是偶数个字符。
    public static String stringToUnicode(String str) throws Exception
    {
        byte[] bytes=new byte[str.length()/2+2];    //定义字节数组，长度为字符串的一半。加 2 是存放unicode 编码头(ff,fe)
        bytes[0]=-2;                    //-2  对应fe,-1对应ff. 后面要交换，所以保存 fe,ff.
        bytes[1]=-1;
        byte tempByte=0;                //临时变量。
        byte tempHigh=0;
        byte tempLow=0;
        for(int i=0,j=2;i<str.length();i+=2,j++)        //每循环处理2个字符，最后形成一个字节。
        {
            tempByte=(byte)(((int)str.charAt(i))&0xff);    //处理高位。
            if(tempByte>=48&&tempByte<=57)
            {
                tempHigh=(byte)((tempByte-48)<<4);    //'0'对应48。
            }
            else if(tempByte>=65&&tempByte<=70)        //'A'--'F' 
            {
                tempHigh=(byte)((tempByte-65+10)<<4);
            }

            tempByte=(byte)(((int)str.charAt(i+1))&0xff);    //处理低位。
            if(tempByte>=48&&tempByte<=57)
            {
                tempLow=(byte)(tempByte-48);
            }
            else if(tempByte>=65&&tempByte<=70)        //'A'--'F'
            {
                tempLow=(byte)(tempByte-65+10);        //'A'对应10.（或0xa.）
            }
            bytes[j]=(byte)(tempHigh|tempLow);        //通过‘或’加在一起。
        }
        
        for(int i=0;i<bytes.length;i+=2)
        {
            byte b1=bytes[i];
            bytes[i]=bytes[i+1];
            bytes[i+1]=b1;
        }
        String result=new String(bytes,"Unicode");
        return result;
    }
}

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

：怎么把文本里保存的utf8编码&x4E2D;&x6587;读出来转成汉字

相关资料更多>

推荐阅读更多>