js对汉语进行GB2312编码-JavaSript-爱易网页

js对汉语进行GB2312编码

日期：2014-05-16　浏览次数：20406 次

js对中文进行GB2312编码
需求
在js中将中文用gb2312编码。如，“我”编码后应该是“%CE%D2”。

分析
大家知道，encodeURI和encodeURIComponent会用utf-8编码，如“我”编码后是“%E6%88%91”。据实验，似乎没有参数指定编码的地方。只有另寻他法。
大致分析有如下几种解决方案：
1. 用js创建一个隐藏的iframe并指定其为gb2312编码，将需要转换的文本放到iframe的form的一个input中，将form指定为get方式并提交，
然后获取其url并解析，应该可以得到其gb2312编码后的文本。
2. 用ajax传到服务器上编码，然后传回来。
3. 在js中创建一个gb2312编码表。

实现
第一种方案个人感觉太折腾，需要在多个不同的浏览器下测试。
第二种方案需要有服务器配合。
下面是第三种方案的实现：
最开始打算使用数组存储编码表，后来为了减小js文件大小，改用string来存储。
于是，js代码如下：

代码
复制代码代码如下:
function encodeToGb2312(str){
var strOut="";
for(var i = 0; i < str.length; i++){
var c = str.charAt(i);
var code = str.charCodeAt(i);
if(c==" ") strOut +="+";
else if(code >= 19968 && code <= 40869){
index = code - 19968;
strOut += "%" + z.substr(index*4,2) + "%" + z.substr(index*4+2,2);
}
else{
strOut += "%" + str.charCodeAt(i).toString(16);
}
}
return strOut;
}
function decodeFromGb2312(str){
var strOut = '';
for (var i=0;i<str.length; i++){
var c = str.charAt(i);
// +是空格
if (c == '+'){
strOut += ' ';
}
// a,b,c,1,2等，非%开头的，直接返回本身
else if (c != '%'){
strOut += c;
}
// %开头
else{
i++;
var nextC = str.charAt(i);
// 数字，则不是汉字
if (!isNaN(parseInt(nextC))){
i++;
strOut += decodeURIComponent(c+nextC+str.charAt(i));
}
else{
var x = new String();
try
{
var code = str.substr(i,2)+str.substr(i+3,2);
i = i + 4;
var index = -1;
while ((index = z.indexOf(code,index+1)) != -1){
if (index%4 == 0){
strOut += String.fromCharCode(index/4+19968);
break;
}
}
}catch(e){}
}
}
}
return strOut;
}
var z='{0}';

详细出处参考：http://www.jb51.net/article/21686.htm###

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

js对汉语进行GB2312编码

相关资料更多>

推荐阅读更多>