日期:2014-05-16  浏览次数:20617 次

在Linux Shell下把汉字转换为Url编码
在linux 的shell环境下有一个od命令可以把文件按不同的进制的ascii码输出,该功能可以完成在linux shell下把汉字转换为url编码的任务。

url编码是十六进制的形如%E6%9C%8D%E5%8A%A1%E5的字符串,test是包含“数据库网络,”这几个字符的文件,以下命令输出:


#od -t x /test

0000000 ddbefdca f8cde2bf 0a2ce7c2
0000014 


该字符串对应的url编码为 %CA%FD%BE%DD%BF%E2%CD%F8%C2%E7%2C。

可以看出编码的对应关系以下是转换的脚本:


#!/bin/sh
#make url code
od -t x /tmp/test |awk '{ 
w=split($0,linedata," ");
for (j=2;j<w+1;j++)
{
for (i=7;i>0;i=i-2)
{
if (substr(linedata[j],i,2) != "00") {printf "%" ;printf toupper(substr(linedata[j],i,2));}
}
}
}' >/tmp/testurl 


/tmp/testurl文件的内容就是转换结果。