日期:2014-05-16 浏览次数:20618 次
hadoop、hive都支持UTF-8编码,我们可以使用UTF-8编码来处理中文 以下两点需要注意:
1. 处理脚本为UTF-8格式,包括建表脚本,数据处理脚本 例如:如果在windows下使用ultraedit来写HQL程序,在保存文件的时候,保存格式为UNIX类型、UTF-8格式 2. 终端采用UTF-8显示 例如:secucecrt设置字符编码为UTF-8,字体为新宋体,字符集为GB2312