日期:2014-05-16  浏览次数:20618 次

hive中文

hadoop、hive都支持UTF-8编码,我们可以使用UTF-8编码来处理中文
以下两点需要注意:

1. 处理脚本为UTF-8格式,包括建表脚本,数据处理脚本
例如:如果在windows下使用ultraedit来写HQL程序,在保存文件的时候,保存格式为UNIX类型、UTF-8格式

2. 终端采用UTF-8显示
例如:secucecrt设置字符编码为UTF-8,字体为新宋体,字符集为GB2312