日期:2014-05-16  浏览次数:20376 次

Hive-0.7.1安装(Ubuntu Server11.04+Hadoop-0.20.2)

官方安装指南地址:https://cwiki.apache.org/confluence/display/Hive/GettingStarted

?

我这里只描述了一下安装环境的伪分布式安装

?

安装环境:

Ubuntu Server 11.04

Jdk1.6.27

Hadoop-0.20.2

?

先决条件:

  • 安装了JDK1.6和hadoop-0.17以上版本
  • Hadoop已经启动并运行
  • 在Hadoop为Hive设计几个备用目录
    • hadoop fs -mkdir /tmp
    • hadoop fs -mkdir /user/hive/warehouse(当数据由HIVE管理时,数据存储于此)
    • hadoop fs chmod g+w /tmp
    • hadoop fs chmod g+w /user/hive/warehouse

?

安装过程:

  • 下载安装包 hive-0.7.1-bin.tar.gz
  • 解压:tar -xzvf hive-0.7.1-bin.tar.gz
  • 配置环境变量

(1) 执行:vi ~/.bashrc?

(2) 在结尾处添加:

export HIVE_HOME=hive的解压目录

export PATH=${HIVE_HOME}/bin:${PATH}

(3) 应用设置执行:source ~/.bashrc

(4) 执行hive进入hive shell界面

?

我在配的时候这里出现了一个错误:

?

解决:

配置hadoop-0.20.2/conf/hadoop-env.sh中配置

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/home/hadoop/hadoop/hadoop-0.20.2/lib:/home/hadoop/hadoop/hive-0.7.1/lib/jline-0.9.94.jar:

再执行hive成功进入。

?

疑问:在解决这个问题后,又做了个一个实验,将该文件中的 export HADOOP_CLASSPATH。。。注释掉后 ,执行hive依然成功。没弄明白为什么会这样。求高手指点,万分感谢^_^

?

?

配置管理:

  • hive的默认配置文件为:<install-dir>/conf/hive-default.xml
  • 我们要改变配置的话,新建<install-dir>/conf/hive-site.xml,此文件中的属性会重写默认配置

?

查询示例(使用hadoop in action中的例子):

?

?