日期:2014-05-17  浏览次数:20933 次

在windows下面的Hadoop 环境搭建 wordcount

1,参考?http://hadoop.apache.org/common/docs/stable/single_node_setup.html?

2,装 'Cygwin?'记得安装openssh,最好干脆全部安装

3,在Cygwin中的JAVA_HOME是和window的环境变量一致的,不必在CYGWIN_HOME/etc/profile中再次配置

4,在HADOOP_HOME/conf/hadoop-env.sh中要再配置一次JAVA_HOME,如下:

? ??export JAVA_HOME=/cygdrive/d/Oracle/Middleware/jdk160_24

? ? 注意,我win下面的JAVA_HOME是'D:\Oracle\Middleware\jdk160_24',而在hadoop-env.sh中按如上写法才可以指向win的JAVA_HOME

5,hadoop版本必须是:0.20.2,插件必须是:hadoop-eclipse-plugin-0.20.3-SNAPSHOT.jar.

6,先开ssh localhost再做hadoop相关操作

7,若start-all.sh后,log显示无法连上hdfs,删掉原有的hdfs相关文件,然后再format nameNode,然后再启动

8,注意,如果不通过cygwin,而是在win下面直接操作cygwin的相关文件的话,会有权限问题,因为这些文件不是任何cygwin用户建立的

9,要在win的环境变量中配置'CYGWIN_HOME/bin',否则会出现

Exception in thread "main" java.io.IOException: Cannot run program "chmod": CreateProcess error=2

?

参考:

http://heipark.iteye.com/blog/786302

http://phz50.iteye.com/blog/932373

http://blog.csdn.net/yanical/article/details/4475004

?

?