linux环境停Hadoop 2.0.3单机部署-Linux-爱易网页

linux环境停Hadoop 2.0.3单机部署

日期：2014-05-16　浏览次数：20821 次

linux环境下Hadoop 2.0.3单机部署

1.Hadoop2.0简述^[1]

???????与之前的稳定的hadoop-1.x相比，Apache Hadoop 2.x有较为显著的变化。这里给出在HDFS和MapReduce两方面的改进。

　　HDFS:为了保证name服务器的规模水平，开发人员使用了多个独立的Namenodes和Namespaces。这些Namenode是联合起来的，它们之间不需要相互协调。Datanode可以为所有Namenode存放数据块，每个数据块要在平台上所有的Namenode上进行注册。Datenode定期向Namenode发送心跳信号和数据报告，接受和处理Namenodes的命令。

　　YARN(新一代MapReduce)：在hadoop-0.23中介绍的新架构，将JobTracker的两个主要的功能：资源管理和作业生命周期管理分成不同的部分。新的资源管理器负责管理面向应用的计算资源分配和每个应用的之间的调度及协调。

　　每个新的应用既是一个传统意义上的MapReduce作业，也是这些作业的 DAG(Database Availability Group数据可用性组)，资源管理者（ResourcesManager）和管理每台机器的数据管理者（NodeManager）构成了整个平台的计算布局。

　　每一个应用的应用管理者实际上是一个架构的数据库，向资源管理者（ResourcesManager）申请资源，数据管理者（NodeManager）进行执行和监测任务。

2. Hadoop2.0的目录结构^[2]

　　Hadoop2.0的目录结构很像Linux操作系统的目录结构，各个目录的作用如下：

　　(1) 在新版本的hadoop中，由于使用hadoop的用户被分成了不同的用户组，就像Linux一样。因此执行文件和脚本被分成了两部分，分别存放在bin和sbin目录下。存放在sbin目录下的是只有超级用户(superuser)才有权限执行的脚本，比如start-dfs.sh, start-yarn.sh, stop-dfs.sh, stop-yarn.sh等，这些是对整个集群的操作，只有superuser才有权限。而存放在bin目录下的脚本所有的用户都有执行的权限，这里的脚本一般都是对集群中具体的文件或者block pool操作的命令，如上传文件，查看集群的使用情况等。

　　(2) etc目录下存放的就是在0.23.0版本以前conf目录下存放的东西，就是对common, hdfs, mapreduce(yarn)的配置信息。

　　(3) include和lib目录下，存放的是使用Hadoop的C语言接口开发用到的头文件和链接的库。

　　(4) libexec目录下存放的是hadoop的配置脚本，具体怎么用到的这些脚本，我也还没跟踪到。目前我就是在其中hadoop-config.sh文件中增加了JAVA_HOME环境变量。

　　(5) logs目录在download到的安装包里是没有的，如果你安装并运行了hadoop，就会生成logs 这个目录和里面的日志。

　　(6) share这个文件夹存放的是doc文档和最重要的Hadoop源代码编译生成的jar包文件，就是运行hadoop所用到的所有的jar包。

3.学习hadoop的配置文件^[3]

上一篇：centos怎么添加host指向具体IP到域名

下一篇： linux支配java项目

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

请问共享库运行时加载的有关问题

奇怪的而有关问题

V4L2uvc摄像头修改分辨率解决方案

linux一用户下有多个tomcat服务器，进行环境变量设置,该怎么处理

kvm 虚拟机 IP 设立

哪里可以上载程序包

linux系统时间设立

LINUX 日期种命令

Linux平添开机启动项

推荐阅读更多>

Linux上安装配置tomcat

Linux停的帐户管理

linux中find 下令使用大全（转载）

初学者学习linux~

Linux学习札记（一）-文件，目录权限

在线的解答openoffice可不可以开两个进程

[原创]这样有趣的视频比赛，你敢来PK吗

请教这样算违反GPL第二版版权吗

新计算机linux系统转xp

win与linux上git配置p4merge为合并比较工具的方法

你用的是哪个linux发行版本,做嵌入开发哪个合适,该如何解决

关于qt编程，大家帮帮小弟我吧

Linux常用命令之用户管理(3)

Linux常用命令保藏

怎么根据关键字查找某个目录上的所有文件

请问虚拟机vmware下串口通信的有关问题

linux监控指定过程

Linux程序映像的格局

TSD会被其他线程访问

关于Linux文件系统的学习资料！该怎么解决