日期:2014-05-16  浏览次数:21002 次

Apache Hadoop 2.0 Alpha 版发布

原文 http://www.iteye.com/news/25197

?

?

Apache Hadoop社区近日发布了最新的Apache Hadoop 2.0 Alpha版本,这标志着Apache Hadoop进入了一个新的分支。


Hadoop是Apache的顶级开源项目,由前雅虎开发者Doug Cutting(也是Nutch和Lucene的创始人)开发的分布式计算平台,是一个能够对大量数据进行分布式处理的框架。用户可以在不了解分布式底层细节的情况下开发分布式程序,充分利用集群的威力高速运算和存储。

该版本提供了一些新的、重要的功能,包括:

  • HDFS HA,当前只能实现人工切换。
  • YARN,下一代MapReduce这是一套资源统一管理和调度平台,可管理各种计算框架,包括MapReduce、Spark、MPI等。
  • HDFS Federation,允许HDFS中存在多个NameNode,且每个NameNode分管一部分目录,而DataNode不变,进而缩小了故障带来的影响范围,并起到一定的隔离作用。
  • 基准性能测试
  • 通过protobufs来提供HDFS和YARN的兼容性
除了以上这些功能外,还有一些来自社区的改进,包括HDFS快照HA NameNode自动切换等。

需要注意的是,该版本还处于Alpha阶段,部分功能还在部署中,不可用于实际生产。

文档:http://hadoop.apache.org/common/docs/r2.0.0-alpha/

下载地址:http://hadoop.apache.org/common/releases.html