Apache Hadoop 容易配置及实践-Access教程-爱易网页

Apache Hadoop?是一个分布式计算基础框架，通过它可以使用N台计算机同时处理某个复杂的计算任务。用户（应用程序）只需要定义如何将一项计算任务拆分（Map）以及如何将各个分任务的结果合并（Reduce），剩下的事情比如如何协调N台计算机一起工作，如何保证即使某一台计算机中途坏掉了也不会影响整项任务的工作等，都由 Hadoop 代劳。Hadoop 同时还可以扩展为分布式储存（HDFS）、分布式NoSQL数据库（HBase）等等。本文将简单介绍基本的 Hadoop 系统的搭建方法。

Hadoop 在运行时由5个程序组成：

1个NameNode，用于管理命名空间以及客户端对文件的访问；
1个JobTracker，用于调度工作以及分配任务（Task）；
1个SecondaryNameNode，用于辅助NameNode的工作；
1～N个DataNode 用于数据储存；
1～N个TaskTracker 用于执行任务，DataNode 和 TaskTracker 总是成对出现在同一台计算机里运行。

前3个程序一般是分别在三台不同的计算机里运行，为了简单起见下面的例子将在同一台计算机里运行这3个程序，然后再另外找3台计算机运行DataNode（连同TaskTracker），所以这个示例一共需要4台计算机。结构图如下：

下面是详细的搭建过程

1、下载 Apache Hadoop
因为分布式储存是分布式计算的基础，所以我们必须下载 HDFS 。到这里下载?HDFS，这里使用的版本是 0.20.2，下载回来的一个压缩包已经包含了上面提到的5个程序。

2、配置 Hadoop
虽然在一个典型的 Hadoop 系统里会有 4种不同角色的计算机，不过我们为了简单起见可以先在某一台计算机编辑好配置文件，然后再分发到其他计算机，这样可以避免一台台地配置浪费时间。

a、编辑 conf/hadoop-env.sh，设置正确的 JAVA_HOME 环境变量，比如
export JAVA_HOME=/usr/lib/jvm （CentOS + OpenJDK）

PS：某些 Hadoop 版本在配置了 IPv6 的计算机上会监听错网络地址，所以需要增加如下一行以屏蔽 java 的 IPv6 功能：
export HADOOP_OPTS=-Djava.net.preferIPv4Stack=true

b、编辑 conf/core-site.xml

<configuration>

                    
                    
                        
                            上一篇： 有关 CAS 证书认证的 单点登录 有关问题 

                            下一篇： Apache 调整 jetty 
                        
                    


                    
                        免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
                    

                    


    
        相关资料更多>
    
    
        

            
                  
                      
                         access更改表结构,该怎么解决 
                   
                
                  
                      
                         apache FtpServer 调整spring部署 
                   
                
                  
                      
                         apache配置虚拟主机 
                   
                
                  
                      
                         这个宏怎么调用 
                   
                
                  
                      
                         Ubuntu下Apache+Passenger部署实践 
                   
                
                  
                      
                         apache+Tomcat负载平衡设立详解 
                   
                
                  
                      
                         在ACCESS中,怎么实现限制条件的查询 
                   
                
                  
                      
                         组合框联动,该如何处理 
                   
                
                  
                      
                         ububuntu server 装配 subversion + apache + ssl +权限控制 
                   
                
        
    



                

                
                    
                    

                    
                    
                    
                    

      
        推荐阅读更多>
      
      
          
        
                       
                             ACCESS多用户有关问题 
                    
                       
                             tomcat 下怎么使用默认的servlet配置而无须设置web.xml 
                    
                       
                             兑现apache+tomcat集群和负载均衡的比较 
                    
                       
                             Apache用ab测试时发现不带-k参数性能出奇的低，很奇怪。解决方法 
                    
                       
                             java.security.AccessControlException: access denied 的解决办法 
                    
                       
                             这段代码会实现无刷新加载么 
                    
                       
                             Access数据库新增记录怎么让一个ASP页面自动发出声音提示 
                    
                       
                             数据库是access2000,请教用什么SQL语句遍历数据库里所有的表和表中所有的列 
                    
                       
                             Apache代理IIS时能否转发的请求IP?解决方法 
                    
                       
                             衡量 Apache Geronimo EJB 事务选项，第 1 部分: 容器管理事务 
                    
                       
                             apache ,tomcat负载均衡跟集群配置 
                    
                       
                             在myeclipse中点web browser时出现的有关问题 
                    
                       
                             自个儿实现的apache beanUtil 
                    
                       
                             src版本和binary版本的区别解决思路 
                    
                       
                             CI的htaccess配备 
                    
                       
                             apache2.2.4+tomcat5.5 整合后cpu占用100%解决思路 
                    
                       
                             phpip签名，将jpg文件以php脚本的形式，htaccess如何写啊 
                    
                       
                             不带前缀www的域名转为到带www.域名的Apache 301转向配置样例 
                    
                       
                             Apache Ant 环境筹建 
                    
                       
                             apache能否将windows映射盘做为虚拟目录？该如何处理 
                    
            
      


                
            
            

            
    
友情链接：
    
      爱易网             
    
      云虚拟主机技术             
    
      云服务器技术             
    
      程序设计技术             
    
      开发网站             
    
      APP开发教程             
    





 

Copyright © 2013-2025 爱易网页 当前在线：382人　
        网站在3时56分20秒内访问总人数：79546人
    当前 12.16%
　粤ICP备18100884号-2