日期:2014-05-16  浏览次数:20523 次

GREENPLUM安装步骤
在安装GreenPlum之前,先介绍一下基础架构,这样有个概念.
 
GreenPlum是一种基于postgresql(开源数据库)的分布式数据库.它采用的是shared nothing架构(MPP),主机、操作系统、内存、存储都是自我控制,不存在着共享.它主要由master host,segment host,interconnect三大部分构成.
 
Master节点是GreenPlum数据库的入口点,它主要是处理客户端发起的连接访问,同时还处理进程执行的SQL语句.由于GreenPlum数据库的引擎是基于PostrgeSql的,当用户连接到GreenPlum的master节点的时候会感觉就像是连接到到一台postgresql数据库一样.并且可以通过psql、应用程序的api接口来连接GreenPlum数据库.Master下面存放到是全局的系统目录.(global system catalog),包含系统表和元数据,不包含用户的数据.用户数据是存放在segment中.
 
Master节点做以下事情:
 ?客户端访问连接的认证.
 ?处理传入的SQL语句.
 ?在segment之间分配工作负荷..
 ?协调每个segment返回的结果,并把最终结果返回给客户端..
 
Segment节点主要做数据存储和数据处理,用户创建的索引和表被分发到各个子节点当中,每一个子节点都包含了用户数据的分片,而这些分片不存在重复的情况.
 
Interconnect是GreenPlum数据库的网络层.在每个segment中起到一个ipc的作用(inter-process communication).GreenPlum数据库推荐使用标准的千兆以太网交换机来做Interconnect.默认情况下,Interconnect默认使用的是UDP协议来进行传输,因为在GreenPlum的软件当中,它没有其他包去检查和验证UDP,所以可靠性上等同于TCP协议,并且超过了TCP的性能和可扩展性,而且使用TCP协议就会有一个限制,最大只能使用1000个segment实例.
 
下面开始介绍安装:因为是一台虚拟机实现,即是Master节点,又是Segment节点,所以省略了网络的配置.默认安装好一台CentOS 5.7的主机就好.
 
1.内核参数设置
 
设置下列参数到/etc/s