解除数据风险的远程灾备解决方案
随着信息化建设的深入,网络技术的普及,我们的生活和工作方式发生了巨大的变化。 E-mail代替信件成了人与人沟通的主要信息来源,缩短了人们通信的时间,拉近了彼此间的距离;教学部门通过教务等管理系统解决了学生、教师、教室等多方资源的冲突问题;学生们通过校园网不仅能够了解自己在学校的学习情况,还能够从各种途径获得对自己有益的资源书籍、论坛、blog等,拓宽了自己的知识面;教师们通过各种信息化手段缩短了与国际先进思想的差距,加快了科研及教学的步伐……所有这些都与信息化工作的深入和展开是分不开的,在信息化给我们带来各种便利的同时,我们也发现,随着信息化建设的逐步深入,对其的依赖性也越高,我们的信息化建设也不断受到各种因素的干扰,从最初的计算机病毒到网络病毒、还有成天让信息化主管们提心吊胆的计算机黑客,一旦发生信息化系统的故障,尤其是作为信息化基础的数据丢失,将产生灾难性后果,对我们工作与生活的影响也是空前的,因此信息化越深入,数据的安全控制就越应该得到重视和加强。
作为中国最高学府之一的北京大学,信息化工作起步较早,其建设的脚印已经深入学校的每一个角落。经过20年的信息化基础建设,北京大学已拥有近5万多计算机用户、1.5万亿次的高性能计算能力、10G的网络主干带宽、网上办公系统、教务教学管理、财务管理等20余种校务管理系统已经推广使用,北京大学的教学、管理及科研工作已经离不开信息化技术的支持。
在信息化实施的过程中,北京大学也遇到了其它部门遇到的相同问题——信息安全。但受资金及安全观念所限,在最初的信息化建设中很少考虑数据的安全,尤其是数据的直接物理承载体——硬盘的故障。
据北京大学计算中心2002~2003年的技术统计,其管辖的服务器群就有15块硬盘毁坏,导致部分数据丢失和系统工作的停滞,也正因为如此高的磁盘系统的故障率,数据安全得到了有关方面的高度重视。学校有关领导已经预见到数据将成为信息化建设的基石,在未来的一段时间内,数据安全将成为信息化建设的关注点。
于是,计算中心自2003年开始了对该课题的探讨和研究工作,并最终通过“211”二期项目的建设,建立起北京大学信息与网络数据中心(含灾备中心)。通过该项目的建设,北京大学的信息化主导部门的主要数据得到了最完善的保护。
谈到数据安全问题,就不得不提到2005年刚刚开始实行的国家信息化等级保护体系的建设,其对目前信息化建设中存在的安全风险作了较为详细的分析,其间信息安全以层次划分,分为5个层面,即:
a) 管理人员的安全(人员的安全管理、系统地安全健康等等);
b) 各应用的控制安全(各种应用级);
c) 系统的安全管理(操作系统及基础应用级);
d) 网络环境的安全控制(协议级);
e) 数据环境的安全保护(硬件级)。
其考虑的核心内容是对数据的保护,因为数据是信息系统的最重要的资产,信息安全的最终目的是保护数据不损失、不失窃。通过各种途径(如人员的账户强制管理、应用的补丁、系统的补丁及加固、防火墙、硬件设备的冗余结构等)在不同层面形成对数据的安全控制和保护,实现信息安全的最大化。通过以上5个层面的安全控制,实现数据的安全可控制、可管理、可伸缩、可恢复。
分步实施数据保护整体规划
北京大学数据中心建设参照信息安全等级保护的规划,突出了对数据的承载体——磁盘系统的保护。通过高可靠的SAN存储网络与智能存储的搭配,配合备份软件和高速带库,共同搭建北京大学信息与网络数据中心,通过长程光纤实现了数据远程灾备,并最终达到:
1. 搭建集中式冗余SAN路由环境,分散式SAN网络,分布到各主要机房和应用的SAN网络,使SAN网络延伸到校园内光纤能够到达的地方;
2. 安全高效的集中式存储,解决了数据存储载体的安全和性能问题,也解决了容量问题,并且通过这种方式实现了主机系统的快速切换;
3. 分区分级的数据存储,通过不同性能的存储系统的使用,达成业务数据和资源数据的分离,实现各类数据的分类存储和保护;
4. 备份软件和高性能带库实现了数据的集中备份,通过网络延伸到校内各地,极大提高了北京大学整体的数据保护能力;
5. 异地数据灾备系统,提供了大容量的远程数据实时复制,最大限度地实现了关键数据的保护,减少极端条件下的数据损失,加快数据和应用的恢复能力;
6. 提高了系统管理人员的安全意识,改变了人员对安全的认识,实现了管理规划化。
从数据集中存储到数据灾备和备份的各体系的建设,通过不同系统对数据性能和安全的要求,区分数据类型,进行分区分片存储,对关键数据进行合理的自动化备份,对核心数据进行远程灾备,极大地提高了北京大学信息系统的抗干扰能力。尤其是数据灾备,对于高校来说还是一个很富有挑战性的题目,其技术难度和管理难度都很大,投入也是巨大的。因此北京大学对该项目执行调研优先、分步实施、不断改进的方针。项目一期建设主要进行了数据集中存储,集中备份、搭建基础的SAN存储网络。使用半年后,根据分步实施、不断改进的原则,结合北京大学的实际需求,在二期项目中着重解决了大量资源数据的存储、异地数据灾备、存储网络的延伸和优化、创新性的SAN网络应用构架,最终搭建了北京大学信息与网络数据中心的完整框架。
二期项目中最复杂最关键的建设就是整个数据容灾系统的建设,目前主流的灾备技术主要有硬件级复制技术和软件级复制技术(区别如表所示);链路的选择有纯光纤技术和以太网络的数据传输;链路设备也有FC交换机对FC交换机,路由器对路由器,以及通过DWDN等增强光纤通讯距离进行通信的特殊设备。
选择硬件级灾备系统
在2001年“9·11”事件发生前,灾难恢复还没有引起足够的重视,但“9·11”后原世贸中心内营业的各公司处境和出路却发人深省,有的公司实施了很好的灾备措施和管理规范,损失巨大但很快恢复了其业务;有些公司实施了基础的灾备措施,但没有进行灾备演练和妥善的文档资料管理,公司损失了许多时间,影响了公司业务和形象;还有很多干脆没有做灾备保护措施,其结局只能是消亡。当然,“9·11”给世人影响最深的还是那些能够迅速恢复业务的公司,其快速恢复能力不仅增强了用户对其的信任,更增加了公司的生存能力。“9·11”也再次让大家认识到数据在信息时代的重要性,没有数据,其生存都无法得到保障。
基于对“9·11”事件的认识,我们认为灾备保护应涵盖两个方面的内容,即硬环境建设和软环境建设。硬环境指必要的数据保存和恢复设施,如智能阵列、带库、及相关链路条件等;软环境指对专业技术人员的保护和相关文档资料的整理及妥善保存。两者缺一不可,硬环境是基础,软环境是操作手段,没有硬环境的灾备无从做起,没有软环境的灾备难以恢复,原有的大量投资将付之东流。
在综合考虑北京大学自身情况后,北京大学的灾备项目最终以硬环境投资为主,兼顾加强完善文档资料的整理及保存,努力使项目建成后能够最大限度发挥其成效。
目前主流的灾备技术主要有硬件级灾备技术(阵列级)和软件级灾备技术(主机级),两方案各有特点和长处。
硬件级灾备技术更关注性能和综合能力,其与主机平台的无关性可以保障各种主机系统同时实施,而且对主机的性能影响最小;软件级灾备技术的优势体现在灵活和投入上,对简单的主机系统(数量很少)比较方便,通过主机上的特殊文件系统,依赖网络环境可进行超远距离的数据灾备。
基于以上两种技术的特点分析,结合北京大学的情况:现成的长程光纤,合理的灾备地点昌平,以及北京大学复杂的应用情况多平台(Solaris、Windows、Linux)、多主机(SUN、Fujitsu、DELL多达近20台)、多版本的具体因素,在慎重考虑综合成本之后,北京大学决定建设硬件(阵列)级灾备系统。北京大学在2004年进行了该项目一期建设。通过国际招标,最终选定了富士通提供的Eternus 3000的M600盘阵组成裸容量20TB的业务存储节点,使用富士通提供的Eternus 3000的LT160A2带库和Legato Networker备份软件组成一套完善的备份系统,Mcdata公司的两台4500构建成冗余的光纤网络环境。
系统在2004年11月进入调试运行,12月业务正式上线,总计有15台服务器和20多个业务系统使用了盘阵,20多台主机享受备份系统的保护,从而搭建了北京大学数据中心的安全、高效的存储备份环境。
一期项目正式运行半年后,北京大学又结合新需求和新应用,如图书馆和现代教育技术中心大量资源数据的存放,大量关键应用数据需要得到更完善的保护,北京大学决定对系统进行升级,采购了两台富士通的Eternus 3000的M300,一台15TB的作资源存储,另一台5TB放置在昌平作灾备节点存储。其链路设备的选择在充分调研和测试后,