博客首页|TW首页| 同事录|业界社区

科幻星系

科普的态度 科幻的视角 解读科技百事

IT ORACLE

浅谈企业建设的容灾备份

近年来,随着信息技术的发展,现在的企业也越来越依赖于计算机系统来保证其在业界的竞争力,业务支撑系统的高可靠性和高可用性已成为现在企业信息化的重点。

 

  以笔者从事的电信行业的运营商来说,如果发生数据丢失,轻则影响业务的开展以及客户满意度,重则会使整个企业的生产瘫痪。有研究显示,企业在遭受灾难之后,如果无法在14天内恢复数据,有75%的公司业务会完全停顿,43%的公司再也无法重新开业,有20%的企业在两年之内被迫宣告破产。造成这些损失的原因不仅仅是火灾、水灾、地震等自然灾害,还有诸如战争、蓄意破坏、严重误操作等人为因素。因此,在限定时间内成功的灾难恢复是电信运营商企业战略中的一个关键组成部分。

  而恰好前一阵子,和朋友在网上讨论过电信行业运营商一个案例,所以笔者整理出此文与大家分享:

案例需求分析
  环境:两台ibm小机p550,做双机集群,运行oracle数据库,rac负载均衡。存储是san架构

  需求:异地进行容灾,要求不要动原来的存储,不接受数据迁移,不接受换存储。实施可以停机半天,rto不超过2小时。

  常用的容灾方案用四类:1.利用磁带拷贝进行数据备份和恢复,2.远程数据库复制技术,3.远程数据复制技术4.远程数据复制技术。

   经过讨论和行业分析我和朋友所选择的是“远程数据库复制技术”也就是(Oracle11g Active Data Guard和Quest的SharePlex)的解决方案进行比较。因为这种技术是由数据库系统软件来实现数据库的远程复制和同步。基于数据库的复制方式可分为实时复制、定时复制和存储转发复制,并且在复制过程中,还有自动冲突检测和解决的手段,以保证数据一致性不受破坏。其实质是实现主、备用系统数据库的数据同步(实时或者准实时同步),即将主用系统数据库操作Log实时或者周期性地复制到备用系统数据库中,实现两者数据的一致性。远程数据库复制对主机的性能有一定影响,会增加对磁盘存储容量的需求(包括对Log的存储),但系统运行恢复较简单,在实时复制方式时数据一致性较好,所以对于一些对数据一致性要求较高、数据修改更新较频繁的应用可采用基于数据库的容灾备份方案;而选择远程数据库复制技术也就是最好的选择,自然Oracle11g Active Data Guard的解决方案就成了首选,这也是Quest的Shareplex所不具备的。

   因为Oracle11g Active Data Guard是为企业提供的一个全面的数据保护、灾难恢复和高可用性解决方案。它不仅能提供了一个能够解决计划和计划外中断的灵活、易于管理的框架。而且在物理备用数据库和逻辑备用数据库双向也能互相补充,并且可以同时进行维护,从而在减少主数据库上开销的同时提供高品质的数据保护。不同的数据保护模式提供了适用于各种保护、性能和基础架构需求的灵活性。也为用户提供了一个更易于使用的配置和管理框架平台。

   而谈到这里可能有一些朋友还会生出对于硬件复制问题的一些担扰:其实通过所谓的远程磁盘镜像实现,其实现要求严格。只能基于同一厂商、同型号阵列、同样容量大小的两个阵列来实现。厂商一般建议使用间歇性复制。远程磁盘镜像(复制),在容灾实现中,支持所有的类型数据同步,包括文件数据、数据库数据、裸设备、应用配置文件、应用程序、库函数等,支持各类应用系统容灾,包括数据库、中间件、客户自己开发的应用,适用于2层架构、3层或多层应用架构。与应用无关,但与磁盘阵列直接相关。只能基于同一厂商、同样容量大小的两个阵列来实现。受光纤线路影响、复制数据量大,在使用间歇性复制时,数据延迟大,磁盘容量要求4倍于源数据,并且在极端情况下,不能保证数据一致性。

极端情况:
   磁盘复制在生产中心和容灾中心复制的是改动过的物理数据块,而物理数据块的写是无序的。为了保证数据的一致性,通过带时间戳的数据块,改善了一定的数据块的无序性,但仍然不能解决。我们看到,数据库是通过带时间戳的数据块和联机日志一起来解决,如果一个数据文件中的数据块的时间戳不一致,数据库需要日志来修正,日志中记录的是一些有序的数据库操作,通过Recover的动作,将不一致的数据文件,前滚或后滚到某一特定时间点。带时间戳的数据文件和有序的日志,二者缺一不可,否则不能保证数据的一致性。在磁盘复制中,唯独少了至关重要的磁盘写日志(不可能有)。更有甚,如果这种磁盘块的无序写,发生在数据库的联机日志上,那将对数据库数据的一致性造成破坏。

   所以与Quest的Shareplex容灾解决方案相比较,明显Oracle11g Active Data Guard的容灾解决方案要更加完善,且兼容性与功能更加强大。而且从严格意义上来讲,SharePlex并不能完全算是个容灾软件,它有比较明显的缺点。就是需要高带宽,会造成日常成本高;最头痛的是基于存储的方案是无法保证,而这一点在Oracle11g Active Data Guard的容灾解决方案是不存在的。

对企业容灾备份系统的一点建议
 经过上述比较,我们可以发现一个好的容灾系统。首先,应具有开放性,不依赖特定硬件系统,支持各种传输介质,如能支持TCP/IP网络则更佳。另外,考虑到容灾能力和应用系统性能的影响,容灾方案不仅要支持近距离的同步数据容灾,还必须能支持远程的异步数据容灾。对于异步数据容灾,数据复制不仅仅要求在异地有一份数据拷贝,同时必须保证异地数据的完整性、可用性。完善的容灾系统应该包括各种实用的灾难恢复手段。

 因为对于企业来说,在建立一个容灾系统之前,首先必须对企业本身的各种数据重要性进行评估,包括灾难造成的直接损失和间接影响,然后决定为此支出多少、投资回报如何,选择最适合自身需求和发展的厂商和方案,避免投资的盲目性。

   以下链接有最新ORACLE BI的资料可以去看看:

   http://wmdata.com.cn/oracle/iwom-bi/index.asp?frm=wangk

 

联系方式:
   QQ:102927545     MSN :wangk1026@hotmail.com    Email:wklx1119@sina.com

Tags:

星期四, 02月 26th, 2009 未分类 没有评论