云计算、虚拟化技术广泛运用的今天,为业务进行和维护带来方便的同时,数据中心也面临各种威胁和风险。云祺根据全球业务中断事件,以及真实案例总结出,常见的导致数据中心业务中断的三大原因。
一 硬件故障
包括服务器/存储宕机、Raid系统停止工作、内存虚拟驱动器受损等原因。
某云服务商因硬件故障导致服务器不可用数据丢失,联系服务器提供商和多家专业数据恢复公司紧急恢复后,仍多次恢复失败,最后确认数据无法恢复。
随着硬件系统发展的成熟度,针对硬件冗余方案较完善,比如双机热备、存储双活、虚拟化方式等,因硬件故障发生业务中断的事件概率不断下降。
二 逻辑错误
逻辑错误又包括了软件原因和人为原因。软件原因有应用系统出现错误、文件系统崩溃、数据库逻辑故障、病毒入侵等。人为原因有数据误删除、虚拟设备被删除、恶意操作等。
某银行电脑脱机致网络瘫痪,业务中断三小时;某公司被勒索病毒入侵,巨额勒索金额下,不得不“牺牲”业务数据;某云服务商遭员工恶意删除数据库,影响百万用户,预计赔付1.5亿元…
逻辑错误是导致数据丢失、业务中断事件发生的重要原因。
三 自然灾害
比如发生火灾、地震、暴雨等意外与自然灾害。
亚马逊位于弗吉尼亚的US-East-1数据中心因为一场风暴导致业务瘫痪,由于数据中心停止运行,亚马逊的云服务Amazon Web Services也因此一度中断服务;某学校机房在一场连续暴雨中意外进水,数据中心直接被毁…
此类事件发生概率小,但具有无法预测性,且一旦发生则是无法挽救。
总结以往业务中断的安全事件就能发现,一旦数据中心因各种原因造成业务中断的情况发生,将严重影响企业业务的正常运营,不仅使用户体验差,影响企业品牌声誉,甚至可能导致直接经济利益损失。无论是独受其害还是波及他人,企业的业务中断和数据丢失带来的损失都是不可估量的。
所以如何保证数据中心的业务连续运营是数据中心管理者们首先要考虑的重要问题。那么如何才能有效保证数据中心的业务连续性?云祺建议:
一 建 立 专业的 容灾备份 系统
信息系统属于企业重要的信息基础设施,对于信息系统安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转。云祺为重要业务系统提供虚拟机、数据库、文件的定时备份、实时备份、异地备份、恢复等容灾备份解决方案,保障用户业务系统高可用。
二 定期灾难恢复演练
从用户终端到服务器、存储器、甚至包括机房环境,需要做定期灾难恢复演练。灾备预案、预案演练、预案维护,风险和灾难规避评估、确定整体恢复策略,通过这些活动可以将数据中心业务中断的风险有效降低。
云祺容灾备份解决方案在生产环境中构建一个隔离的、可验证的灾难恢复演练区域,在不影响现有生产环境的前提下,用户可将多个已备份的级联关键业务虚拟机配置到同一个灾难演练预案中,通过可视化的配置和操作即可快速的执行整个灾难演练计划,从而确保了灾难发生时,能够正确的恢复关键业务,同时实现备份数据的完整性、一致性、可用性验证。
建立专业、可靠的灾备系统和业务连续性体系不仅仅是规范企业自身的IT建设,更是用户除了产品质量需求以外,对企业服务质量又一重要诉求。