WebNX数据中心因着火而瘫痪,殃及客户。4月4日,停电引发了主机托管公司WebNX位于犹他州的奥格登数据中心着火,这个数据中心暂时瘫痪,导致几台服务器亟需重新搭建。美国奥格登市消防局局长KevinBrown称消防员在周日晚上接到电话后就出警了。他说,大火起源于数据中心大楼的一台发电机,后蔓延至多台服务器。由于数据中心火灾,奥格登市的一些IT服务在周日和周一都瘫痪。

一、起火原因与这有关

WebNX在Facebook帖子中将这起事件归咎于本地停电后备用发电机发生故障。该公司表示:“周日下午,奥格登市出现停电;按照设计,我们的备用发电机自动开启。可是就在这个供电切换期间,我们最近专门针对这种情形进行了常规测试和基准测试的一台备用发电机遇到了灾难性故障,着火了...“,因而启动了灭火程序。”该公司证实奥格登数据中心遭受了一定程度的损坏。之前的声明特别指出:“由于遭受水的损坏,一些服务器需要重新构建,因此停机时间将延长。这些重建很有可能保证数据完好无损。”该公司表示:“客户放在我们一个主托架上的服务器碰到了水,可能已造成损坏。大火本身对客户服务器倒没有造成损坏。”数据中心中的大多数硬件似乎都没有受到影响,但是有些机器需要检查是否遭到水的损坏、因而是否可能需要重建。该公司称:“眼下,我们正在竭力恢复电源、网络和未受影响的硬件,争取在一两天内恢复正常。”

二、近年来,数据中心频频起火

近年来,大型数据中心频频起火:

而就在今年3月份,欧洲云计算巨头OVH位于法国莱茵省首府斯特拉斯堡的数据中心发生严重火灾。OVH一家游戏公司客户表示,大量玩家数据已经因火灾丢失,且无法恢复。

OVH是欧洲最大云服务公司之一,在该区域拥有4个数据中心,目前已经全部暂停服务。据悉,最先起火的SGB2数据中心被完全烧毁,SBG1建筑物部分受损,SBG3因受到消防保护暂未受影响,以及SBG4确认没有受到波及。

本次火情,疑似部分客户设备主用、灾备服务器在一个机房楼或者主备云服务器在一个机房楼,导致约万网站出现故障,约1.5万名客户的资料可能受到影响,部分客户数据完全丢失且无法恢复。

不止这些,年8月,澳洲电信Telstra位于英国首都伦敦的托管数据中心由于UPS故障引起火灾并引起宕机。当地消防部门共调集了4辆消防车和25名消防员到场救援。

年7月,某地市的一家移动公司大楼机房失火,现场浓烟滚滚,火情严重。该大楼地处市中心,是这个地市移动较大的机房,下面的营业厅也曾经是最大的营业厅。

年11月,韩国三大电信运营商之一KT位于首尔市中心的大楼发生火灾,事故原因为地下电缆隧道起火。火灾烧毁16.8万股电话线和套光缆。由于通信设备受损,此次事故导致韩国的警察、医院、金融等社会基础设施被迫停转。、、、着火的数据中心,仍然有很多,着火的原因也是各不相同,给企业、给社会带来的损失都是巨大的。

三、如何预防数据中心着火?

数据中心机房作为海量数据的关键载体,是信息化的核心场所,其复杂性、特殊性和重要性不言而喻,但往往数据中心机房又是如此的脆弱。数据中心机房的安全是整个计算机信息系统安全的前提,如果数据中心机房存在这样那样的不安全因素,从而导致发生数据中心机房事故,则整个信息系统的安全也就不可能实现。特别是机房火灾,一旦发生将给机房造成不可挽回的巨大损失。

如何做好机房的防火及数据灾备工作?我们结合《信息安全技术网络安全等级保护基本要求》(GB/T-)及实际测评要求,建议如下:

1、防火要求

以等保第三级安全要求为例,防火要求:

机房内设置火灾自动消防系统,可以在发生火灾时,自动检测、报警并灭火,如自动气体消防系统、自动喷淋消防系统。

使用相应耐火等级的建材。耐火建材可以有效阻止火灾的发生和蔓延。

对机房进行区域划分并设置隔离防火措施。区域划分可以很好的阻止火势蔓延,避免造成更多损失。

2、温湿度要求

除了防火措施本身,机房的温湿度也影响防火工作。根据《基本要求》温湿度控制要求:

应设置温湿度自动调节设施,使机房温湿度的变化在设备运行所允许的范围之内。

实际操作中,机房内需要安装空调、除湿机、通风机等设备,使机房内的温湿度变化保持在适宜范围内。通常机房内适宜的温度18~27℃,空气湿度35~75%。

3、安全运维-环境管理

做好硬件设备准备工作后,日常运维中也很重要,应做到:

应指定专门的部门或人员负责机房安全管理维护工作;

对机房出入进行管理、登记,记录包括来访人员、来访时间、离开时间、携带物品等;

定期对机房供配电、空调、温湿度控制、消防等设施进行维护管理,并做好维护信息记录。

4、数据备份与恢复

做好预防管理,不意味着可以一劳永逸,灾难的发生往往是不可预测无法阻挡,而数据备份工作是信息系统正常运行使用的最重要保障。数据备份工作应做到:对重要数据库的本地数据做每天全量备份(或每天增量备份,定期全量备份),定期测试备份数据是否正常可用;应该建设灾备中心,对重要数据提供异地数据备份,保证本地系统发生灾难后不可恢复时,能利用异地备份对数据进行恢复;对重要业务数据处理系统,应当提供热冗余,当发生灾难时可以迅速切换至备用系统,保证业务系统的正常使用。数据备份的类型、储存介质、周期各有不同,可以根据自身的业务状况、重要性、成本等因素选择适合的模式。5、应急预案与应急演练

建议根据不同的火灾风险场景(如UPS、供电线路、柴油发电机失火等),分别制定切实可行的应急预案,并按照桌面演练、模拟演练、实战演练逐步开展应急演练,确保应急预案可靠有效。并定期根据情况进行修订和演练。

除了这些,还应重点加强管理制度的执行。管理制度包括预防维护流程和紧急情况处理预案两个方面。要制定相应的管理制度,包括机房管理岗位制度、机房操作规程等,以明确岗位职责。为应对机房中可能会发生的紧急情况,如火灾、断电、数据丢失、设备失灵等,应按各种紧急情况分列处置措施,还要对预案进行演练。

弱电行业网

转载请注明:http://www.vogkx.com//mjcczl/1082786.html
------分隔线----------------------------