一场大火,让云计算巨头的数据中心化为灰烬!10 万Rust 游戏玩家的数据永久丢失,无法恢复
数据中心起火事件频频发生,这次 OVH 数据中心被大火烧毁又堪称是数据中心历史上史无前例的灾难性事件,数据中心到底该如何保护呢?
作者 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
报!请注意,你的数据正在燃烧,且无法恢复!
昨日凌晨,位于法国斯特拉斯堡的 OVH 数据中心被大火烧毁。据悉,火灾导致多个数据中心无法服务,大量客户网站瘫痪,部分客户数据完全丢失且无法恢复,这是数据中心历史上史无前例的灾难性事件。
多家公司受此影响,其中游戏制造商 Rust 更是损失惨重,失去了所有欧洲服务器,储存在服务器上的数据全部丢失。
(图片来自 DataCenter Knowledge)
大火摧毁了数据中心
首先简单介绍一下 OVH。OVH 全称为 OVH Groupe SAS,是法国的云计算公司,提供 VPS(Virtual Private Server,虚拟专用服务器)、专用服务器和其他 Web 服务。
作为欧洲最大云服务和托管服务提供商,同时也是全球第三大托管服务提供商,OVH 拥有全球最大表面积的数据中心,是除了云提供商三巨头(AWS,Azure 和 Google Cloud)之外,最受欢迎的云提供商之一。
可就在 10 号凌晨,这家法国大型网络服务商位于下莱茵省首府斯特拉斯堡的数据中心突然起火,当地消防部门动用了上百名消防员才得以将大火扑灭。
不过,火势是灭了,有些数据却回不来了。
据了解,OVH 位于斯特拉斯堡的法国数据中心共有四个:SBG1,SBG2,SBG3 和 SBG4,而这场大火完全烧毁了 SBG2 数据中心和部分 SBG1,UPS(Uninterruptible Power Supply,即不间断电源) 放置在 SBG3 中,而 SBG4 数据中心没有受到影响。
事发几小时后,OVH 官网首页不见数据中心 SBG2 和 SBG3 的身影,只剩下了 SBG1 和 SBG4。
随后经过一天的整理,今日 OVH 在其官方状态页面更新了事件最新进展:
1.欧洲中部时间 2021 年 3 月 10 日星期三 00:47,我们位于斯特拉斯堡的四个 OVHcloud 数据中心(SBG2)中的一个房间发生了火灾;
2.凌晨已控制住火势;
3.没有人员伤亡;
4.大火主要摧毁了 SBG2 数据中心,损坏了部分 SBG1 数据中心(12 个房间中有 4 个被烧毁)。另外两个 OVHcloud 数据中心没有受到火灾的影响;SBG3 和 SBG4 服务器当前处于关闭状态,但没有损坏;
5.火灾原因尚未确定,当局已授权展开调查。
OVH 创始人兼董事长 Octave Klaba 也在推特同步更新事件进展,并建议客户激活灾难恢复计划。此外,他还宣布了公司的下一步计划:预计 15 日恢复 SBG1 和 SBG4 的电力,19 日恢复 SBG3 的电力。
全球多家公司受到影响
这场大火对 OVH 的众多客户公司可真是“飞来横祸”。
火灾导致多家公司的 Web 服务突然无法访问,目前已知受影响的公司包括:
网络威胁情报公司 Bad Packets、免费象棋服务器 Lichess.org 提供商,视频游戏制造商 Rust, 加密货币交易所 Deribit 的博客和文档网站,电信公司 AFR-IX,加密工具 VeraCrypt, 新闻媒体 eeNews Europe 等等。
其中视频游戏制造商 Rust 在这场大火中的损失尤为惨重。作为一款生存冒险游戏,Rust 是 Steam 平台最受欢迎的网络游戏之一,每天的同时在线玩家数超过 10 万。
可因为这场突如其来的大火,Rust 失去了所有欧洲服务器,丢失的数据也无法恢复。Rust 官方在推特上表示:“我们已经确认在 OVH 数据中心大火期间,受影响的 EU 服务器全部丢失。我们正在尝试更换受影响的服务器,但数据无法恢复。”
目前通过更换服务器与官方人员抢修,Rust 部分欧服已回复连接,所有游戏进度均已重置。
频频起火的数据中心
虽然本次 OVH 数据中心火灾原因尚未明晰,但数据中心起火早已不是新鲜事。
由于数据中心设备众多,功率大、耗电量大,同时机房线缆多、布线复杂,这些原因促使数据中心频频发生火灾,以下举例几起相关事件:
2014 年,重庆农商行数据中心发生重大火灾,机房全部烧毁,损失高达一亿以上;
2015 年 1 月,亚马逊正在美国弗吉尼亚州建设的一座数据中心着火;
2015 年 10 月,由于服务器所在机房着火断电,引起 WindowsAzure 上海数据中心发生故障,导致 Azure 基础设施离线无法提供正常服务;
2018 年,总投资额为 220 亿元的青岛惠普大数据中心发生起火事件;
2020年,澳洲电信 Telstra 位于英国首都伦敦的托管数据中心发生火灾并引起宕机;
3 月 9 日,全球知名加密数字钱包平台 Blockchain 出现异常,多用户无法使用相关服务,而昨日 Blockchain 公开确认,此次服务中断的原因是因为旗下数据中心出现火灾。
这些频繁发生的起火事件,反映出了数据中心运行面临的最大问题之一——散热。因此比起用在服务器上的电力,现实情况是每个数据中心都将大量的能源消耗在服务器的冷却方面。
数据中心该如何保护?
为了降低在服务器散热上耗费的能源,许多互联网大厂直接将数据中心建在了水源附近或高纬度地区:
2015 年,阿里巴巴的千岛湖数据中心正式启用,采用湖水制冷技术节省超 80% 的能源;
微软更彻底,2018 年将数据中心直接放入大海,在去年捞出来后还得到了意外的收获:水下数据中心的服务器故障率比传统数据中心更低;
Facebook 将数据中心设立于接近北极圈的瑞典北部城市吕勒奥,通过几个巨型风扇引入室外的极地冷风实现服务器降温;
腾讯云贵安七星数据中心也设立在了贵州阴凉的山洞之中,实现自然散热通风。
因地制宜建造数据中心固然是个好办法,但这种条件也并非每个数据中心都拥有,因此对于大部分数据中心来说,做好平日的应急措施才是王道。
对此,CSDN 询问了数据中心方面的专家,他们都表示异地容灾备份是避免数据完全丢失的关键:
“异地 IDC 实时数据同步还是很有必要的。”
“异地灾备是标配。”
对此,你有什么看法吗?欢迎评论区留言
————————————————
版权声明:本文为CSDN博主「CSDN资讯」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/csdnnews/article/details/114693606