伦敦热!谷歌和甲骨文的数据中心因高温直接挂逼了?

共 1006字,需浏览 3分钟

 ·

2022-07-30 22:51

点击关注公众号,Java干货及时送达

据外媒报道因全球极端的天气,英国出现逼近 40° 的高温,这已经打破英国历史上的温度记录成为最高温度,如此高温竟然让具有工业冷却系统的数据中心也出现罢工,谷歌云和甲骨文云都因为高温几乎同时出现故障。
其中谷歌云数据中心比较惨是在极端高温后冷却系统直接挂掉,于是大量服务器离线影响相当多的客户访问;甲骨文情况稍微好些,甲骨文是监测到服务器温度过高被迫主动切断电源防止硬件损坏,因为是有预期的所以影响小些。
从全球天气来看北半球的极端高温影响的区域非常广,估计近期数据中心热到罢工的消息应该还会出现更多。

谷歌云伦敦数据中心:

根据谷歌提供的事件日志,Google Cloud 西欧 2 数据中心出现冷却故障,随后受影响的机房里服务器离线为防止冷却系统长时间停机后导致更多服务器损坏,谷歌工程团队主动切断部分服务器的电源着手恢复数据。

由于数据都有冗余备份因此客户的数据不受影响,谷歌则通过异地灾备系统恢复数据并将受影响的实例恢复,同时在发生故障后由于硬件资源问题,谷歌也不得不将部分永久磁盘设备以单冗余模式运行以尽快恢复使用。

另外谷歌也临时将伦敦数据中心的抢占式实例关闭 ,最后在中断超过 10 个小时后,谷歌云西欧 2 区重新上线。

甲骨文选择提前切断电源:

根据甲骨文提供的事件日志,甲骨文位于英国南部的也就是伦敦数据中心里出现部分服务器温度逼近临界值,为防止不受控制的硬件故障甲骨文工程团队切断部分基础设施的电源,然后工程团队希望通过冗余设备替换。

这期间包括甲骨文云服务器、虚拟网络连接、云基础设施存储卷、对象存储以及甲骨文集成等诸多服务全部离线。

中断 5 小时(原预计是 1~2 小时)后冷却系统维修顺利数据中心温度回到正常水平,工程团队开始恢复各项服务。最后在中断 11 小时后所有客户的数据和资源重新联网上线,没有自动开机的实例也由甲骨文工程师手动开机。

  

1、相比高人气的Rust、Go,为何 Java、C 在工具层面进展缓慢?

2、让程序员早点下班的《技术写作指南》

3、互联网人为什么学不会摆烂

4、为什么国外JetBrains做 IDE 就可以养活自己,国内不行?区别在哪?

5、微软欲闭源VS Code的C#扩展惹众怒

6、上能写代码,下要“揍”黑客,还有什么不是程序员的“锅”?

点在看

浏览 3
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报