消息服务Matrix.org遭遇RAID阵列故障导致55TB数据库损坏 持续1天后已恢复
去中心化消息服务Matrix.org因RAID阵列故障损毁55TB数据库,耗时24小时恢复。RAID故障常见,需定期备份数据以防意外。 2025-9-4 02:16:6 Author: www.landiannews.com(查看原文) 阅读量:2 收藏

#科技资讯 去中心化分散消息服务 Matrix.org 遭遇 RAID 阵列故障后损毁数据库,花费 1 天时间将 55TB 数据库恢复后服务才恢复正常。RAID 阵列故障导致数据损毁的案例并不少见,所以日常使用时还是得及时备份数据,不能将 RAID 当作备份手段。查看全文:https://ourl.co/110509

RAID 阵列故障导致数据损坏的案例并不少见,日前知名的去中心化分散消息服务 Matrix.org 使用的服务器就遭遇 RAID 阵列故障,故障的是主服务器以至于使用该平台的开发者都无法正常收发消息。

需要明确的是对于拥有自己的专属主服务器的客户例如政府组织不受影响,其他任何使用 Matrix.org 作为主服务器的用户都受影响,以至于无法收到任何消息。

消息服务Matrix.org遭遇RAID阵列故障导致55TB数据库损坏 持续1天后已恢复

Matrix.org 主服务器托管着大型 PostgreSQL 数据库,这份数据库包含的数据约为 55TB,在故障发生后团队开始处理并想方设法从源数据和备份数据中恢复数据库。

此次故障的发生时间是 2025 年 9 月 2 日 17:39 UTC,直到 9 月 3 日 17:03 UTC 才恢复正常,也就是持续时间将近 24 小时,期间无数开发者受到此次故障的影响。

在实际故障中最初 Matrix.org 的二级数据库由于 RAID 故障而丢失文件系统,随后主数据库也开始跟着崩溃,接着 Matrix.org 支持团队承认事情有点不对劲。

接下来就是着手修复 RAID 阵列故障和恢复数据库,这个过程花费了超过 15 个小时,在初步恢复正常后 Matrix.org 还需要将中断期间的消息逐渐释放出来。

Matrix.org 是免费的因此也没有服务水平协议 (SLA),如果开发者自己搭建了服务器那不受影响,所以如果依赖 Matrix.org 的去中心化服务器,那也要做好可能发生中断的准备。

山外的鸭子哥

山外的鸭子哥

蓝点网站长,如果发现本文存在错误或错别字,欢迎在评论区留言,收到消息后我将及时修改。其他事宜请点击本站任意页面底部的「与我们联系」获取邮箱。

2.42W759.08M1.65W10.19M¥30


文章来源: https://www.landiannews.com/archives/110509.html
如有侵权请联系:admin#unsafe.sh