7月27日中午,美团外卖和饿了么这两家外卖平台在中午时分,都相继出现了服务器异常、无法使用的情况。不过,很快两家平台就已全面恢复。
根据网友反应,当时部分用户出现了无法加载页面、无法查看外卖运送的情况,已领的会员兑换券无法使用等等。
美团、饿了么都被吃宕机了?
恰逢周末,可是老天爷却丝毫不减热情呀,每天都是高温高温高温,并且气温一路高歌猛进,直逼40度!
可以注意到,图中山东大部分地区,27号到28号,热到扭曲逐渐被热到融化覆盖,除了沿海地区,山东小伙伴户外可能会热到“大汗淋漓”,体会瞬间融化的感觉。
28日,不仅是东北地区开始跻身加入“热到膨胀”行列,华北,黄淮一带还会从“热到扭曲”过度到“热到融化”。而江南一带,像是湖南、重庆、湖北、江西、浙江等地闷热程度最甚,不仅是白天“热到蒸发”,晚上“蒸笼”的火力也不减,酷热难耐。
如果有条件,谁还不躺在家里来个西瓜加空调呀,可也忙坏了外卖小哥呀!这不,连美团、饿了么都被吃宕机了!
从表面看,订单人数的暴增确实是宕机的原因。但这也是人们的猜测,截至发稿,美团和饿了么官方都并未说明故障发生的原因。值的注意的是,2018年9月,饿了么也曾经历一次大范围故障,原因是订单量过大导致服务器瘫痪。
我想到了什么?
你能想象全球最大的视频分享网站YouTuBe也会出现过大宕机吗?
2018年10月16日晚,YouTuBe出现了大面积宕机,涉及地区包括 美国、欧洲、日本、台湾、大马、澳洲、香港 等地。
用户均出现了网页无法打开、用户无法登陆、视频播放中断等问题,YouTube 网页版和移动版也出现了类似的情况,就连YouTube TV和YouTube Music也深受影响,中断时间超过两个小时。
一切因服务器假死、停用、关闭导致不能正常运行的状态都称之为宕机。
宕机的常见原因有:
1.硬件故障,如硬盘故障,电源故障;
2.黑客攻击;
3.流量负载过大;
4.人为误操作;
5.程序猿删库跑路;
6.地震海啸自然灾害
……
现如今,数据中心已经成为了我们生活当中看不见,但又离不开的存在。它的稳定关系所有人的生活……一旦宕机,后果不堪设想。不仅会造成用户无法正常访问应用,严重的还会造成巨大经济损失。据美国调查机构数据显示,数据中心宕机,能够造成每分钟将近1万美元的经济损失。
事实上,宕机事件是行业普遍现象。其中不乏微软、腾讯、阿里巴巴等互联网巨头。下面咱们就来看看过去几年,世界各国出现的比较经典的宕机事故吧。
1.2018年10月,GitHub意外宕机,事后确认是数据存储系统存在问题。
2.2018年2月18日,总部坐落于张江高科技园区的一家网游公司旗下一款游戏产品服务器突然无法打开,造成约1700万用户无法登陆,持续时间长达8小时之久,公司损失难以估量。事后据犯罪嫌疑人交代,其为报复前公司,于2018年2月18日在青岛家中笔记本电脑上,利用前公司后台服务器漏洞进行入侵,恶意删除游戏数据,导致约1700万用户无法登陆。
3.2018年微软Azure宕机
2018年9月4日 09:29,微软云服务 Azure报告,由于美国中南区数据中心附近发生了雷击在内的恶劣天气事件,导致冷却系统的电压暴增,使得多个 Azure 服务出现连接问题,客户储存在中南区数据中心的资源受到严重影响。
4.2017年9月12日凌晨开始,国内知名网页游戏平台傲天游戏因遭遇大规模ddos流量攻击而导致网站瘫痪。宕机时间超过24小时,
5.2016美国大宕机
美国一向以互联网鼻祖自居,同时其网络防护的安全性也是傲视群雄。可就在2016年10月21日早晨,从美国东部开始,Twitter、CNN、Spotify等大型网站均开始出现无法登陆的现象,最后这一情况蔓延到全美。这也造成了很多用户恐慌,因为原因是服务器遭受了黑客的DDos攻击。
6.2015亚马逊云服务宕机
一般来说,新业务或者大型活动,都会造成大量数据峰值爆发,如果处理不当,数据中心算力不足也会导致宕机。
7.2015支付宝宕机事故
在2015年5月27日,位于杭州市萧山区的一处地下光缆被挖断,该事故导致阿里巴巴的数据中心业务请求中断,直接影响了支付宝的部分用户,出现账户无法登陆或者支付的情况。虽然后来支付宝工程师紧急将其用户请求切换至其他机房,但该事件的影响依然持续了将近5个小时。
8.2013年雅虎邮箱故障
雅虎这家公司对于现在的年轻人可能不太熟悉了,但是在二十年前,可是号称最伟大的互联网公司。2013年10月,在雅虎邮箱的重大功能升级之后,部分用户发现账户中的一些信件不翼而飞了。最开始雅虎公司对自己出现的问题避而不谈,直到当年12月份才不得不承认,是由于服务宕机,导致1%的雅虎邮箱账号出现了故障。据悉,当时邮件通讯受到影响的雅虎用户大约有100万人左右。主要现象是邮件丢失,很多邮件在数月之后依然处于未发送状态。
9.2013纳斯达克宕机
纳斯达克不用说了吧,人尽皆知。在2013年8月22日,其交易所的备用服务器被暴出重大漏洞,使得市场交易中断达3个小时。虽然事后恢复,但依然引起了市场恐慌。作为纳斯达克交易所运营商的OMX集团股票被大量抛售,使得其股价当日最大跌幅超过5%……多么可怕?
在这一事件过后没多久,纳斯达克立马升级了它的证券信息处理器,改进了包括架构、信息安全、故障后恢复方案和性能参数在内的多项设计。
10.2013微信宕机事故
你以为宕机事故在BAT当中是个例?那你就错了。这件事说起来估计很多用户都还记得,在2013年7月22日,微信也出现过一次严重的宕机事故。导致了服务中断达7小时之久。最后调查的结果显示,这是因为一支施工队无意间挖断了通信光缆,造成腾讯华东数据中心网络中断,其服务不得不临时转向华南和华北,使得整体业务全面瘫痪。
11.2012年飓风桑迪带来的“天灾”
服务器宕机除了运维不当的人祸之外,也有天灾的影响。比如在2012年,美国著名的飓风桑迪就造成了全美大范围电力中断。致使部署在纽约的大批服务器“罢工”,包括《赫芬顿邮报》、“嗡嗡喂”和掴客网在内的众多大型知名网站都瘫痪了,给居民的工作和生活造成了严重影响。
12.2009年微软云服务宕机事故
2009年秋天,微软出现的一次云服务宕机事故,主要影响的是T-Mobile Sidekick手机用户。导致的结果是用户的EMAIL无法登陆,日历信息显示出错,与他人联系中断。周期持续长达一周之久……此事件微软最后被用户搞的相当狼狈。
13.2005谷歌遭雷劈
2005年,谷歌位于比利时的数据中心由于遭遇了4次闪电袭击,导致磁盘受损、部分云存储系统断线、数据丢失。后来虽然经过紧急抢修恢复了绝大多数的设备,但仍然有0.05%的磁盘未得到修复,造成其中的数据永久丢失。
宕机了就只能坐以待毙吗?
对运营商来说,可以进行以下处理:
1.宕机不可避免,强化预警机制才能最快发现问题;
2.在第一时间发出公告,让用户有所准备;
3.定期的运维检查当然少不了,不断提高系统可靠性依然是现阶段所有云服务商要努力的事情。