Crowdstrike更新出錯 微軟大當機影響全球

微软从昨天 (7/19)陆续出现服务不稳定情形,包含Microsoft 365、OneNote、OneDrive、SharePoint等服务,甚至不少使用Windows作业系统的PC、数位看板及结帐系统等设备也出现当机、重启情况,导致不少使用微软服务的业者受到影响,而背后原因则是被归咎在网路安全业者Crowdstrike的端点侦测及回应 (EDR)产品软体更新所致。

此波影响成为今年目前为止最大网路事故,而CrowdStrike目前仅公告其工程团队仍在解决问题,但尚未具体说明造成全球性当机的实际原因,以及后续如何解决与何时能将相关问题改善。

不少看法更认为,此波造成影响几乎等同2000年的「千禧虫危机」原先预想可能产生冲击 (注)。

注:「千禧虫危机」即早期电脑系统的时间年份仅以后两位纪录,因此当时发现一旦进入2000年后,电脑系统年份将会出现被误判为1900年的情况,当时推测将影响重要产业中的电脑设施执行程式,以及大量社会基础设施运作,导致城市运作瘫痪,甚至可能造成核电厂发生事故、军事系统失控等灾难影响。最终是经历规模庞大的修复调整,使得进入2000年时并未引发全球性的电脑系统大规模瘫痪。

而造成此次事故的CrowdStrike,总部位于美国加州,于2011年由George Kurtz、Dmitri Alperovitch与Gregg Marston共同创立,本身为网路安全公司,主要提供客户端安全防护、威胁分析与事故回应等服务,并且以主动侦测及防御技术闻名。

造成此次微软服务全球规模影响,CrowdStrike声明是其服务更新出错,其中可能影响微软Azure云端服务平台工作负载配置,导致全球各地区的微软服务、Windows装置受影响。微软方面则确认此次问题发生地点位于美国中部的Azure区域资料中心,同时已经着手进行抢修。

至于在此次影响之下,除了不少人反应其使用微软相关服务均无法正常运作,许多Windows装置也出现当机、重启情形,而包含美国航空、联合航空、台湾虎航、捷星、酷航等航空业者均受到影响,同时诸如台大医院、台北荣总等医院电脑系统也都受到影响,但部分情形已经在后续恢复正常运作。

以色列资讯安全公司CyberArk技术长Omer Grossman推估,此次CrowdStrike发生问题可能造成无法透过远端更新,必须透过手动方式逐一恢复端点问题,因此可会需要几天时间才能让整个系统恢复正常,因此CrowdStrike未来几天的问题分析结果与更新作法将会备受关注。

此次影响最主要是微软旗下服务受到冲击,因此并未影响使用Google Cloud、AWS等其他云端服务,或是采用Mac、Linux等作业系统平台的业者,但由于目前有相当多业者均使用微软服务,因此受到影响情况依然相当庞大。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》