2025年10月20日的早上,全球互聯(lián)網(wǎng)仿佛被“拔掉了電源”。銀行App無(wú)法登錄、航班系統(tǒng)停滯、智能門(mén)鈴不再響應(yīng)、視頻會(huì)議陷入沉默,對(duì)整個(gè)數(shù)字世界而言,這是一次真正的“停擺”。
而這場(chǎng)混亂的源頭,并非來(lái)自黑客攻擊,也不是外部入侵,而是——亞馬遜云服務(wù)(AWS)的一次普通技術(shù)更新。短短15小時(shí),數(shù)十個(gè)網(wǎng)站、銀行和應(yīng)用程序陷入中斷,波及數(shù)百萬(wàn)用戶。
BBC
這場(chǎng)事故像是一面鏡子,讓人們第一次真切地意識(shí)到:我們的世界,究竟有多依賴(lài)那“看不見(jiàn)的云”。
1
一次更新引發(fā)的全球停擺
亞馬遜云服務(wù)的這次中斷,持續(xù)了約15小時(shí),問(wèn)題始于AWS位于弗吉尼亞州北部的主要數(shù)據(jù)中心,AWS是全球最大的云計(jì)算提供商,提供各種服務(wù),包括存儲(chǔ)、數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)和安全工具,它為許多政府部門(mén)、大學(xué)和企業(yè)提供幕后云計(jì)算基礎(chǔ)設(shè)施。
DynamoDB則是AWS的一項(xiàng)核心數(shù)據(jù)庫(kù)服務(wù),為數(shù)以萬(wàn)計(jì)的在線平臺(tái)存儲(chǔ)用戶信息和其他關(guān)鍵數(shù)據(jù)。
當(dāng)天,工程師在對(duì)DynamoDB數(shù)據(jù)庫(kù)服務(wù)的API進(jìn)行例行技術(shù)更新時(shí),一個(gè)看似微小的錯(cuò)誤,觸發(fā)了連鎖反應(yīng)。域名系統(tǒng)(DNS)出現(xiàn)解析故障,互聯(lián)網(wǎng)“電話簿”無(wú)法將網(wǎng)站名稱(chēng)轉(zhuǎn)換為對(duì)應(yīng)的IP地址——這意味著,應(yīng)用程序再也找不到該去的服務(wù)器。
NCB News
DynamoDB一旦出問(wèn)題,依賴(lài)它的其他服務(wù)就像多米諾骨牌一樣接連倒下。短短幾個(gè)小時(shí)內(nèi),113項(xiàng)服務(wù)受到波及,涉及從數(shù)據(jù)庫(kù)、虛擬機(jī)、存儲(chǔ)到網(wǎng)絡(luò)分發(fā)的整個(gè)AWS生態(tài)。
結(jié)果是顯而易見(jiàn)的:全球數(shù)百萬(wàn)用戶陷入“云端斷線”狀態(tài)。
這次中斷持續(xù)約15小時(shí),是AWS自2021年以來(lái)最嚴(yán)重的一次事故。
Aljazeera
社交媒體和通訊服務(wù)首當(dāng)其沖:Snapchat、Pinterest、WhatsApp、Signal、Zoom、Slack等平臺(tái)集體“啞火”;
游戲平臺(tái)陷入癱瘓,Roblox、Fortnite、Xbox服務(wù)器相繼掉線;
Venmo、Coinbase等金融應(yīng)用出現(xiàn)故障,部分銀行App無(wú)法轉(zhuǎn)賬或登錄;
達(dá)美航空、聯(lián)合航空等航司的官網(wǎng)與移動(dòng)應(yīng)用停擺,大量乘客無(wú)法在線值機(jī),一些航班甚至因地面系統(tǒng)失靈被迫滯留;
智能家居用戶的Ring門(mén)鈴、Alexa音箱、Kindle下載功能全線失效,英國(guó)政府網(wǎng)站Gov.uk與稅務(wù)海關(guān)系統(tǒng)也報(bào)告了訪問(wèn)異常。
BBC
根據(jù)網(wǎng)絡(luò)監(jiān)測(cè)平臺(tái)Downdetector的統(tǒng)計(jì),僅在美國(guó),相關(guān)投訴量在兩小時(shí)內(nèi)便突破2萬(wàn)條。受影響的網(wǎng)站還包括OpenAI、Apple Music、迪士尼+、《紐約時(shí)報(bào)》 等主流平臺(tái)。可以說(shuō),這不是一次公司級(jí)的技術(shù)問(wèn)題,而是一場(chǎng)全球互聯(lián)網(wǎng)的“流感”。
AWS在事故發(fā)生后迅速啟動(dòng)緊急響應(yīng),表示工程師已“全力并行推進(jìn)恢復(fù)”。約三小時(shí)后,部分服務(wù)恢復(fù)運(yùn)行。公司強(qiáng)調(diào),仍有“大量滯留數(shù)據(jù)等待處理”,并承諾將發(fā)布事后技術(shù)總結(jié)報(bào)告。
2
技術(shù)依賴(lài)的另一面
如今,幾乎所有我們熟悉的網(wǎng)絡(luò)活動(dòng)——從視頻會(huì)議到網(wǎng)購(gòu),從智能家居到金融支付——背后都有AWS、Microsoft Azure或Google Cloud的身影。AWS更是其中的巨頭,占據(jù)全球云市場(chǎng)超過(guò)30%的份額。這意味著,當(dāng)AWS打噴嚏時(shí),整個(gè)互聯(lián)網(wǎng)都會(huì)發(fā)燒。
Aljazeera
專(zhuān)家指出,這次宕機(jī)造成的經(jīng)濟(jì)損失,可能高達(dá)數(shù)百億美元甚至上千億美元。但金錢(qián)并不是唯一的損失,更令人擔(dān)憂的是:全球數(shù)字系統(tǒng)的集中化依賴(lài),正在成為新的“系統(tǒng)性風(fēng)險(xiǎn)”。BBC報(bào)道將AWS事件稱(chēng)為“典型的集中化危機(jī)”——當(dāng)數(shù)以百萬(wàn)計(jì)的企業(yè)、政府與機(jī)構(gòu)都依附在同一朵“云”上時(shí),任何一處技術(shù)故障都可能掀起全球連鎖反應(yīng)。
這并非孤例。2024年,網(wǎng)絡(luò)安全公司CrowdStrike的一次錯(cuò)誤更新,就曾讓全球機(jī)場(chǎng)航班延誤、企業(yè)系統(tǒng)崩潰,造成數(shù)十億美元損失。
如今的互聯(lián)網(wǎng)世界,早已不是去中心化的“自由網(wǎng)絡(luò)”,而更像是一張由少數(shù)幾家巨頭織成的“數(shù)字蜘蛛網(wǎng)”。我們享受著云計(jì)算帶來(lái)的便利、速度與成本效益,卻也在不知不覺(jué)中,把命脈交給了同一個(gè)“上帝視角”。
Simplilearn
亞馬遜云的優(yōu)勢(shì)在于集中、標(biāo)準(zhǔn)化、高效,但這也正是它的弱點(diǎn)。一位業(yè)內(nèi)經(jīng)濟(jì)學(xué)家打趣道:“AWS的強(qiáng)大,就像電力公司。如果停電,整個(gè)城市都會(huì)黑。”
對(duì)企業(yè)來(lái)說(shuō),遷出AWS幾乎不現(xiàn)實(shí)——成本太高、生態(tài)太深。對(duì)政府來(lái)說(shuō),自建云平臺(tái)的想法雖有吸引力,但技術(shù)與資金門(mén)檻極高。然而,這次事件再次證明:依賴(lài)不等于安全,規(guī)模不等于穩(wěn)定。
3
數(shù)字世界的未來(lái)思考
還記得去年那場(chǎng)突如其來(lái)的“微軟藍(lán)屏”風(fēng)暴嗎?那天,不少人還在辦公室埋頭加班,電腦屏幕突然一片藍(lán),只剩下一行無(wú)情的提示——“你的電腦遇到問(wèn)題,需要重啟”。許多上班族索性放下鼠標(biāo),提前開(kāi)始了“Happy Friday”。
事后,微軟發(fā)布公告稱(chēng),其旗下的Microsoft 365服務(wù)出現(xiàn)訪問(wèn)中斷,受影響的應(yīng)用包括Office套件、Xbox等。而問(wèn)題的源頭,就來(lái)自一家名叫CrowdStrike的網(wǎng)絡(luò)安全公司。
CrowdStrike隨后在支持平臺(tái)上承認(rèn),公司推出的一次“內(nèi)容部署(content deployment)”更新出現(xiàn)問(wèn)題,引發(fā)了Windows系統(tǒng)的崩潰。一個(gè)微小的代碼漏洞,瞬間讓整個(gè)世界陷入停頓。
CNN
首先受災(zāi)的是航空業(yè)。全球超過(guò)1000趟航班被迫取消,多個(gè)國(guó)際機(jī)場(chǎng)陷入系統(tǒng)癱瘓。數(shù)以萬(wàn)計(jì)的旅客滯留機(jī)場(chǎng),票價(jià)暴漲、賠償無(wú)門(mén)。
醫(yī)療系統(tǒng)同樣遭受重創(chuàng)。在英國(guó),許多全科診所的醫(yī)生無(wú)法訪問(wèn)患者記錄,預(yù)約系統(tǒng)全面癱瘓。藥房拿不到處方,患者領(lǐng)不到藥。
甚至連新聞媒體也未能幸免。英國(guó)Sky News早間節(jié)目中斷,澳大利亞Channel 10、ABC電視臺(tái)的播出也出現(xiàn)中斷。
金融市場(chǎng)方面,倫敦證券交易所數(shù)據(jù)更新受阻,歐洲多國(guó)股市下跌。法國(guó)、德國(guó)、西班牙、瑞士的主要指數(shù)齊齊“跳水”,超市、零售業(yè)同樣混亂不堪——許多收銀系統(tǒng)無(wú)法使用,只能回到現(xiàn)金支付。
而這一切的背后,是我們對(duì)技術(shù)的高度依賴(lài)。CrowdStrike是全球最大的網(wǎng)絡(luò)安全公司之一,占據(jù)整個(gè)行業(yè)約24%的市場(chǎng)份額。也就是說(shuō),全球四分之一的企業(yè),其信息安全系統(tǒng)與這家公司息息相關(guān)。
再加上昨天發(fā)生的這件事,提醒了我們:科技讓世界更高效,卻也讓系統(tǒng)更脆弱。一個(gè)微小的程序錯(cuò)誤,就能讓醫(yī)院無(wú)法看診、飛機(jī)停飛、新聞停播、超市癱瘓。想想也是挺嚇人的......
我們到底把多少社會(huì)運(yùn)轉(zhuǎn)的關(guān)鍵,交給了那些遙遠(yuǎn)的“云”?
ECE
也許,未來(lái)我們?cè)撝匦聦徱暋叭ブ行幕钡膬r(jià)值。分布式云、多云架構(gòu)、本地備份、區(qū)域自治……這些曾被視為昂貴、復(fù)雜的方案,或許正是抵御下一次數(shù)字風(fēng)暴的關(guān)鍵。
當(dāng)我們?cè)絹?lái)越依賴(lài)數(shù)字化,就更該思考:如何讓這個(gè)世界,即使在被“拔掉電源”的那一刻,也能繼續(xù)呼吸。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.