IDC發(fā)布的《邊緣進(jìn)化:從核心到邊緣驅(qū)動成功》(簡稱《報告》)研究報告中指出,79%的受訪企業(yè)認(rèn)為,生成式AI已經(jīng)或?qū)⒃谖磥?8個月內(nèi)對其業(yè)務(wù)產(chǎn)生顛覆性影響,這一比例高于亞太平均水平12 個百分點;此外,37%的受訪企業(yè)已將生成式AI應(yīng)用部署到生產(chǎn)環(huán)境,另有61%的企業(yè)正處于技術(shù)測試與概念驗證階段,這意味著,在AI落地過程中,企業(yè)已從“PPT階段”進(jìn)入“實戰(zhàn)階段”。
回顧生成式AI的發(fā)展歷程,2023~2024年的核心關(guān)鍵詞是“大模型參數(shù)競賽”,彼時企業(yè)追求“千億級參數(shù)”,以及“多模態(tài)能力”;而當(dāng)時間來到2025年,關(guān)鍵詞已轉(zhuǎn)向“場景落地”,如何讓AI真正解決業(yè)務(wù)問題,成為企業(yè)的核心訴求。
在此過程中,亞太地區(qū)(APAC)的企業(yè)正意識到,僅靠集中式云架構(gòu)無法滿足日益增長的規(guī)模、速度和合規(guī)性需求。企業(yè)必須重新思考和加強(qiáng)基礎(chǔ)設(shè)施策略,將邊緣服務(wù)納入其中,以保持競爭力、滿足合規(guī)要求,并為實際的人工智能部署做好準(zhǔn)備。
“未來企業(yè)亟需構(gòu)建現(xiàn)代化數(shù)字基座,該基座整合了‘云-核心-邊緣計算’的基礎(chǔ)設(shè)施,將智能服務(wù)部署在更靠近用戶與應(yīng)用的位置?!痹贏I技術(shù)快速發(fā)展的背景下,這是Akamai亞太區(qū)與全球云架構(gòu)師團(tuán)隊總監(jiān)李文濤對于下一代數(shù)字基礎(chǔ)設(shè)施的演進(jìn)方向的定義。
AI重構(gòu)數(shù)字底座
“企業(yè)的數(shù)字化基礎(chǔ)決定了AI落地速度,但現(xiàn)有架構(gòu)正在遭遇瓶頸?!崩钗臐赋??!秷蟾妗窋?shù)據(jù)顯示,中國企業(yè)已形成“公有云依賴”特征——多業(yè)務(wù)環(huán)節(jié)采用公有云承載生產(chǎn)應(yīng)用,而GenAI的崛起正讓這一模式的短板暴露無遺。
在此背景下,企業(yè)首先面對的就是時延的挑戰(zhàn)。據(jù)了解,37%已部署GenAI的企業(yè)中,超60%反饋“實時交互類應(yīng)用響應(yīng)延遲超預(yù)期”。以電商虛擬試衣間為例,用戶上傳圖像后需等待核心云完成AI推理,單次交互延遲常達(dá)2-3秒,轉(zhuǎn)化率較預(yù)期下降40%;
除了時延的挑戰(zhàn)是大多數(shù)企業(yè)在落地企業(yè)級AI過程中的痛點之外,成本也是讓很多企業(yè)面對AI應(yīng)用“望而卻步”的關(guān)鍵因素。AI推理產(chǎn)生的海量數(shù)據(jù)回傳至核心云,導(dǎo)致帶寬成本激增。
除此之外,在出??缇抽_展業(yè)務(wù)的過程中,72%的出海企業(yè)因“數(shù)據(jù)出境”合規(guī)要求被迫放棄核心云集中處理模式,GenAI涉及的用戶隱私數(shù)據(jù)更成為監(jiān)管焦點。而這點也成為AI應(yīng)用過程中的一大挑戰(zhàn)。
“公有云不是‘不夠好’,而是‘不夠近’,” 李文濤總結(jié),“生成式AI需要‘核心云訓(xùn)練+邊緣推理’的協(xié)同模式。核心云負(fù)責(zé)大規(guī)模模型訓(xùn)練,邊緣負(fù)責(zé)實時推理與用戶交互,這是未來的必然架構(gòu)?!?/p>
邊緣計算興起
基于此,傳統(tǒng)的僅僅依賴公有云的模式,顯然已經(jīng)不能滿足所有企業(yè)擁抱AI的需求。在企業(yè)級AI落地的過程中,企業(yè)的數(shù)字底座也急需重構(gòu)。對此,李文濤表示,為充分釋放生成式AI (GenAI)的潛能,企業(yè)亟需構(gòu)建現(xiàn)代化的“數(shù)字基座”——整合邊緣計算,將智能服務(wù)部署在更靠近用戶和應(yīng)用場景的位置。
在用戶對于新一代數(shù)字基座的需求下,邊緣計算又一次站在了技術(shù)舞臺的中間,成為了企業(yè)構(gòu)建新一代數(shù)字基座的核心技術(shù)之一。邊緣計算正崛起為下一代數(shù)字創(chuàng)新的前沿領(lǐng)域,推動“邊緣演進(jìn)”趨勢,并迫切需要采用變革性方法構(gòu)建高韌性、面向未來的數(shù)字生態(tài)系統(tǒng)?!斑吘売嬎隳軌蛞蕴囟ǚ绞綄崿F(xiàn)基礎(chǔ)設(shè)施的分布式部署,不僅降低實時應(yīng)用的延遲,緩解網(wǎng)絡(luò)不穩(wěn)定帶來的問題,還能讓企業(yè)能夠更快應(yīng)對瞬息萬變的商業(yè)環(huán)境。”李文濤如是說。
而李文濤的觀點已經(jīng)有不少數(shù)據(jù)支持,智研咨詢發(fā)布的《2025-2031年中國邊緣云行業(yè)市場現(xiàn)狀分析及投資機(jī)會研判報告》中顯示,2024年全球市場規(guī)模達(dá)1851億元,中國占比約70%。預(yù)計2029年市場規(guī)模將達(dá)370億元,復(fù)合年增長率22.9%。 ?
此外,《邊緣進(jìn)化:從核心到邊緣驅(qū)動成功》中預(yù)測,2025年,邊緣IT預(yù)計成為大多數(shù)中國企業(yè)IT支出增長最顯著的領(lǐng)域。另一方面,IDC預(yù)測,到2027年,80%亞太地區(qū)的CIO將依賴邊緣服務(wù)支撐AI工作負(fù)載。
以AI推理為例:核心云處理一次電商AI推薦的平均時延約為 200~300ms,而邊緣節(jié)點處理的時延可降至20~50ms;在帶寬成本上,數(shù)據(jù)在邊緣源頭處理可減少70%的核心云傳輸量,某制造企業(yè)測算顯示,這一調(diào)整每年可為其節(jié)省近百萬的帶寬費用。
對此,李文濤表示,“中國企業(yè)的數(shù)字化基礎(chǔ)與AI創(chuàng)新能力已處于全球第一梯隊,而邊緣計算將成為其把技術(shù)優(yōu)勢轉(zhuǎn)化為商業(yè)勝勢的關(guān)鍵。而到2027年,80%的CIO將用邊緣服務(wù)替代傳統(tǒng)云的部分功能,這不是選擇,而是必然?!?/p>
當(dāng)前,企業(yè)正加速采用邊緣計算來支撐其數(shù)字化運(yùn)營,確保在與核心或云端資源斷開連接時的業(yè)務(wù)連續(xù)性。在李文濤看來,這一現(xiàn)象凸顯出在多樣化的運(yùn)營環(huán)境中,為了實現(xiàn)無縫功能交付與業(yè)務(wù)韌性,企業(yè)對邊緣基礎(chǔ)設(shè)施的依賴性日益增強(qiáng)。
《報告》中顯示,未來18個月內(nèi),邊緣IT投資回向四個方向傾斜,分別是:支持?jǐn)?shù)字化運(yùn)營,如AI、物聯(lián)網(wǎng)及智能監(jiān)控體系;在與核心或云端資源斷開連接時的保障措施;支持偏遠(yuǎn)地區(qū)的業(yè)務(wù)運(yùn)營;降低連接成本。
數(shù)據(jù)來源:IDC
另一方面,多個邊緣應(yīng)用場景正推動生成式AI加速計算資源(如GPU)的部署,用以支持高性能應(yīng)用,并確保可擴(kuò)展性。生成式AI 與邊緣計算的融合,彌合了集中式云資源與分布式邊緣環(huán)境之間的鴻溝,同時保障了可擴(kuò)展性和性能表現(xiàn)。
建設(shè)AI就緒型基礎(chǔ)設(shè)施的“六大支柱”
《報告》中提出的“面向未來數(shù)字基礎(chǔ)設(shè)施六大核心支柱”,被業(yè)內(nèi)視為生成式AI時代的基礎(chǔ)設(shè)施建設(shè)指南。這六大支柱并非孤立存在,而是形成“戰(zhàn)略-技術(shù)-運(yùn)營”的完整閉環(huán),其核心邏輯是“從核心延伸至邊緣”的全域協(xié)同。
支柱一:AI就緒——效率與體驗的雙重提升
AI就緒的核心是“讓基礎(chǔ)設(shè)施適配AI”,而非反之。針對此,企業(yè)需從兩方面突破:一是硬件層的推理優(yōu)化,通過邊緣節(jié)點部署輕量級GPU模塊,使AI推理效率提升3-5倍;
二是應(yīng)用層的個性化支撐,例如零售企業(yè)通過邊緣AI實時分析用戶行為,推送定制化商品推薦,轉(zhuǎn)化率較傳統(tǒng)模式提高58%。
“AI就緒不是技術(shù)堆砌,而是業(yè)務(wù)場景的深度匹配?!崩钗臐龔?qiáng)調(diào)。
支柱二:GenAI部署——從“大模型競賽”到“邊緣適配”
《報告》中指出,GenAI部署正從“追求參數(shù)規(guī)模”轉(zhuǎn)向“邊緣輕量化適配”。61%處于測試階段的企業(yè)已意識到,千億參數(shù)級大模型無法直接落地邊緣場景,需通過模型壓縮、量化等技術(shù)適配邊緣算力。
硬件投資成為關(guān)鍵突破口。針對此,李文濤建議企業(yè)重點布局三類資源:一是邊緣級GPU,滿足輕量級推理需求;二是異構(gòu)計算芯片,適配多模態(tài)AI任務(wù);三是分布式存儲節(jié)點,支撐邊緣數(shù)據(jù)的實時處理。
支柱三:現(xiàn)代化邊緣IT——數(shù)據(jù)源頭的價值挖掘
“數(shù)據(jù)在產(chǎn)生的瞬間就已過時”——這一工業(yè)互聯(lián)網(wǎng)領(lǐng)域的名言,在GenAI時代愈發(fā)凸顯。現(xiàn)代化邊緣IT的核心是“在數(shù)據(jù)源頭完成價值提取”,其關(guān)鍵技術(shù)路徑包括:
- 邊緣推理優(yōu)先:將90%的實時AI任務(wù)在邊緣完成,僅將結(jié)果數(shù)據(jù)回傳核心云;
- 邊緣存儲分層:熱數(shù)據(jù)本地化存儲,冷數(shù)據(jù)加密上傳,降低存儲成本;
- 邊緣計算協(xié)同:相鄰邊緣節(jié)點形成“微集群”,應(yīng)對突發(fā)算力需求。
比如,某汽車廠商通過車載邊緣設(shè)備實時處理路況視頻數(shù)據(jù),僅將異常事件(如事故、擁堵)分析結(jié)果上傳云端,數(shù)據(jù)傳輸量減少92%,同時實現(xiàn)自動駕駛系統(tǒng)的毫秒級響應(yīng)。
支柱四:邊緣優(yōu)化架構(gòu)——分布式場景的“協(xié)同中樞”
邊緣優(yōu)化架構(gòu)要解決的核心問題是“分布式資源的統(tǒng)一調(diào)度”。報告指出,企業(yè)常陷入“邊緣孤島”困境——不同區(qū)域的邊緣節(jié)點各自為戰(zhàn),無法形成全局算力網(wǎng)絡(luò)。對此,IDC提出了三層架構(gòu)解決方案:在接入層,支持5G、Wi-Fi6等多網(wǎng)絡(luò)接入,實現(xiàn)終端設(shè)備無縫連接;在算力層,構(gòu)建“邊緣節(jié)點-區(qū)域中心-核心云”三級算力池,動態(tài)分配資源;在管理層,通過統(tǒng)一平臺實現(xiàn)邊緣設(shè)備、算力、數(shù)據(jù)的可視化管控。
支柱五:云端到邊緣——公有云投資的“價值延伸”
“企業(yè)已在公有云投入巨額資源,邊緣部署不應(yīng)是‘另起爐灶’?!崩钗臐龔?qiáng)調(diào),云端到邊緣的核心是“投資復(fù)用與能力延伸”。《報告》數(shù)據(jù)顯示,83%的企業(yè)希望將現(xiàn)有公有云服務(wù)擴(kuò)展至邊緣,而實現(xiàn)這一目標(biāo)的關(guān)鍵是“互聯(lián)互通”。
技術(shù)層面,需突破兩大瓶頸:一是API標(biāo)準(zhǔn)化,實現(xiàn)多云平臺與邊緣節(jié)點的接口統(tǒng)一;二是數(shù)據(jù)一致性,通過邊緣緩存、增量同步等技術(shù)確保核心云與邊緣數(shù)據(jù)同步。
基于此,Akamai與AWS、Azure等主流云廠商的深度合作印證了這一路徑——企業(yè)可將核心云的模型、數(shù)據(jù)無縫同步至Akamai邊緣節(jié)點,無需重構(gòu)現(xiàn)有IT架構(gòu)。
支柱六:自主運(yùn)營——AI驅(qū)動的“自動化運(yùn)維”
當(dāng)邊緣節(jié)點規(guī)模達(dá)到數(shù)千甚至數(shù)萬個,傳統(tǒng)人工運(yùn)維模式已難以為繼。自主運(yùn)營的核心是“用AI管理AI基礎(chǔ)設(shè)施”,其關(guān)鍵能力主要包括:智能監(jiān)控,通過邊緣AI實時監(jiān)測節(jié)點算力、帶寬、溫度等指標(biāo),異常預(yù)警準(zhǔn)確率達(dá)95%;自動調(diào)度,根據(jù)業(yè)務(wù)負(fù)載動態(tài)調(diào)整邊緣與核心云的資源分配,資源利用率提升30%;自愈修復(fù),邊緣節(jié)點故障時自動切換至備用節(jié)點,業(yè)務(wù)中斷時間控制在秒級。(文|Leo張ToB雜談,作者|張申宇,編輯丨蓋虹達(dá))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.