華為云容器管理已然成為全球領(lǐng)導(dǎo)者,把握未來的最好方式,就是自己創(chuàng)造未來。
——導(dǎo)語
01
容器極簡史
滿臉絡(luò)腮胡的程序員Solomon Hykes看上去非常像一個硅谷的原生碼農(nóng),不過他的確是一個骨子里精致的法國人。在一次非正式的硅谷評選中,他被認為是史上最酷的12位程序員;在他的領(lǐng)英頁面上,寫滿了業(yè)內(nèi)人士對他的推崇……而他的主要成就,就是創(chuàng)造了Docker這個劃時代的容器產(chǎn)品。
Docker引發(fā)了延綿至今的容器革命。其中,最具有代表性的,是2013-2014年間,三位Google 工程師結(jié)合Docker容器技術(shù)的發(fā)展趨勢,又得益于Google 內(nèi)部運行了多年的大規(guī)模集群管理系統(tǒng) Borg的技術(shù)積淀,創(chuàng)造出了Kubernetes,其至今仍是容器領(lǐng)域最有影響力的實際行業(yè)示范。
而華為云在世界范圍內(nèi),也堪稱容器技術(shù)堅定的支持者和踐行者。
在Kubernetes規(guī)模化應(yīng)用才剛剛開始的2016 年,華為云的首個容器服務(wù)產(chǎn)品——云容器引擎(CCE)就正式發(fā)布,標(biāo)志著華為云在公有云領(lǐng)域全面布局容器技術(shù),結(jié)合華為在硬件、網(wǎng)絡(luò)和操作系統(tǒng)層面的積累,將 Kubernetes 與自研技術(shù)深度融合而成。
華為云對于容器技術(shù)的應(yīng)用堪稱與世界主流同步,但又逐漸走出了自己的節(jié)奏。
而容器在自身的進步和應(yīng)用實踐的升維方面,也有鮮明的層次感。
從純技術(shù)角度來說,容器技術(shù)在10年中實現(xiàn)了三級跳。
最早的容器技術(shù),主要是實現(xiàn)了部分場景下對虛擬機的替代——后者的應(yīng)用中,每個應(yīng)用獨占一臺虛擬服務(wù)器,就好像搬家時一輛卡車只能裝運一件設(shè)備,雖然隔離徹底,但代價很大;而容器則如同一個標(biāo)準(zhǔn)的集裝箱,自帶規(guī)整的保護層(隔離環(huán)境),無論用什么交通工具運輸,其中的應(yīng)用都能完好無損、直接運行。
容器技術(shù)的再一次進步,是以Kubernetes、CCE為代表的技術(shù)的出現(xiàn)。它們更多像是調(diào)動千百萬個集裝箱的調(diào)度中心,為容器提供自動擴縮容、服務(wù)發(fā)現(xiàn)和故障恢復(fù)等功能。
正是這類技術(shù)的出現(xiàn),容器才從一個單純的開發(fā)工具,升級為一種企業(yè)級的基礎(chǔ)設(shè)施;特別是在2020年后,這類調(diào)動中心開始支持跨云部署,解決了企業(yè)級混合云場景下的管理難題,使容器技術(shù)成為云原生最重要的技術(shù)棧之一。
而后,容器繼續(xù)在微服務(wù)、Serverless、物聯(lián)網(wǎng)語境下的中心-邊緣化部署,以及最新的AI浪潮中發(fā)揮巨大的作用,從而打開了自己生命周期的第三個階段——智能化。
而云容器實踐應(yīng)用的升維過程,也與這個技術(shù)的發(fā)展趨勢若合符節(jié)。
以華為云為例,在云原生技術(shù)重塑企業(yè)IT架構(gòu)的浪潮中,構(gòu)建了覆蓋全場景的容器產(chǎn)品矩陣——云容器引擎CCE兼容Kubernetes,是一切容器應(yīng)用的基石;而云容器實例CCI提供了Serverless化敏捷能力,使得開發(fā)者無需管理服務(wù)器,而按請求量付費,使得無論是注意力資源還是IT資源的利用率都得以大幅度提升;而分布式云原生服務(wù)UCS實現(xiàn)了跨云跨地域的統(tǒng)一治理,三者協(xié)同形成“構(gòu)建-運行-延伸”的完整閉環(huán),不僅兼容Kubernetes生態(tài),更在性能、安全性和全局管理維度實現(xiàn)自我突破。
舉個例子就很容易明白,目前的企業(yè)普遍面臨AI訓(xùn)練、實時視頻處理、電商秒殺等高并發(fā)場景,傳統(tǒng)容器集群常遭遇性能瓶頸,云容器引擎CCE就針對性地開發(fā)出了CCE Turbo,通過100%的把容器網(wǎng)絡(luò)/存儲轉(zhuǎn)發(fā)任務(wù)卸載至智能網(wǎng)卡,充分釋放了CPU資源;又通過使用云原生AI調(diào)度引擎Volcano,通過感知AI、大數(shù)據(jù)、WEB業(yè)務(wù)的不同特征,做到了自動優(yōu)化任務(wù)調(diào)度策略,進而可以實現(xiàn)1萬容器/秒的大規(guī)模并發(fā)調(diào)度能力。
而CCE Autopilot是提供Serverless Kubernetes服務(wù)的利器,它比智能調(diào)度更進一步,使得用戶只用關(guān)注容器應(yīng)用本身,無需管理節(jié)點、集群或擴縮容策略。
容器本身就是一種在內(nèi)核上做精細文章的技術(shù),CCE Autopilot的精細程度可以做到按容器實際運行的CPU秒和內(nèi)存GB計費,使得閑置成本趨近于零;而用戶使用虛擬機技術(shù)時,資源使用率很少能超過50%——相比之下,虛擬機雖然在物理隔離這個單項上仍有一定優(yōu)勢,但其性價比和技術(shù)先進性,與CCE Autopilot的距離猶如傳統(tǒng)燃油車和智能化的新能源汽車,已經(jīng)出現(xiàn)了代差。
更進一步來看,華為云CCI是全球首個基于Kubernetes的Serverless容器服務(wù),通過徹底解耦應(yīng)用與基礎(chǔ)設(shè)施,實現(xiàn)了“零集群管理”,也就是說,用戶無需預(yù)置節(jié)點、維護控制面(如Master/Worker節(jié)點),直接提交容器鏡像即可運行負載。
由于容器技術(shù)的高技術(shù)密集型,筆者很難在一篇小文中對其進行更詳細的解說,我們更應(yīng)該觀察的是容器技術(shù)對云原生時代底層技術(shù)思潮的重大影響,可以簡單分為三個階段;
第一個階段,我稱之為“打包搬家”階段,人們開始把大量的應(yīng)用從傳統(tǒng)的虛擬機架構(gòu)上永久性的搬遷到容器上,實現(xiàn)了此前無法實現(xiàn)的軟硬件解耦,為此后的容器大規(guī)模應(yīng)用于新老IT資源上做好了準(zhǔn)備;
第二個階段,我稱之為從“從個體到群體”的階段,借助自動化的編排調(diào)度技術(shù),容器從開發(fā)工具變成了一種基礎(chǔ)設(shè)施,從而使得更多的企業(yè)和研發(fā)者可以不再關(guān)注運維技術(shù)本身,把注意力集中到應(yīng)用開發(fā)上去,這種“再聚焦”是高維技術(shù)進入成熟期的普遍規(guī)律,推動了微服務(wù)規(guī)?;erverless、邊緣容器運行時、零集群管理等典型云原生+容器技術(shù)的出現(xiàn)和普及;
第三個階段,也是正在發(fā)生的,是容器化的AI時代。它的突出特征,就是不僅能夠讓容器技術(shù)服務(wù)于AI(如大模型訓(xùn)練和推理),也利用機器學(xué)習(xí)等技術(shù)開始使得容器技術(shù)本身實現(xiàn)了高度的智能化,如自動優(yōu)化混合云環(huán)境中的容器部署等,這一階段可以說才剛剛開始,但它未來的光明前途已然顯現(xiàn)。
02
擁抱AI是云原生的未來
在擁抱AI上,華為云已經(jīng)有一些非常前沿性的實踐。
我曾經(jīng)在一篇文中這樣寫道:“AI應(yīng)用將加速降臨在我們的生活中。而AI對基礎(chǔ)設(shè)施的渴求將難以想象。這種背景下,最有效率建設(shè)中國算力基礎(chǔ)設(shè)施的辦法,就是用CloudMatrix384這樣的產(chǎn)品,來統(tǒng)一人們對超級智算服務(wù)器的標(biāo)準(zhǔn)?!?/p>
事實上,Cloud for AI方面,華為云構(gòu)筑CCE智算集群的基石,就是CloudMatrix384超節(jié)點的這樣的超級智算服務(wù)器——其單體能力已經(jīng)極為強大,由此構(gòu)建而成的云原生基礎(chǔ)設(shè)施,更是強到可怕——可提供大規(guī)模超節(jié)點拓撲感知調(diào)度、PD分離擴縮容、AI負載感知的彈性伸縮以及容器極速啟動等能力,大幅加速AI訓(xùn)練和推理,提升AI任務(wù)運行效率。
但更重要的是,CCE智算集群不僅從CloudMatrix384上獲得支持,也從另一個角度肯定了高度集成化的“超節(jié)點”存在的意義,那就是突破傳統(tǒng)服務(wù)器架構(gòu)/集群的性能和擴展性瓶頸,為萬億級甚至更高參數(shù)級的AI模型訓(xùn)練與推理提供全棧優(yōu)化的容器技術(shù)支持,并以一個非常高完成度、集中度的產(chǎn)品形態(tài)來提供。
與此同時,AI技術(shù)也在重塑云服務(wù)體驗,華為云全新發(fā)布的CCE Doer,以AI Agent方式嵌入容器使用全流程,貫穿智能問答、智能推薦、智能診斷等業(yè)務(wù)流程,支持200+關(guān)鍵異常場景診斷,根因定位準(zhǔn)確率超過80%,實現(xiàn)容器集群管理自動化與智能化。
事實上,CCE+CloudMatrix的智算集群方案已成功應(yīng)用于大規(guī)模訓(xùn)練推理實踐場景。
國內(nèi)某互聯(lián)網(wǎng)平臺,在面對日均數(shù)百萬單位的內(nèi)容發(fā)布量的即時審核工作壓力日漸增大,而基于華為云CloudMatrix構(gòu)建了千億參數(shù)大模型訓(xùn)推一體化平臺。通過CCETurbo實現(xiàn)CloudMatrix384超節(jié)點算力智能調(diào)度,海量內(nèi)容即發(fā)即審。
視覺創(chuàng)作平臺美圖,也基于CCE和昇騰云服務(wù),實現(xiàn)多樣化AI算力高效調(diào)度,支持多樣模型/算法部署、推理,保障了美圖的大規(guī)模訓(xùn)練快速迭代,支撐了2億月活用戶即時分享生活美好時刻。
在Serverless領(lǐng)域,華為云云容器實例CCI的極致彈性和性價比的優(yōu)勢都很突出,這一點在中東和北非地區(qū)No. 2的OTT平臺STARZPLAY身上得到了實踐。
STARZPLAY的舊平臺,是非常經(jīng)典的傳統(tǒng)煙囪式架構(gòu),且無彈性能力,在應(yīng)對板球世界杯這種超級賽事時需要投入大量人力做前期準(zhǔn)備,但是伴隨高并發(fā)訪問的持續(xù)增長,“水多加面,面多加水”這種模式已經(jīng)無以為繼。
這時,基于CCI的全棧Serverless方案,被華為云擺在了STARZPLAY面前,并以極速彈性、高效運維的特性打消了遙遠國度客戶的信任,從而幫助STARZPLAY在2024板球世界杯期間,第一次“輕松”的應(yīng)對了百萬級到十億級的彈性訪問需求,并且降低了20%資源成本,在這個新興市場打響了品牌。
03
生態(tài)型塑造未來
華為云從發(fā)布首個容器產(chǎn)品到今天,已經(jīng)匆匆十年。而作為一個令人難忘的生日禮物,8月6日,Gartner正式發(fā)布2025《容器管理魔力象限》報告,華為進入全球領(lǐng)導(dǎo)者象限。
至此,在容器管理領(lǐng)域,華為云已經(jīng)和谷歌、微軟、亞馬遜等全球頂級云廠商站在超級頭部位置。
從某種角度來講,這意味著中國云廠商在和美國競爭全球云計算創(chuàng)新策源地的漫長PK中,贏得至關(guān)重要的一分。
Gartner領(lǐng)導(dǎo)者象限的含金量無需多言,即使像Oracle這樣的世界級廠商也未曾進入,更體現(xiàn)了其評選標(biāo)準(zhǔn)的嚴(yán)格。不過,我們更應(yīng)該分析的是,華為云為何能進入這一象限。
在筆者看來,可以總結(jié)為三個要素:技術(shù)先進性、實踐廣泛性和開源貢獻度。
從技術(shù)先進性的角度,在Gartner看來,華為云提出 “云原生 2.0” 戰(zhàn)略,將 AI、邊緣計算、Serverless 深度整合,符合 Gartner 對 “智能容器管理” 的評估方向,是能夠進入領(lǐng)導(dǎo)者象限的一個宏觀戰(zhàn)略性因素。
而與之對應(yīng)的,華為云對云原生2.0的深入踐行和戰(zhàn)略投入是擁有非常多實實在在的成績的——在業(yè)界率先發(fā)布CCE Turbo、CCE Autopilot、云容器實例CCI以及分布式云原生服務(wù)UCS等多款創(chuàng)新性容器產(chǎn)品,為用戶提供了可在公有云、分布式云、混合云、邊緣運行大規(guī)??蓴U展容器負載的最佳云原生基礎(chǔ)設(shè)施,這些我們也都有所介紹。
具體來說,華為云的技術(shù)深度,可以用“先進而無短板”來形容。
在競逐世界級云廠商的容器實踐中,華為云構(gòu)建了業(yè)界最完整的容器解決方案體系,覆蓋公有云、混合云、邊緣計算及 AI 場景。
在核心技術(shù)上,華為云擁有支持萬級節(jié)點集群的高性能容器引擎,采用分布式 QingTian 架構(gòu)實現(xiàn)毫秒級調(diào)度響應(yīng),資源利用率提升 30% 以上。例如,在金融領(lǐng)域,中國農(nóng)業(yè)銀行基于華為云容器構(gòu)建云原生基礎(chǔ)設(shè)施,支撐核心業(yè)務(wù)系統(tǒng)全面實現(xiàn)分布式架構(gòu)轉(zhuǎn)型,日交易量峰值超19億筆。
在至關(guān)重要的調(diào)度能力上,UCS作為多云容器編排引擎,支持跨公有云、私有云及邊緣的統(tǒng)一管理,通過 Karmada 實現(xiàn)多集群聯(lián)邦調(diào)度,解決了企業(yè)多云環(huán)境下的資源孤島問題——而這正是中國用戶從傳統(tǒng)IT架構(gòu)向云計算轉(zhuǎn)型中最難解的命題。
在擁抱AI上,華為云通過CCE Doer將 AI 能力嵌入容器全生命周期管理,支持 200 + 異常場景的智能診斷,根因定位準(zhǔn)確率超 80%。特別是在 AI 訓(xùn)練場景中,CCE 智算集群與昇騰算力結(jié)合,實現(xiàn) GPU 資源多容器共享調(diào)度,整體成本降低 50%。
華為云還特別注重建立差異化競爭優(yōu)勢,作為一個有深厚通信技術(shù)基因的企業(yè),華為云憑借此與容器技術(shù)結(jié)合,建立了絕大多數(shù)云廠商很難追趕的差異化戰(zhàn)略縱深,例如在邊緣計算與 5G 協(xié)同能力上,靠著通信領(lǐng)域的技術(shù)積累,將 5G MEC(多接入邊緣計算)與 KubeEdge 深度融合,在智能電網(wǎng)、工業(yè)互聯(lián)網(wǎng)等場景實現(xiàn)毫秒級時延響應(yīng)。如在某能源企業(yè)的智能巡檢項目中,通過 5G +邊緣容器方案,將故障識別時間從分鐘級壓縮至秒級。
實踐的廣泛性上,華為云的容器技術(shù)也無可挑剔。
在本土市場,華為云連續(xù)五年蟬聯(lián)中國容器軟件市場份額第一;80%的TOP100互聯(lián)網(wǎng)企業(yè)、75%的國有大行以及全國性股份制銀行、75%的TOP20中國能源企業(yè)以及90%的TOP30車企,均信賴并選擇了華為云容器服務(wù),通過云原生技術(shù)實現(xiàn)企業(yè)數(shù)字化轉(zhuǎn)型 。
因此,在 Gartner客戶評價系統(tǒng)Gartner Peer Insights 中,華為云容器服務(wù)以 4.7 分(滿分 5 分)位列全球第一,尤其在交付效率(4.8 分)和技術(shù)支持(4.7 分)維度表現(xiàn)突出。
但是,筆者認為,對華為云的發(fā)展至關(guān)重要的一點,還體現(xiàn)在其對開源社區(qū)的貢獻上。
CNCF(Cloud Native Computing Foundation,云原生計算基金會) 是全球最具影響力的開源技術(shù)組織之一,技術(shù)愿景是讓云原生技術(shù)成為全球應(yīng)用開發(fā)與部署的標(biāo)準(zhǔn),而容器化是其四大主導(dǎo)方向中排行第一的方向。作為一個獨立于云廠商外的中立組織,它在云原生領(lǐng)域的影響力可以說無以倫比——通過托管超過 170 個開源項目(截至 2025 年),CNCF 構(gòu)建了完整的云原生技術(shù)棧。
而華為云積極參與開源,并作為長期貢獻者,參與了82個CNCF項目,擁有超過20個項目管理維護者席位,并獲得全球唯一的CNCF TOC副主席席位。
對于華為云為何如此積極參與開源,除了參與云原生的標(biāo)準(zhǔn)制定外,華為云云原生產(chǎn)品經(jīng)理的Bryan給我分享了一個觀點——云原生,尤其是云原生背景下的容器市場,是一個生態(tài)競爭型的市場。
舉一個簡單的例子——盡管波音在客機市場上被空客追趕的很辛苦,但在全球貨機市場(含新貨機和改裝貨機)的綜合占比超過 80%,空客僅約為 15%。
之所以有如此大的差距,某種程度上就是因為ULD(Unit Load Device,航空集裝器)的規(guī)格雖然由國際航空運輸協(xié)會(IATA)統(tǒng)一制定,目的是實現(xiàn)不同航空公司、機場、機型之間的兼容,提升裝卸效率,但波音在其中的貢獻度最大。
早在全球航空貨運的開創(chuàng)期,波音就非常積極的參與IATA制定貨運集裝箱尺寸標(biāo)準(zhǔn)的作用,以至于由747 開創(chuàng)的寬體貨艙尺寸(5.5 米寬度)成為 IATA 集裝器設(shè)計基準(zhǔn);此后至今,全球 90% 的航空貨運集裝箱按此規(guī)格生產(chǎn);同樣,在軟件上,同時,波音開源其貨機裝載優(yōu)化算法(如 LoadMaster),最終的滲透率是——全球 78% 的貨運航空公司使用該系統(tǒng)進行配載規(guī)劃。
如果我們把航空集裝器也看作是一種容器技術(shù)(事實也是),就不難得出結(jié)論——越早參與生態(tài)建設(shè),越積極的開源包括軟件和算法在內(nèi)的技術(shù),不但對受益者有利,也對貢獻者更有利,更有助于貢獻者成為標(biāo)準(zhǔn)的引領(lǐng)者,得到更豐富的市場回報。
而容器技術(shù)盡管基本理念一致,但在標(biāo)準(zhǔn)和應(yīng)用方式上可謂千差萬別。這也就決定了,在云計算這個非常吃標(biāo)準(zhǔn)的市場,生態(tài)貢獻度越高,市場滲透率就越高,這就意味著客戶的后續(xù)選擇的指向性越強——華為如果希望自身能夠持續(xù)的提升在領(lǐng)導(dǎo)者象限的TOP俱樂部中的地位,生態(tài)投入和生態(tài)貢獻幾乎是一條必須走的路。
而隨著華為更積極的進入全球市場,通過開源貢獻度拉升滲透率,可謂不二法門。
但問題的B面是,開源技術(shù)不但要“我愿開”,更要“你愿用”——從生態(tài)反應(yīng)來看,華為這個崇高榮譽的背后,不僅是捐贈了KubeEdge、Karmada、Volcano、Kuasar,以及于2024年捐贈了Kmesh、openGemini、Sermant等標(biāo)桿項目,更取決于其開源技術(shù)的用戶體量和重要性也在不斷的提升——而這也是華為能夠進入全球領(lǐng)導(dǎo)者象限中一個至關(guān)重要的因素。
沒有投入就沒有所得,在波詭云譎、至今仍以美國廠商為絕對頭部的容器市場,我們也欣喜地看到,以華為云為代表的中國云計算廠商,正在不斷進步,通過自己的努力來書寫未來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.