來源:制造界 原創(chuàng):秀二
2025 年8 月5 日,無疑是具有里程碑意義的一天。北京昇騰計算產(chǎn)業(yè)發(fā)展峰會上,華為輪值董事長徐直軍宣布:昇騰AI核心軟件平臺CANN將全面開源。并Mind系列應用套件及工具鏈同步開放,支持開發(fā)者深度定制。
華為將CANN代碼庫向全球開發(fā)者敞開,恰如當年Linux打破操作系統(tǒng)霸權(quán)。是中國AI 算力產(chǎn)業(yè)的一座燈塔,照亮了國產(chǎn)算力突破技術(shù)封鎖、實現(xiàn)自主創(chuàng)新的前行道路。徐直軍說,“使能每一位創(chuàng)新者”,正在將算力主權(quán)交還人類。
1/AI原子彈時刻, 撼動英偉達
這一決定被業(yè)界視為中國AI算力生態(tài)的“原子彈時刻”——在英偉達CUDA生態(tài)壟斷全球AI計算二十年后,中國首次擁有了從芯片、框架到應用的全棧開源生態(tài)。英偉達的“CUDA帝國”似乎聽到了圍墻開裂的聲音。
英偉達的護城河從來不是硬件,而是近二十年構(gòu)建的CUDA開發(fā)者生態(tài),在全球數(shù)百萬開發(fā)者形成的“細胞記憶”,讓即使性能接近的國產(chǎn)芯片也難以撬動市場。華為此次開源,正是瞄準這一核心痛點。打破英偉達生態(tài)壟斷。
長期以來,英偉達憑借其成熟的CUDA 生態(tài)系統(tǒng),在全球AI 算力市場占據(jù)著近乎壟斷的地位。CUDA 將英偉達的GPU 硬件與軟件開發(fā)環(huán)境緊密結(jié)合,為開發(fā)者提供了高效的編程模型和豐富的工具庫,吸引了全球600 多萬開發(fā)者投身其中,構(gòu)建起了一道難以逾越的技術(shù)壁壘。
這一封閉生態(tài)雖然推動了AI 技術(shù)的早期發(fā)展,卻也帶來了高昂的硬件成本、嚴苛的技術(shù)鎖定以及潛在的供應鏈風險。2023 - 2024 年間,英偉達推出專為中國市場定制的A800/H800 系列,后又將其列入管制清單,2025 年H20 芯片的禁售與解禁反復,充分彰顯了這場技術(shù)博弈的復雜性與激烈性。對中國AI 產(chǎn)業(yè)而言,過度依賴英偉達技術(shù),猶如在咽喉處懸了一把利刃,嚴重制約著產(chǎn)業(yè)的自主可控發(fā)展。
CANN 的全面開源開放,為中國AI 產(chǎn)業(yè)提供了打破這一壟斷格局的利刃。通過開放其核心技術(shù),使得開發(fā)者無需再受限于英偉達的技術(shù)體系,能夠直接對昇騰硬件的底層算力進行調(diào)用與優(yōu)化,打破以往依賴英偉達GPU 時的性能瓶頸。
在編譯器生態(tài)方面,華為畢昇編譯器開放AscendNPU IR 接口,這一舉措更是具有變革性意義。讓國產(chǎn)AI 開發(fā)體系擺脫了對國外編譯器技術(shù)的依賴,在技術(shù)創(chuàng)新的道路上輕裝上陣。
2/全球變局,AI算力將全棧崛起
CANN開源不僅是技術(shù)事件,更在重構(gòu)全球AI權(quán)力結(jié)構(gòu),開啟中國AI算力新紀元。2025 年 CANN 開源,或?qū)⒊蔀橹袊懔ι鷳B(tài)的“新原點”。
短期看,CUDA仍主導歐美市場,而CANN+昇騰成為中國及新興市場首選,新興國家據(jù)成本與政策靈活選擇。多元競爭推動全球算力價格下行,預計五年內(nèi)AI訓練成本降低30%以上。
2025年中國算力生態(tài)正從碎片化走向整合。華為昇騰、沐曦、壁仞科技等國產(chǎn)芯片廠商罕見聯(lián)手,避免生態(tài)內(nèi)耗。昇騰已在中國移動AI設(shè)備集采拿下70%份額,并賦能東方國信、直真科技等開發(fā)行業(yè)方案,邊緣場景開發(fā)周期縮短50%。
2024年,華為昇騰910C在實測中展現(xiàn)出超越英偉達H100的效率,其先進的架構(gòu)設(shè)計與強大的計算能力,為中國AI 算力提供了堅實支撐。天數(shù)智芯的天垓 100 芯片在金融領(lǐng)域市占率突破15%,憑借對金融場景的深度優(yōu)化,實現(xiàn)了高效的算力輸出。寒武紀思元590 更是以驚人的42.3 倍季度營收增長,印證了國產(chǎn) AI 芯片的市場競爭力。
據(jù)IDC 數(shù)據(jù)顯示,2025 年上半年國產(chǎn)算力占比已躍升至42%,較2022 年大幅提升近 30 個百分點,這一數(shù)據(jù)直觀地反映出國產(chǎn)算力在技術(shù)封鎖下的逆襲態(tài)勢。
全棧自主生態(tài)的構(gòu)建
在芯片設(shè)計環(huán)節(jié),寒武紀、沐曦、壁仞等企業(yè)不斷發(fā)力。寒武紀持續(xù)迭代思元系列芯片,在智能安防、智能駕駛等多領(lǐng)域廣泛應用;沐曦推出的曦云C600 GPU,實現(xiàn)從設(shè)計到封裝的 100% 國產(chǎn)供應鏈閉環(huán),性能對標國際旗艦產(chǎn)品;壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU 液冷模組壁勵166L,為超節(jié)點建設(shè)提供核心動力。
芯片制造層面,中芯國際取得重大突破。通過自研蝕刻補償算法和對DUV 設(shè)備的改造,在無 EUV 光刻機的情況下成功實現(xiàn)5 納米工藝驗證,量產(chǎn)良率達92%,超越臺積電初代5 納米水平,為國產(chǎn)AI 芯片制造奠定了堅實基礎(chǔ),有力保障了芯片供應的自主性與穩(wěn)定性。
華為昇騰384 超節(jié)點在 2025 世界人工智能大會上驚艷亮相。它整合384 顆升騰NPU 和192 顆鯤鵬CPU,總算力達300PFlops,超越英偉達GB200 NVL72 系統(tǒng)。
其創(chuàng)新采用的MatrixLink 全對等互聯(lián)技術(shù),將芯片間通信帶寬提升至 269TB/s,是傳統(tǒng)方案的數(shù)倍,有效打破跨機通信瓶頸,使千億級模型性能提升2.5 倍以上,為大規(guī)模 AI 訓練與推理提供了強大動力。
光互連技術(shù)也取得重大突破。曦智科技聯(lián)合壁仞科技、中興推出全球首款分布式光交換(dOCS)超節(jié)點,采用硅光芯片實現(xiàn)GPU 間光互連。極大提升了算力集群的靈活性與可擴展性。
新興算力探索同樣成果豐碩。浙江大學研發(fā)的“悟空” 類腦計算機,擁有超20億神經(jīng)元,規(guī)模接近獼猴大腦,運行功耗僅2 千瓦,卻能實現(xiàn)復雜邏輯推理、語言理解等功能,為AI 算力架構(gòu)提供了全新思路,開辟了類腦計算的新賽道;
本源悟空量子計算機成功完成全球首個十億參數(shù)AI 模型微調(diào)任務,能耗降低70%,訓練效率提升數(shù)百倍,實現(xiàn)量子計算與AI 的深度融合,有望為AI 算力帶來顛覆性變革。
全球格局中的中國力量
在全球AI 算力格局中,中國正從追隨者逐步轉(zhuǎn)變?yōu)橐I(lǐng)者。中國智能算力規(guī)模預計2025 年達1037.3EFLOPS,全球占比超25%,2026 年將翻倍至1460.3EFLOPS,成為全球智能算力增長的重要引擎。
牛津大學報告顯示,中國擁有22 座AI 算力工廠,其中3 座完全采用華為芯片,在全球130 座工廠中占比17%,彰顯了中國在AI 算力基礎(chǔ)設(shè)施建設(shè)方面的強大實力。
全球變局之下,中國AI 算力全棧崛起已成為不可阻擋的趨勢。從技術(shù)突破到生態(tài)構(gòu)建,從產(chǎn)業(yè)協(xié)同到政策支持,中國正全方位打造具有國際競爭力的AI 算力產(chǎn)業(yè)體系。
聯(lián)系我們:txm176(值班微信)廣告及商務合作:電話18660411611投稿及采訪約談:郵箱447377407@qq.com
版權(quán)聲明:制造界除發(fā)布原創(chuàng)文章外,亦致力于優(yōu)秀文章的交流分享。轉(zhuǎn)載注明文章來源和作者;申請轉(zhuǎn)載授權(quán)請在文末或后臺留言。版權(quán)所有,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.