“不去想困難,干就完了,一步一步往前走?!?/p>
作者 |小葳
圖片來(lái)源|攝圖
“芯片問(wèn)題其實(shí)沒必要擔(dān)心”、“我們用數(shù)學(xué)補(bǔ)物理、非摩爾補(bǔ)摩爾,用群計(jì)算補(bǔ)單芯片,在結(jié)果上也能達(dá)到實(shí)用狀況?!?/p>
不久前,華為首席執(zhí)行官任正非接受媒體采訪的內(nèi)容,引發(fā)科技界廣泛關(guān)注。其中“用群計(jì)算補(bǔ)單芯片”的技術(shù)突破指的就是昇騰384超節(jié)點(diǎn)。
今年5月,華為在鯤鵬昇騰開發(fā)者大會(huì)推出昇騰384超節(jié)點(diǎn)。其原理是通過(guò)華為自研的高速總線互聯(lián)技術(shù),創(chuàng)新提出了對(duì)等計(jì)算架構(gòu),并把總線從服務(wù)器內(nèi)部,擴(kuò)展到整機(jī)柜、甚至跨機(jī)柜,將384張昇騰卡無(wú)縫集成為一個(gè)集群。通過(guò)超高通信帶寬和納秒級(jí)通信時(shí)延,昇騰384超節(jié)點(diǎn)能夠讓一個(gè)集群如同單一計(jì)算機(jī)般協(xié)同工作,其首次實(shí)現(xiàn)了在一個(gè)超節(jié)點(diǎn)域內(nèi)即可完成DeepSeek V3/R1所有的專家并行(EP)。
這一突破的意義遠(yuǎn)超技術(shù)本身。
人工智能是全球科技競(jìng)爭(zhēng)的關(guān)鍵領(lǐng)域。當(dāng)對(duì)手試圖通過(guò)切斷先進(jìn)芯片供應(yīng)、乃至全球禁止使用昇騰芯片來(lái)遏制我們的AI產(chǎn)業(yè)發(fā)展時(shí),從DeepSeek到昇騰384超節(jié)點(diǎn)都一再證明:即使在面臨核心制約的逆風(fēng)局下,通過(guò)算力架構(gòu)創(chuàng)新、算法結(jié)構(gòu)創(chuàng)新,中國(guó)科技企業(yè)不僅能實(shí)現(xiàn)模型與算力的雙突破,更從根本上動(dòng)搖了外部技術(shù)封鎖的有效性。
對(duì)于今年中國(guó)人工智能產(chǎn)業(yè)的一系列突破,不久前美國(guó)主流媒體報(bào)道稱“這是個(gè)讓人很難接受的現(xiàn)實(shí),但中國(guó)科技的確在封鎖中取得進(jìn)步,因?yàn)橹袊?guó)企業(yè)家找到了用較少資源實(shí)現(xiàn)更多目標(biāo)的創(chuàng)新之道?!?/p>
昇騰384超節(jié)點(diǎn)破局的底氣來(lái)自華為在根技術(shù)、根生態(tài)的深耕。它不僅提供了當(dāng)下可用的算力解決方案,更開啟了一條依托系統(tǒng)工程與集群智能,實(shí)現(xiàn)AI算力自主可控并持續(xù)躍升的產(chǎn)業(yè)新范式。
路徑創(chuàng)新,中國(guó)AI產(chǎn)業(yè)不容小覷的后發(fā)優(yōu)勢(shì)
從DeepSeek到昇騰384超節(jié)點(diǎn),回顧中國(guó)AI力量的發(fā)展會(huì)發(fā)現(xiàn),每一次重大技術(shù)突破都是依靠路徑創(chuàng)新。
DeepSeek通過(guò)高效模型架構(gòu)、高效強(qiáng)化學(xué)習(xí)、高效算力利用等一系列工程與算法協(xié)同創(chuàng)新,實(shí)現(xiàn)更強(qiáng)推理能力并大幅降低了模型訓(xùn)練成本。這背后是混合專家架構(gòu)DeepSeek MoE、群組相對(duì)策略優(yōu)化(GRPO)、多頭潛在注意力機(jī)制(MLA)、多Token預(yù)測(cè)(MTP)等一系列技術(shù)的綜合運(yùn)用。
比如,此前以GPT為代表的模型,需要大量人工標(biāo)注的高質(zhì)量數(shù)據(jù)進(jìn)行監(jiān)督微調(diào),再通過(guò)人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)指導(dǎo)模型改進(jìn)。而DeepSeek探索出了一條全新的道路,通過(guò)群組相對(duì)策略優(yōu)化(GRPO)等技術(shù),可以不依賴大量人工標(biāo)注數(shù)據(jù),單純通過(guò)強(qiáng)化學(xué)習(xí)(RL),讓模型獲得同樣強(qiáng)大的推理能力。
昇騰384超節(jié)點(diǎn)同樣打破了原有規(guī)則,開拓了一條全新的道路。
CPU時(shí)代的服務(wù)器通過(guò)以太網(wǎng)絡(luò)進(jìn)行跨機(jī)互聯(lián),通信帶寬較低。這種通信架構(gòu)到了GPU/NPU/XPU為主的AI時(shí)代,服務(wù)器跨機(jī)帶寬已成為訓(xùn)練的核心阻礙。尤其是當(dāng)MoE模型成為主流的模型架構(gòu),TP/PP/SP/EP等混合并行策略日益復(fù)雜,傳統(tǒng)通信架構(gòu)更加捉襟見肘。
基于華為在ICT領(lǐng)域的根技術(shù)積累,昇騰384超節(jié)點(diǎn)創(chuàng)新提出對(duì)等計(jì)算架構(gòu),替代以CPU為中心的馮諾依曼架構(gòu)。在一個(gè)超節(jié)點(diǎn)范圍內(nèi),用高速總線互聯(lián)替代傳統(tǒng)以太網(wǎng)絡(luò),將通信帶寬提升了15倍;單跳通信時(shí)延也從2微秒降低到200納秒,降低了10倍。經(jīng)過(guò)硅基流動(dòng)實(shí)測(cè),單用戶 20 TPS 水平前提下,昇騰384超節(jié)點(diǎn)單卡 Decode 吞吐突破 1920 Tokens / s,可比肩 H100 部署性能。
前沿科技領(lǐng)域,先發(fā)者的確有制定規(guī)則、引領(lǐng)技術(shù)發(fā)展的優(yōu)勢(shì),但其技術(shù)路線不一定一直是最優(yōu)解,后發(fā)者也不一定會(huì)一直落后。只有架構(gòu)創(chuàng)新,才能讓后發(fā)者打破領(lǐng)先者既定的游戲規(guī)則和玩法,重新開一局。
然而架構(gòu)創(chuàng)新并非一蹴而就,以昇騰384超節(jié)點(diǎn)為例,筆者認(rèn)為其技術(shù)突破的背后離不開幾個(gè)核心因素。
首先,持續(xù)投入基礎(chǔ)研究,是架構(gòu)創(chuàng)新的前提。
基礎(chǔ)研究需要長(zhǎng)期主義的時(shí)間耐力與資金定力,缺一不可。過(guò)去10年華為累計(jì)研發(fā)投入12490億,平均每年超千億。2024年華為研發(fā)總投入1800億,其中600億投入基礎(chǔ)理論研究,不設(shè)考核指標(biāo)。
任正非也一直強(qiáng)調(diào)基礎(chǔ)研究的重要性,“基礎(chǔ)研究不止5—10年,一般要10年、20年或更長(zhǎng)的時(shí)間。如果不搞基礎(chǔ)研究,就沒根。即使葉茂,欣欣向榮,風(fēng)一吹就會(huì)倒的。”超節(jié)點(diǎn)技術(shù)的突破,正是華為在ICT、芯片、光通信等領(lǐng)域數(shù)十年技術(shù)積累的厚積薄發(fā)。
其次,布局AI算力產(chǎn)業(yè)的戰(zhàn)略級(jí)定力。
架構(gòu)創(chuàng)新是貫穿昇騰計(jì)算產(chǎn)業(yè)發(fā)展的戰(zhàn)略級(jí)方向之一。早在2018年,華為首次發(fā)布AI發(fā)展戰(zhàn)略時(shí),排在首位的就是投資基礎(chǔ)研究,這也為后續(xù)架構(gòu)創(chuàng)新指明方向。2019年,華為發(fā)布整體計(jì)算戰(zhàn)略時(shí),就把架構(gòu)創(chuàng)新作為四大戰(zhàn)略舉措之首,提出用創(chuàng)新的處理器架構(gòu)來(lái)匹配算力的增速。2023年,華為發(fā)布All Intelligence戰(zhàn)略,提出持續(xù)投入,不斷探索,構(gòu)建起根技術(shù)優(yōu)勢(shì)。
第三,抓住計(jì)算系統(tǒng)結(jié)構(gòu)性變革機(jī)遇。
隨著模型參數(shù)規(guī)模和結(jié)構(gòu)復(fù)雜度不斷升級(jí),算力集群規(guī)模也從千卡邁入萬(wàn)卡、10萬(wàn)卡時(shí)代。由此引發(fā)計(jì)算系統(tǒng)發(fā)生結(jié)構(gòu)性變革,歷經(jīng)單芯片——多芯片互聯(lián)——集群通信的演進(jìn),算力基礎(chǔ)設(shè)施已經(jīng)從“強(qiáng)單體”升級(jí)為“強(qiáng)系統(tǒng)”。對(duì)于企業(yè)等AI需求側(cè),更加關(guān)注的是系統(tǒng)算力性能,而不再是單處理器性能,這也為昇騰“超節(jié)點(diǎn)+集群”系統(tǒng)算力解決方案提供了創(chuàng)新空間。
深度開放,擴(kuò)大中國(guó)AI全球朋友圈
正是超節(jié)點(diǎn)等核心技術(shù)的突破,讓競(jìng)爭(zhēng)對(duì)手看到了昇騰的強(qiáng)大,出臺(tái)各種禁令。筆者認(rèn)為,相比技術(shù),讓對(duì)手更慌的其實(shí)是我們的AI產(chǎn)業(yè)生態(tài)。
2025年5月,在臺(tái)北國(guó)際電腦展期間,英偉達(dá)首席執(zhí)行官黃仁勛就在媒體采訪中表達(dá)了對(duì)中國(guó)AI生態(tài)的警惕。
“眼下正值競(jìng)爭(zhēng)對(duì)手迅速追趕、加速布局的關(guān)鍵時(shí)刻,我們卻選擇限制自身技術(shù)在全球的擴(kuò)散,是搬起石頭砸自己的腳”、“如果我們選擇放棄參與,讓中國(guó)構(gòu)建出一個(gè)完整而繁榮的本土生態(tài)系統(tǒng),而美國(guó)企業(yè)又完全缺席,那么未來(lái)主導(dǎo)這個(gè)新平臺(tái)的就將不再是美國(guó)?!?/p>
顯然,AI時(shí)代的計(jì)算產(chǎn)業(yè)生態(tài),領(lǐng)先者恒強(qiáng)的模式已經(jīng)被打破,技術(shù)封鎖只會(huì)故步自封,誰(shuí)更開放、誰(shuí)更創(chuàng)新,誰(shuí)才能夠在未來(lái)的產(chǎn)業(yè)版圖中占據(jù)不敗之地。
過(guò)去6年來(lái),昇騰加速構(gòu)建起一套全面對(duì)標(biāo)的AI生態(tài)體系,并且以更加開放創(chuàng)新的戰(zhàn)略,加速躍遷到開源開放生態(tài)的發(fā)展階段:
在編程語(yǔ)言方面,2023年5月AscendC語(yǔ)言發(fā)布,通過(guò)開發(fā)者友好的方式,提供基于昇騰AI硬件高效開發(fā)算子的全新語(yǔ)言;
在AI框架方面,2020年3月昇思MindSpore開源,其高效分布式并行、圖算深度融合等關(guān)鍵特性一直在持續(xù)演進(jìn);
在計(jì)算架構(gòu)方面,2023年起CANN堅(jiān)持深度開放,目前已開源算子加速庫(kù)、通信算法、Ascend C、集合通信庫(kù)等核心組件,同時(shí)發(fā)布CATLASS算子模板庫(kù)、開放190+Runtime運(yùn)行時(shí)接口等,進(jìn)一步降低開發(fā)門檻,提升開發(fā)體驗(yàn);
在編譯器方面,畢昇編譯器已將Ascend NPU IR接口開放,實(shí)現(xiàn)無(wú)感對(duì)接Triton、FlagTree等基于Python 的算子編程框架;
算子加速庫(kù)方面,昇騰AOL算子加速庫(kù)通過(guò)基礎(chǔ)算子和融合算子,為開發(fā)者提供豐富的參考樣例,提升創(chuàng)新效率。
雖然目前昇騰生態(tài)還在發(fā)展初期,但已展現(xiàn)出強(qiáng)大生命力。正是通過(guò)開放創(chuàng)新戰(zhàn)略,不斷降低開發(fā)者使用門檻、提升開發(fā)效率,昇騰贏得越來(lái)越多AI開發(fā)者的青睞。
目前昇騰全球開發(fā)者突破330萬(wàn),核心開發(fā)者達(dá)到5萬(wàn)。在中國(guó)通過(guò)與眾多高校合作,昇騰累計(jì)培養(yǎng)了40多萬(wàn)名學(xué)昇騰、懂昇騰的學(xué)生,如今他們已經(jīng)步入千行萬(wàn)業(yè),成為中國(guó)AI產(chǎn)業(yè)發(fā)展的中堅(jiān)力量。
同樣,只有開放創(chuàng)新,才能讓一個(gè)計(jì)算產(chǎn)業(yè)生態(tài)在全球獲得越來(lái)越廣的朋友圈。近年來(lái),昇騰不斷加大與主流第三方AI生態(tài)的兼容,比如目前Pytorch、vLLM全面支持昇騰。昇騰通過(guò)開展大量技術(shù)和生態(tài)合作,為全球開發(fā)者提供了極致開發(fā)體驗(yàn)的同時(shí),也為全球AI開源生態(tài)持續(xù)貢獻(xiàn)中國(guó)力量。
結(jié)語(yǔ)
當(dāng)記者問(wèn)到,面對(duì)外部封鎖打壓心里怎么想時(shí),任正非的回答是:“沒有想過(guò),想也沒有用。不去想困難,干就完了,一步一步往前走。”
歷史證明,封鎖從未扼殺進(jìn)步,只會(huì)加速創(chuàng)新范式的迭代。
從DeepSeek到昇騰384超節(jié)點(diǎn),不僅是技術(shù)突破,更是中國(guó)式創(chuàng)新的隱喻:中國(guó)正從技術(shù)追趕者變?yōu)樾驴蚣艿奶剿髡吲c構(gòu)建者。
放眼未來(lái),我們期待全球AI產(chǎn)業(yè)見證更多中國(guó)創(chuàng)新力量的崛起。
本文為「智能進(jìn)化論」原創(chuàng)作品。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.