6月30日,華為正式宣布將盤古7B(70億參數(shù))、盤古Pro MoE 72B(720億參數(shù)混合專家模型)及昇騰推理技術(shù)開源。
從旁觀視角來看,華為此次開源絕非簡單的技術(shù)共享,而是華為昇騰生態(tài)的“戰(zhàn)略轉(zhuǎn)折點”,更是一次對西方AI技術(shù)霸權(quán)的正面突圍。
因為根據(jù)分析來看,盤古Pro MoE 72B 的模型權(quán)重和基礎(chǔ)推理代碼已經(jīng)火速上線開源平臺,而盤古7B 雖說相關(guān)資源要晚些時候開放,但已然讓大家翹首以盼。
華為這波操作,直接打破了以往大模型技術(shù) “閉門造車” 的局面,把核心技術(shù)大方地擺在臺面上,讓開發(fā)者們隨意取用、改造。
從技術(shù)實力上看,盤古大模型系列一直是華為的 “秘密武器”。就拿盤古 Pro MoE 72B 來說,它采用的分組混合專家(MoGE)架構(gòu)簡直是 “黑科技”。通過分組均衡路由技術(shù),實現(xiàn)專家負載動態(tài)分配,在昇騰 300I Duo 平臺上單卡推理吞吐量飆升至 321 tokens/s,比同規(guī)模模型提升 15%。
這意味著什么?以往模型在處理復(fù)雜任務(wù)時,常常會因為負載不均 “掉鏈子”,而華為這一技術(shù),直接把這個行業(yè)痛點給 “治好了”。再加上軟硬協(xié)同優(yōu)化,昇騰芯片算力利用率(MFU)提升 50% 以上,給超大規(guī)模模型工業(yè)化部署提供了全新的 “解題思路”。
所以華為這次決定開源,更是昇騰生態(tài)戰(zhàn)略的關(guān)鍵一步。一直以來,大模型技術(shù)研發(fā)成本高、門檻高,很多企業(yè)有心無力。華為此舉,直接把門檻給降低了。
瞧瞧廣汽集團,靠著盤古多模態(tài)大模型,復(fù)雜場景復(fù)原變得超簡單,智能駕駛模型迭代快得飛起,實現(xiàn) “兩天一個版本”。
中國石油基于盤古打造昆侖大模型,在 100 多個專業(yè)領(lǐng)域落地應(yīng)用,勘探開發(fā)等工作效率大幅提升。這就是開源的魅力,讓大模型技術(shù)不再是少數(shù)巨頭的 “專利”,能迅速滲透到千行百業(yè)。
再看華為云新一代昇騰 AI 云服務(wù),基于 CloudMatrix 384 超節(jié)點,單卡推理吞吐量高達 2300 tokens/s,為開發(fā)者提供了強大的算力后盾,媲美國際領(lǐng)先水平。
因此總體上來說,華為通過開源,構(gòu)建 “技術(shù)開源 - 生態(tài)共建 - 價值共享” 的閉環(huán)。往后開發(fā)者能依托華為開源平臺、昇騰硬件和 ModelArts 工具鏈,快速定制行業(yè)專屬大模型。
華為輪值董事長徐直軍曾直言:“AI產(chǎn)業(yè)必須避免走向算力壟斷?!贝舜伍_源正是宣言的實踐:當(dāng)盤古大模型的權(quán)重、代碼、推理工具全部開放,昇騰芯片的“生態(tài)荒漠”瞬間變成“技術(shù)綠洲”。
可以預(yù)見,未來可能出現(xiàn)這樣的場景:一家歐洲車企用盤古MoE 72B訓(xùn)練自動駕駛模型,卻選擇華為昇騰而非英偉達H100部署。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.