2025年9月10日,上海的秋風(fēng)中夾雜著一絲技術(shù)革命的熾熱氣息。
就在這一天,Arm將其全新的AI技術(shù)領(lǐng)導(dǎo)力峰會(huì)——“Arm Unlocked 2025”的亞洲首站設(shè)在了這座充滿活力的東方都市。
這不僅是一場簡單的技術(shù)交流,更是一次集結(jié)了頂尖科技公司、芯片合作伙伴及生態(tài)系統(tǒng)領(lǐng)袖的技術(shù)發(fā)布。Arm在會(huì)上正式發(fā)布了其面向移動(dòng)終端的新一代CSS平臺——Arm Lumex,為端側(cè)AI體驗(yàn)帶來全面優(yōu)化與提升,并進(jìn)一步釋放終端場景的全部潛能。
(圖源:雷科技)
雷科技此次也受邀來到活動(dòng)現(xiàn)場,為大家?guī)憩F(xiàn)場、立體和一手報(bào)道。
Arm Lumex:名字變了,效率倍增
有的讀者可能會(huì)問,Arm Lumex是什么?
想要了解這個(gè)問題,你需要先搞清楚什么是Arm CSS產(chǎn)品。
Arm CSS,全稱Compute Subsystems(計(jì)算子系統(tǒng)),是Arm提供的一種“硬件全家桶”解決方案。
它是將Arm最新的CPU、GPU以及相關(guān)的系統(tǒng)IP(如互連總線、內(nèi)存控制器)預(yù)先集成、配置并驗(yàn)證好,打包成一個(gè)完整的高性能平臺。
對于芯片設(shè)計(jì)公司而言,直接采用CSS方案,就無需從零開始進(jìn)行復(fù)雜的IP集成和驗(yàn)證工作。這能極大地縮短SoC的開發(fā)周期,降低研發(fā)風(fēng)險(xiǎn),幫助合作伙伴更快地將搭載最新技術(shù)的產(chǎn)品推向市場。它本質(zhì)上是一個(gè)高性能、高效率的“芯片半成品”。
(圖源:雷科技)
而這次發(fā)布的Arm Lumex,便是包含新一代ArmC1 Ultra“超大核”與ArmC1 Pro“大核”CPU以及Mali G1-Ultra GPU,并支持SME2可擴(kuò)展矩陣延伸指令集的全新CSS平臺。
C位登場的,自然是支撐起Lumex的全新Armv9.3 CPU集群。
(圖源:雷科技)
根據(jù)官方介紹,Lumex CSS平臺支持3nm制程,實(shí)現(xiàn)了兩位數(shù)百分比的CPU IPC性能提升,其中Arm C1-Ultra超大核相較上代Cortex-X925,單線程峰值性能提升25%、Arm C1-Pro大核,與上一代的 Arm Cortex-A725 CPU 相比,在相同主頻下持續(xù)性能提升 16%,在同等性能下能效提高多達(dá)12%,在單線程和多線程性能上均實(shí)現(xiàn)了一次重要的躍遷。
除此以外,這次Arm還帶來了適用于次旗艦移動(dòng)設(shè)備的Arm C1-Premium核心和適用于可穿戴設(shè)備的Arm C1-Nano核心,前者的等面積效率更優(yōu),后者更是主打極致能效,廠商們可以根據(jù)自身需求靈活調(diào)整。
眾所周知,Armv9架構(gòu)本身就是專為AI和安全而設(shè)計(jì)的。在過去幾年的演進(jìn)中,Arm不斷為其增添針對機(jī)器學(xué)習(xí)(ML)等領(lǐng)域的計(jì)算能力。
正因如此,這次Armv9.3在AI性能上也得到了大幅度的強(qiáng)化。它通過對底層微架構(gòu)的深度優(yōu)化,尤其是對SME2(第二代可伸縮矩陣擴(kuò)展)指令的硬件級支持,為實(shí)際場景中的 AI 驅(qū)動(dòng)型任務(wù)帶來了顯著的AI性能提升。
具體來說,就是AI性能提升高達(dá)五倍;語音類工作負(fù)載延遲降低4.7倍;音頻生成速度提升2.8 倍。
(圖源:雷科技)
舉個(gè)例子,通過Arm、支付寶與vivo的三方合作下,大語言模型 (LLM) 的交互響應(yīng)時(shí)間縮短了多達(dá)40%,現(xiàn)場展示的通義2.5B體驗(yàn)機(jī)就能很好地展現(xiàn)出這個(gè)效果。
全新的Arm CPU在AI計(jì)算能力上的飛躍,讓實(shí)時(shí)的端側(cè)AI推理成為現(xiàn)實(shí),以往需要依賴云端才能完成的復(fù)雜AI推理任務(wù),如今在設(shè)備端就能流暢運(yùn)行。無論是更聰明的離線語音助手,還是能夠?qū)崟r(shí)理解畫面的AI影像系統(tǒng),都將得益于SME2帶來的算力解放。
現(xiàn)如今,SME2已經(jīng)廣受業(yè)界領(lǐng)先生態(tài)伙伴的采用,包括阿里巴巴、支付寶、三星System LSI、騰訊及vivo,力求在本地實(shí)現(xiàn)更快、更安全且隨時(shí)可用的智能體驗(yàn)。
(圖源:雷科技)
作為圖像核心的新一代Mali G1-UltraGPU,其表現(xiàn)同樣突出:
在各類圖形基準(zhǔn)測試中,Mali G1-Ultra較前代產(chǎn)品實(shí)現(xiàn)了20%的性能提升,AI推理性能提升最高 20%,同時(shí)得益于全新的第二代光線追蹤技術(shù),其光線追蹤性能相較前代提升了兩倍,為《暗區(qū)突圍:無限》、《原神》等主流游戲帶來了全面的性能增強(qiáng)。
此外,Mali G1-Premium與Mali G1-Pro兩款GPU,也為硬件資源受限的設(shè)備提供了更出色的性能與能效表現(xiàn),能在更低的功耗下,為中高端設(shè)備提供持久且高效的支持。
Arm的AI觀:旗艦設(shè)計(jì)為何要“AI優(yōu)先”?
在Arm Unlocked 2025上海站峰會(huì)的主題演講結(jié)束后,我們受邀參加了持續(xù)半天的技術(shù)分享會(huì)。
在這次分享會(huì)中,Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven和Arm 終端事業(yè)部產(chǎn)品管理總監(jiān)Ronan Naughton為我們更深度地解讀了Arm Lumex的技術(shù)價(jià)值。
James首先帶我們回顧了行業(yè)發(fā)展所面對的挑戰(zhàn),從工藝節(jié)點(diǎn)/封裝技術(shù)/發(fā)布周期帶來的壓力,到用戶關(guān)注的游戲、性能和應(yīng)用,都和如今的AI技術(shù)息息相關(guān)。
(圖源:雷科技)
雖然AI被公認(rèn)為最具顛覆性的新技術(shù),但想要完全釋放其潛力,尤其是在數(shù)十億計(jì)的終端設(shè)備上實(shí)現(xiàn)普惠,正面臨著嚴(yán)峻的挑戰(zhàn)。AI對性能、功耗和安全性的極致要求,正在迫使整個(gè)半導(dǎo)體行業(yè)進(jìn)行一次從硬件到軟件的系統(tǒng)性重構(gòu)。
而這,也就是為什么Arm Lumex平臺會(huì)以“AI優(yōu)先”的原因。
從設(shè)計(jì)之初,Arm Lumex就將AI和安全置于核心。本次峰會(huì)上亮相的全新Armv9.3 CPU和GPU,其設(shè)計(jì)的根本出發(fā)點(diǎn),就是為了高效執(zhí)行AI工作負(fù)載。
他特別強(qiáng)調(diào)了SME2技術(shù)的重要性,讓CPU以遠(yuǎn)超以往的效率處理神經(jīng)網(wǎng)絡(luò)運(yùn)算,是實(shí)現(xiàn)高能效端側(cè)AI的關(guān)鍵,雷科技也在現(xiàn)場體驗(yàn)到了基于SME2實(shí)現(xiàn)的端側(cè)語音生成0.3B、端側(cè)文字交互2.5B以及實(shí)時(shí)翻譯/瑜伽指導(dǎo)功能。
(圖源:雷科技)
你別說,效果都挺驚艷的,特別是這個(gè)語音生成,蠻期待這些端側(cè)應(yīng)用落地的一天。
再來看看GPU方面的解析,Ronan表示,與前一代Arm Immortalis-G925 GPU相比,Mali G1-Ultra的光線追蹤性能提升高達(dá)兩倍,并在主流圖形基準(zhǔn)測試中,性能表現(xiàn)提升20%,全新引入的矩陣乘法單元 (MMUL) FP16 指令,更可加速如語義分割、去噪、深度估計(jì)、物體檢測、語音識別和圖像增強(qiáng)等端側(cè)關(guān)鍵AI工作負(fù)載。
然而,強(qiáng)大的硬件只是故事的一半。
有與會(huì)者提問:目前AI生態(tài)面臨的更大挑戰(zhàn)在于軟件層面,開發(fā)者們迫切需要一個(gè)簡單、高效的方式來利用底層硬件的AI能力,而不是為每一款芯片都進(jìn)行復(fù)雜的底層優(yōu)化,Arm在這方面有做出什么努力嗎?
James答道,Arm推出的KleidiAI,正是為了解決這“最后一公里”的難題。目前Kleidi適配了從Arm NEON到Armv9.3 SME2的擴(kuò)展指令集,通過這款軟件包,開發(fā)者無需成為硬件專家,也能確保自己的AI應(yīng)用在Arm平臺上跑得又快又省電,這極大地降低了AI技術(shù)的應(yīng)用門檻。
(圖源:雷科技)
雷科技在體驗(yàn)時(shí)也問了一下工作人員,“在云端AI算力如此強(qiáng)大的今天,Arm為何如此堅(jiān)持大力投入資源,去提升終端設(shè)備上的AI處理能力?”
工作人員對此解釋道,他認(rèn)為端側(cè)AI與云端AI并非取代關(guān)系,而是互補(bǔ)共生。將更多的AI計(jì)算放在設(shè)備端處理,不但能帶來極致的響應(yīng)速度與體驗(yàn),更能保證用戶的隱私與安全,而且寄希望于設(shè)備永遠(yuǎn)在線并連接云端進(jìn)行AI計(jì)算是不現(xiàn)實(shí)的,高能效的端側(cè)AI是實(shí)現(xiàn)萬物智能的必由之路。
在我看來,整個(gè)AI時(shí)代的競爭,本質(zhì)上是生態(tài)的競爭。
Arm的機(jī)遇在于,憑借其在半導(dǎo)體行業(yè)的核心地位和廣泛的生態(tài)系統(tǒng),他們不但可以提供高性能的IP,更是能夠成為連接硬件創(chuàng)新與軟件應(yīng)用之間的“橋梁”,讓科技的進(jìn)步真正惠及每一個(gè)人。
說在最后
毫無疑問,AI的需求使得智能終端生態(tài)在過去的一年里迎來了新的爆發(fā)式增長,人們正在不停地嘗試、開拓新的應(yīng)用范例、探索新的硬件形態(tài),尋找著能夠?yàn)橄M(fèi)者帶來更好體驗(yàn)的產(chǎn)品——
不管是軟件還是硬件的。
個(gè)人認(rèn)為,相較于以往用“Cortex-A/X/R/M”覆蓋所有領(lǐng)域的做法,Arm如今的思路更為清晰:為不同的垂直市場,打造專屬的品牌和技術(shù)平臺。
與Arm Lumex一同浮出水面的,還有面向PC市場的Niva、面向汽車市場的Zena和面向物聯(lián)網(wǎng)市場的OrbisCSS平臺。這一系列動(dòng)作,清晰地勾勒出Arm意圖在每一個(gè)細(xì)分賽道上,都建立起無可撼動(dòng)的技術(shù)領(lǐng)導(dǎo)力和品牌辨識度。
隨著未來的AI生態(tài)繼續(xù)發(fā)展,我們無疑將會(huì)看到更多基于Arm CSS平臺打造的新一代智能終端產(chǎn)品,而AI生態(tài)的需求也將繼續(xù)驅(qū)動(dòng)Arm開發(fā)更高性能、更具效率的新產(chǎn)品。
Arm LumexCSS,正是他們?yōu)檫@個(gè)未來交出的第一份,也是最重要的一份答卷。
9月5日-9日,世界最大家電與消費(fèi)電子展IFA2025在柏林盛大舉辦。
雷科技派出了史上最大規(guī)模海外報(bào)道團(tuán)“雷科技IFA25報(bào)道團(tuán)”飛赴柏林,對IFA2025進(jìn)行現(xiàn)場、立體、一手報(bào)道。共輸出40+內(nèi)容,在雷科技300萬微信粉絲矩陣、1000萬新媒體矩陣傳播,全網(wǎng)閱讀量/播放量預(yù)估超500萬。我們對IFA2025的報(bào)道,再一次得到了DeepSeek的AI認(rèn)證“全網(wǎng)最強(qiáng)”。
期待26年1月CES,我們拉斯維加斯再見。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.