夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

新架構(gòu)×1、新芯片×3、新整機(jī)×2、新集群×1:5歲摩爾線程徹底爆發(fā)

0
分享至

【導(dǎo)語(yǔ):摩爾線程的報(bào)告 也是預(yù)告】

在高科技領(lǐng)域,中國(guó)唯二還與世界最高水平有較大差距的,一個(gè)是光刻機(jī),另一個(gè)就是GPU芯片,而這兩者正是AI之爭(zhēng)的關(guān)鍵基石。

幸運(yùn)的是,在“算力即國(guó)力”的號(hào)召下,國(guó)產(chǎn)GPU芯片近年來(lái)呈現(xiàn)出井噴之勢(shì),眾多品牌紛紛拿出豐富、強(qiáng)大的產(chǎn)品矩陣,展現(xiàn)了不俗的實(shí)力。

在這其中,成立僅僅5年的摩爾線程,無(wú)疑是關(guān)注度最高的品牌。

一方面,摩爾線程創(chuàng)始人張建中曾擔(dān)任NVIDIA全球副總裁、中國(guó)區(qū)總經(jīng)理,自帶光環(huán)。

另一方面,摩爾線程的MTT S80,至今仍是唯一能夠在公開(kāi)渠道買到的國(guó)產(chǎn)游戲顯卡,而且每月都在更新驅(qū)動(dòng)。


5年來(lái),摩爾線程基于自研的全功能GPU芯片,發(fā)展出了軟硬兼?zhèn)涞娜€產(chǎn)品堆棧,覆蓋幾乎所有GPU相關(guān)領(lǐng)域。

從大家最熟悉的游戲顯卡(S80/S70)到專業(yè)視覺(jué)加速顯卡(X300/S50)、數(shù)字辦公顯卡(S30/S10);

從算力本(AIBOOK)到臺(tái)式機(jī)(智娛摩方);

從算力加速卡(S5000/S4000)到服務(wù)器(MCCX D800 X1/X2)、智算中心(夸娥集群);

從基礎(chǔ)軟件、AI套件到云原生軟件、圖形與多媒體軟件;

從AI模型(MUSAChat)到AI應(yīng)用(魔筆馬良/魔筆天書(shū))……

所有這些,摩爾線程都已涉足,而且都干得有聲有色,在眾多傳統(tǒng)與新興領(lǐng)域都可以看到摩爾線程活躍的身影!



隨著IPO上市成功,關(guān)注摩爾線程的已經(jīng)不僅僅是科技行業(yè),而是得到了全民矚目。

所以,摩爾線程是時(shí)候做一次總體匯報(bào),也是時(shí)候展望一下未來(lái)了!

這就是摩爾線程的第一屆MUSA開(kāi)發(fā)者大會(huì),可以說(shuō)這次大會(huì)干貨之豐富,恐怕超出了每一位與會(huì)者的意料與期待!

大會(huì)上,我們看到了一個(gè)新的GPU架構(gòu)、三個(gè)新的GPU芯片、一個(gè)新的算力集群、兩個(gè)新的整機(jī),還有眾多開(kāi)發(fā)工具和生態(tài)上的升級(jí),讓人應(yīng)接不暇。


進(jìn)入正題之前,先解釋兩個(gè)關(guān)鍵名詞。

一是“全功能GPU”(Universal GPU),指具備功能完備性與精度完整性的GPU,通俗地講就是一個(gè)GPU架構(gòu)可以干幾乎所有的活兒。

其中,功能完備性體現(xiàn)在單一GPU芯片中集成AI計(jì)算加速、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼等多種引擎,可以滿足不同的圖形與計(jì)算需求。

精度完整性體現(xiàn)在單一芯片支持FP64、FP32、TF32、FP16、BF16、FP8、INT8、FP6、INT4、FP4等不同計(jì)算精度,可以滿足不同的GPU加速計(jì)算需求。

相比于TPU、VPU、GPGPU、NPU、ASIC等功能相對(duì)單一的圖形或計(jì)算芯片,全功能GPU自然更加能打,來(lái)什么活兒都能干。


二是“MUSA”,英文全稱Meta-computing Unified System Architecture,中文名“元計(jì)算統(tǒng)一系統(tǒng)架構(gòu)”,摩爾線程自主研發(fā),是覆蓋芯片硬件架構(gòu)、指令集、編程模型、軟件運(yùn)行庫(kù)、驅(qū)動(dòng)程序框架等的全棧技術(shù)體系。

MUSA架構(gòu)可以說(shuō)是全功能GPU的基礎(chǔ),使之具備更強(qiáng)的計(jì)算通用性、更優(yōu)的技術(shù)演進(jìn)能力、更佳的生態(tài)兼容性、更廣泛的市場(chǎng)適應(yīng)性。

這一次,MUSA不僅帶來(lái)了硬件架構(gòu)迭代,也迎來(lái)了全棧軟件升級(jí),包括支持新的MUSA C、TilLang、FlagOS & Triton編程模型,深度優(yōu)化了性能,比如計(jì)算效率可達(dá)98%、通信效率可達(dá)97%、編譯器性能提升3倍、高性能算子庫(kù)等,以及更廣泛的計(jì)算加速庫(kù)、通信、管理開(kāi)源。


【主權(quán)AI的三大支柱:成敗就看它了】

大會(huì)伊始,中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民發(fā)表了一番發(fā)人深思的演講。


鄭緯民院士首先提出了主權(quán)AI的三大支柱:算力自主、算法自強(qiáng)、生態(tài)自立,三者互為前提,互相約束,共同構(gòu)成主權(quán)AI的系統(tǒng)工程框架。

其中,真正決定主權(quán)AI成敗的,在于是否有足夠多的開(kāi)發(fā)者,愿意長(zhǎng)期在一套堆棧上為一款GPU寫(xiě)代碼,因?yàn)殚_(kāi)發(fā)者才是生態(tài)的核心,并不是廠家。

所以,國(guó)產(chǎn)平臺(tái)最需要解決的問(wèn)題,就是降低遷移成本、提高工具鏈成熟度、做好社區(qū)尤其是開(kāi)源社區(qū),這樣才能從實(shí)現(xiàn)“能用”到“好用”再到“愿意用”的逐步跨越。


鄭院士對(duì)摩爾線程可以說(shuō)是贊不絕口。

一是摩爾線程的國(guó)產(chǎn)全功能GPU,一顆芯片就能同時(shí)做好3D圖形渲染、HPC高性能計(jì)算、AI加速,這是非常不容易的。

二是摩爾線程MUSA就是類似于CUDA生態(tài)的國(guó)產(chǎn)實(shí)踐,也非常重視開(kāi)源。

鄭院士所在的清華大學(xué)團(tuán)隊(duì)做了兩件事,一個(gè)是做了Mooncake,是在推理中以KVCache為中心的大模型推理架構(gòu),能節(jié)省很多硬件資源,而且是開(kāi)源的。

第二個(gè)例子是KTransformers,通過(guò)基于計(jì)算強(qiáng)度的Offload策略,可以混合使用多個(gè)CPU、GPU,將大模型中的不同負(fù)載分配給不同設(shè)備,首次將千億模型本地化的成本降到了十萬(wàn)元級(jí)別。


鄭院士最后提出,國(guó)內(nèi)GPU行業(yè)目前面臨嚴(yán)重的內(nèi)卷、碎片化問(wèn)題,形成了巨大的阻礙。

所以產(chǎn)業(yè)聯(lián)盟與軟硬件協(xié)同設(shè)計(jì)非常重要,產(chǎn)業(yè)界要團(tuán)結(jié)起來(lái),應(yīng)用也要團(tuán)結(jié)起來(lái),一起努力解決這個(gè)問(wèn)題。

只有當(dāng)國(guó)產(chǎn)AI加速卡在真實(shí)業(yè)務(wù)中大規(guī)模使用,生態(tài)才會(huì)具備自我強(qiáng)化的正反饋,形成正向閉環(huán)。


【新一代GPU架構(gòu):花港】

摩爾線程創(chuàng)始人、董事長(zhǎng)兼CEO張建中做主題演講,在三個(gè)小時(shí)的時(shí)間里帶來(lái)了一個(gè)又一個(gè)驚喜!



2022年以來(lái),摩爾線程MUSA GPU架構(gòu)每年迭代一次,已經(jīng)先后誕生了蘇堤、春曉、曲院、平湖——是的,摩爾線程的架構(gòu)代號(hào)都來(lái)自“西湖十景”。

本次公布的新架構(gòu),代號(hào)為“花港”。


“花港”架構(gòu)支持新一代指令集,算力密度提升50%,能效更是提升多達(dá)10倍。

它支持FP4到FP64的全精度端到端加速計(jì)算,包括新增支持MTFP6、MTFP4,以及專門(mén)優(yōu)化了FP8、FP6、FP4三種低精度計(jì)算,支持混合計(jì)算,能效更高。

它具備第一代AI生成式渲染架構(gòu)(AGR),利用AI能力改造傳統(tǒng)流水線,渲染效率更高,第二代光追硬件加速引擎,生成速度比上代提升5-6倍,可以完美支持最新的DX12 Ultimate的所有功能。

另外,它還支持新一代異步編程技術(shù),優(yōu)化任務(wù)調(diào)度與并行機(jī)制,再結(jié)合自研MTLink高速互聯(lián)技術(shù),可以支持10萬(wàn)卡及以上的超大規(guī)模智算集群。

未來(lái),摩爾線程將基于“花港”架構(gòu),推出高性能AI訓(xùn)推一體的“華山”芯片,以及專攻高性能圖形渲染的“廬山”芯片。


作為國(guó)產(chǎn)GPU架構(gòu),除了良好的性能,安全上自主可控更是至關(guān)重要。

“花港”架構(gòu)具備全棧自研與自主可控的核心能力,通過(guò)安全域、信任域、保護(hù)域、功能域四層硬件安全架構(gòu),提供從芯片到系統(tǒng)的可驗(yàn)證安全守護(hù)。

具體包括:硬件信任根HRoT、安全啟動(dòng)、固件安全更新與保護(hù)、可信執(zhí)行環(huán)境、硬件加解密加速引擎、國(guó)密算法、機(jī)密計(jì)算、DRM數(shù)字版權(quán)保護(hù)、生命周期管理,等等。


摩爾線程的GPU架構(gòu)基于全棧自主研發(fā),擁有扎實(shí)的專利壁壘,截至2025年6月30日,累計(jì)已申請(qǐng)專利1000多項(xiàng),獲得授權(quán)專利514項(xiàng),其中發(fā)明專利468項(xiàng)。

這,正是摩爾線程最大的底氣。

【十萬(wàn)卡集群的基礎(chǔ):AI訓(xùn)推一體芯片“華山”】



“華山”芯片基于花港架構(gòu)而來(lái),是一款專門(mén)面向AI訓(xùn)練與推理一體化的加速計(jì)算產(chǎn)品,可以支撐萬(wàn)卡級(jí)智算集群,構(gòu)建下一代“AI工廠”。

按照官方說(shuō)法,它的性能上已經(jīng)全面超越NVIDIA上一代Hopper架構(gòu)(圖中Hxxx),并且能與NVIDIA新一代Blackwell架構(gòu)(圖中Bxxx)打得有來(lái)有回。


“華山”最突出的特性就是支持新一代異步編程技術(shù),可以充分發(fā)揮每一個(gè)核心的算力。

該技術(shù)可以利用各種不同線程的同步效應(yīng),將負(fù)載任務(wù)自動(dòng)、平衡地分配到每一個(gè)計(jì)算單元,確保它們都能始終高效率工作,不至于部分單元累死、部分單元空閑。

為此摩爾線程做了大量的工作,包括設(shè)計(jì)各種不同的調(diào)度機(jī)制等,從而讓開(kāi)發(fā)者可以無(wú)感去操作芯片,不用操心具體的負(fù)載分配細(xì)節(jié)。


“華山”還集成了新一代高性能Tensor張量計(jì)算系統(tǒng)。

首先是支持全精度,從32位到4位各種整數(shù)、浮點(diǎn)、張量數(shù)據(jù)格式都支持,尤其是大幅提升了FP6、FP4張量運(yùn)算的性能,支持MTFP8/6/4混合精度計(jì)算。

新增TCE-PAIR模式,可以讓兩個(gè)TCE單元彼此共享同樣的數(shù)據(jù),增強(qiáng)內(nèi)部數(shù)據(jù)重用,提升算子效率。


基于“華山”芯片進(jìn)行橫向、縱向的擴(kuò)展,可以輕松打造十萬(wàn)卡級(jí)別的智算集群,每個(gè)節(jié)點(diǎn)的加速卡就有最多1024塊。

為此,“華山”不僅支持摩爾線程自研的MTLink 4.0互連技術(shù),還支持更多類型的開(kāi)發(fā)互聯(lián)協(xié)議,兼容不同硬件生態(tài)。

內(nèi)置RAS 2.0以增強(qiáng)集群可靠性,包括支持SRAM奇偶校驗(yàn)、ECC、強(qiáng)化錯(cuò)誤檢測(cè)上報(bào)與隔離、全面升級(jí)調(diào)試能力等等。

新一代異步通信引擎ACE 2.0,則在每一個(gè)計(jì)算單元里面設(shè)計(jì)一個(gè)小的ACE,讓更多的通信和計(jì)算可以并行執(zhí)行,極大提升整體效率。

【新一代游戲卡就看它了!圖形渲染芯片“廬山”】



當(dāng)然,對(duì)于普通用戶和游戲玩家來(lái)說(shuō),更值得關(guān)注的當(dāng)然是消費(fèi)級(jí)游戲卡。

MTT S80/S70是目前市面上唯一能夠買到的國(guó)產(chǎn)游戲卡,其硬件性能基本達(dá)到RTX 3060級(jí)別,而價(jià)格只要1499元、999元,非常實(shí)惠。

3年前誕生以來(lái),摩爾線程一直在堅(jiān)持不懈地優(yōu)化,每月都有新驅(qū)動(dòng),已累計(jì)升級(jí)36個(gè)版本,追蹤超過(guò)550款游戲的運(yùn)行情況,完成了超過(guò)220款的優(yōu)化,國(guó)內(nèi)最熱門(mén)50大游戲已全部兼容,其中44款進(jìn)行了針對(duì)性優(yōu)化,包括《黑神話:悟空》。

累積下來(lái),MTT S80的跑分性能已經(jīng)比發(fā)布時(shí)高出足足3.4倍。

同時(shí),摩爾線程專業(yè)圖形顯卡已經(jīng)全面支持國(guó)內(nèi)外的主流圖形軟件,包括國(guó)產(chǎn)的中望CAD/3D、天工CAD、剪映等等,都可以正常高效運(yùn)行。



新一代圖形渲染芯片代號(hào)“廬山”,同樣基于全功能的花港架構(gòu)。

性能提升方面,摩爾線程給了個(gè)十足的驚喜:3A游戲性能提升15倍、光追性能提升50倍、AI性能提升64倍、幾何處理性能提升16倍、紋理填充性能提升4倍、原子訪存性能提升8倍、顯存容量增大4倍(那就是最大64GB)!

當(dāng)然,這些都是理論上的最好情況,也需要驅(qū)動(dòng)的深度優(yōu)化適配,但有了MTT S80的豐富經(jīng)驗(yàn),進(jìn)展無(wú)疑會(huì)大大加快。

從以上指標(biāo)可以看出,除了3A游戲,“廬山”的專業(yè)圖形能力也得到了極大的提升,運(yùn)行CAD、CAE之類的更輕松。



“廬山”一個(gè)很重要的特性就是AI生成式渲染MTAGR。

整個(gè)渲染流水線的每一步都有AI賦能升級(jí),包括幾何著色器、網(wǎng)格著色器、像素著色器、光追材質(zhì)著色器、后處理著色器、MTSS等等,可以說(shuō)AI計(jì)算加速引擎無(wú)處不在。

MTSS其實(shí)就是MTAGR,也可以視為摩爾線程版本的DLSS、FSR,包括AI超分、AI多幀生成、光流、降噪等等。

MTAGR還支持多渲染后端,行業(yè)標(biāo)準(zhǔn)的DirectX、Vulkan和自研的MUSA兼容,同時(shí)支持Windows、Linux系統(tǒng)和主流的CPU計(jì)算架構(gòu)。


“廬山”還創(chuàng)造了一個(gè)新的任務(wù)引擎管理框架叫“統(tǒng)一任務(wù)引擎架構(gòu)”(United Task Engine)。

它可以讓每一個(gè)GPU中的計(jì)算部分充分并行,所有核心、單元全部調(diào)動(dòng)起來(lái),不至于出現(xiàn)任務(wù)分配不均,澇的澇死旱的旱死。



光追方面,花港架構(gòu)內(nèi)置專用光追計(jì)算模塊(RTU),可以適用硬件加速全場(chǎng)景遍歷求交,而不僅僅是包圍盒等少數(shù)情景,所以性能有了極大的飛躍。

同時(shí),摩爾線程自主設(shè)計(jì)了BVH加速結(jié)構(gòu)算法,可以高效生成,并節(jié)省顯存占用。

它還支持微軟DXR 1.1標(biāo)準(zhǔn),實(shí)現(xiàn)更廣泛的兼容性。


幾年來(lái),摩爾線程一步一個(gè)臺(tái)階,不斷升級(jí)支持行業(yè)標(biāo)準(zhǔn)和自研的圖形技術(shù),2023年實(shí)現(xiàn)了DX11、虛擬化,2024年底率先支持DX12,如今已支持OpenGL 4.6、Vulkan 1.3。

2026年,摩爾線程GPU不但將升級(jí)支持DX12 Ultimate,還會(huì)支持Vulkan光追以實(shí)現(xiàn)完整的光追生態(tài),支持神經(jīng)網(wǎng)絡(luò)渲染、MT Photon光子渲染引擎,以及下一代AI生成式渲染架構(gòu)MTAGR 2.0。


其中,MT Photon光子引擎是一套硬件級(jí)光追和混合渲染平臺(tái),為開(kāi)發(fā)者提供更強(qiáng)大的光追開(kāi)發(fā)接口,將其用于專業(yè)生產(chǎn)力領(lǐng)域。

它支持原生硬件加速,可直接調(diào)用多個(gè)GPU核心,而且全鏈路使用標(biāo)準(zhǔn)開(kāi)發(fā)語(yǔ)言MUSA C++,降低開(kāi)發(fā)復(fù)雜度,讓虛擬環(huán)境更接近物理現(xiàn)實(shí)。

至于基于“廬山”芯片的MTT S游戲顯卡何時(shí)發(fā)布上市,靜靜期待吧!

【大一統(tǒng)SoC芯片長(zhǎng)江和兩臺(tái)整機(jī)】


本次發(fā)布的第三顆芯片有些特殊,是一個(gè)完整的SoC片上系統(tǒng),代號(hào)“長(zhǎng)江”。

它匯聚了幾乎所有計(jì)算單元,具體包括:

CPU:8個(gè)全大核,主頻最高2.65GHz,主打高性能低功耗,自然是Arm架構(gòu)。

GPU:來(lái)自摩爾線程自研的全功能GPU,主打高性能3D渲染、大模型端側(cè)推理。

NPU:可編程雙核心,支持語(yǔ)音、圖像的多模態(tài)加速處理。

VPU:視頻處理單元,支持H.264、H.264、AV1等格式的編解碼,支持8K30、4K60。

DPU:顯示處理單元,支持高清多屏,包括雙屏8K60、八屏4K60。

DSP:數(shù)字信號(hào)處理單元,高性能雙核設(shè)計(jì),支持AI降噪、Hi-Fi音效等。

ISP:圖像處理單元,最高支持3200萬(wàn)像素?cái)z像頭,也支持HDR。

內(nèi)存支持32/64GB LPDDR5X,帶寬超過(guò)100GB/s,不過(guò)沒(méi)說(shuō)通道數(shù)量、具體頻率。

“長(zhǎng)江”的異構(gòu)AI總算力超過(guò)50 TOPS,同時(shí)支持FP64、FP32、FP16等多精度計(jì)算,但似乎低精度方面還有所欠缺。


“長(zhǎng)江”芯片首批有三款產(chǎn)品,一是筆記本,二是臺(tái)式迷你機(jī),三是迷你開(kāi)發(fā)模塊。

筆記本,或者嚴(yán)格來(lái)說(shuō)是AI算力本,叫做“AIBOOK”

它是專為AI學(xué)習(xí)與開(kāi)發(fā)者打造的個(gè)人智算平臺(tái),或者說(shuō)其實(shí)就是個(gè)算力本、開(kāi)發(fā)本,也兼具日常使用。


AIBOOK默認(rèn)運(yùn)行基于Linux內(nèi)核的MT AIOS操作系統(tǒng),并具備多系統(tǒng)兼容能力,支持Windows虛擬機(jī)、Android容器,也兼容主流的國(guó)產(chǎn)操作系統(tǒng)。

預(yù)置完整的AI開(kāi)發(fā)環(huán)境、工具鏈、包管理工具、常用庫(kù)、框架等等,VS Code、Jupyter Notebook、Pyhton、PyTorch、vLLM、Pandas等都在,還提供GPU驅(qū)動(dòng)支持和配套工具包,開(kāi)發(fā)部署也進(jìn)行了簡(jiǎn)化。

此外,AIBOOK端側(cè)最高可運(yùn)行30B參數(shù)大模型,預(yù)裝了阿里的Qwen3-8B大模型、智源悟界的Emu 3.5多模態(tài)世界模型,支持視覺(jué)指導(dǎo)、視覺(jué)故事、圖片編輯、文本生圖等能力。




利用它,開(kāi)發(fā)者可以輕松打造各種AI應(yīng)用和智能體。

它也內(nèi)置了數(shù)字人智能體“小麥”以及豐富的AI應(yīng)用,預(yù)置MUSAChat-72B大模型具備出色的理解與推理能力,還支持靈活調(diào)用各種模型的API,提供開(kāi)箱即用的一站式AI體驗(yàn)。

“小麥”現(xiàn)已開(kāi)放核心能力,開(kāi)發(fā)者可通過(guò)官方文檔中心獲取云端API、本地SDK。


配置方面,AIBOOK采用極簡(jiǎn)設(shè)計(jì),航空級(jí)鋁合金材質(zhì)一體成型,薄至12.4毫米,輕至1.35千克。

14寸OLED屏幕屏占比達(dá)91%,支持2.8K高分辨率、120Hz高刷新率,配備4揚(yáng)聲器、4麥克風(fēng)陣列、1080p攝像頭、1.5毫米鍵程鍵盤(pán)、12×7.5毫米觸摸板。

內(nèi)置1TB SSD、70Whr電池,提供三個(gè)USB-C接口、Wi-Fi 6、藍(lán)牙5.2。

價(jià)格9999元,現(xiàn)已開(kāi)放預(yù)售。


另一款整機(jī)則是迷你型的“MTT AICube”,進(jìn)一步豐富端側(cè)計(jì)算產(chǎn)品形態(tài),同樣基于“長(zhǎng)江”SoC,同樣支持多系統(tǒng)、端云大模型。

很顯然,它的設(shè)計(jì)思路和用途就類似AMD 395、NVIDIA DGX Spark這樣的個(gè)人開(kāi)發(fā)用迷你機(jī)。

具體細(xì)節(jié)沒(méi)有展開(kāi)講,不過(guò)官方已經(jīng)向開(kāi)發(fā)者發(fā)出了征集令,歡迎體驗(yàn)。


另外就是MTT E300 AI模組,極致小巧,被動(dòng)散熱。

憑借高算力、全棧AI工具鏈、端云協(xié)同架構(gòu),它可提供高性能、低延遲、強(qiáng)可靠的國(guó)產(chǎn)邊緣AI解決方案,廣泛應(yīng)用于工業(yè)、能源、教育、交通、醫(yī)療等行業(yè)。

【十萬(wàn)卡夸娥智算集群】


接下來(lái)講講剛才提到過(guò)的“夸娥”萬(wàn)卡智算集群(KUAE 2.0),也是本次大會(huì)的一個(gè)重磅亮點(diǎn)。

這東西看似和普通人距離很遠(yuǎn),但卻是國(guó)家AI算力的關(guān)鍵基礎(chǔ)設(shè)施,我們?nèi)粘J褂玫拇罅緼I服務(wù)也都是它們?cè)谀缓竽峁┲С帧?/p>

從千卡集群起步,做到萬(wàn)卡集群,摩爾線程接下來(lái)還要沖擊10萬(wàn)卡、100萬(wàn)卡、1000萬(wàn)卡……


摩爾線程夸娥萬(wàn)卡集群成功攻克了萬(wàn)卡級(jí)硬件篩選、高速互聯(lián)、系統(tǒng)級(jí)容錯(cuò)等高難度工程級(jí)難題,可支撐萬(wàn)億參數(shù)大模型的訓(xùn)練與部署。

該集群具備全精度、全功能通用計(jì)算能力,在萬(wàn)卡規(guī)模下實(shí)現(xiàn)高效穩(wěn)定的AI訓(xùn)練與推理。

訓(xùn)練算力利用率(MFU)在Dense稠密大模型上達(dá)60%,MoE專家大模型上達(dá)40%,有效訓(xùn)練時(shí)間占比超過(guò)90%,訓(xùn)練線性擴(kuò)展效率達(dá)95%,訓(xùn)練容錯(cuò)系統(tǒng)目標(biāo)ETTR達(dá)到99%,并與國(guó)內(nèi)、國(guó)際主流生態(tài)高度兼容,在多項(xiàng)指標(biāo)上具備顯著能效優(yōu)勢(shì)。

軟件方面有KUAE RAS System Daemon,可以守護(hù)萬(wàn)卡集群的穩(wěn)定性、性能、正確性,目標(biāo)是提升客戶萬(wàn)卡訓(xùn)練成功率30%。

在客戶系統(tǒng)無(wú)感情況下,它可以快速定位并替換集群故障節(jié)點(diǎn)、慢節(jié)點(diǎn)、SDC 節(jié)點(diǎn),有效保障客戶萬(wàn)卡訓(xùn)練穩(wěn)定性、高性能、正確性。


摩爾線程聯(lián)合硅基流動(dòng),實(shí)現(xiàn)國(guó)產(chǎn)GPU與軟件棧的全棧優(yōu)化,大幅提升了AI推理性能。

基于摩爾線程最新AI加速卡MTT S5000,運(yùn)行DeepSeek R1 671B全量模型,單卡Prefill吞吐突破了4000 tokens/s,Decode吞吐也突破了1000 tokens/s,可支持高并發(fā)、低延遲的大模型服務(wù)。


摩爾線程還計(jì)劃推出第一代超級(jí)節(jié)點(diǎn)產(chǎn)品MTT C256,著眼高密硬件架構(gòu)。

它以一層scale-up網(wǎng)絡(luò),實(shí)現(xiàn)兩臺(tái)機(jī)柜256塊加速卡的全互聯(lián),從而規(guī)避兩層以上網(wǎng)絡(luò)帶來(lái)的帶寬損失和額外延遲,大幅提高智算集群的GPU部署密度。

此外,本次MUSA開(kāi)發(fā)者大會(huì),摩爾線程還介紹了全功能GPU在生命科學(xué)計(jì)算、量子科技、6G、具身智能與仿真、物理引擎、仿真環(huán)境訓(xùn)練、智能駕駛物理AI仿真等各領(lǐng)域的應(yīng)用與發(fā)展,“摩爾學(xué)院”開(kāi)發(fā)者扶持項(xiàng)目等等,不再一一展開(kāi)。

【應(yīng)用展示】



大會(huì)現(xiàn)場(chǎng),摩爾線程聯(lián)合眾多行業(yè)生態(tài)伙伴,設(shè)置了超過(guò)1000平方米的主題展區(qū),內(nèi)容覆蓋AI大模型與智能體、具身智能機(jī)器人、科學(xué)計(jì)算、空間智能等前沿技術(shù)領(lǐng)域,以及工業(yè)智造、數(shù)字孿生、數(shù)字文娛、智慧醫(yī)療等熱門(mén)應(yīng)用場(chǎng)景,還有眾多基于摩爾線程GPU的產(chǎn)品。

接下來(lái)挑一部分摩爾線程與生態(tài)伙伴的合作產(chǎn)品以及案例,和大家分享。


B700 AI BOX:

聯(lián)達(dá)興推出的國(guó)產(chǎn)高性能智能終端設(shè)備,支持4K60Hz超清雙顯,集成雙千兆網(wǎng)口、Wi-Fi 6及藍(lán)牙5.3無(wú)線模塊,配備專業(yè)音頻接口和DC供電,完美適配智能會(huì)議、數(shù)字標(biāo)牌等AIoT應(yīng)用場(chǎng)景。


ME10工業(yè)級(jí)智算BOX:

天思智慧的國(guó)產(chǎn)高性能計(jì)算設(shè)備,基于“長(zhǎng)江”SoC,最多32GB LDDR5/5X內(nèi)存,具備寬溫適應(yīng)性和豐富接口,適用于智能制造、智慧城市、智慧醫(yī)療及教育等領(lǐng)域。


ME21 AI迷你機(jī):

高性能國(guó)產(chǎn)AI計(jì)算終端,同樣基于“長(zhǎng)江”SoC,專為本地大模型部署設(shè)計(jì),完美適用于智能辦公、邊緣計(jì)算及AI教育等領(lǐng)域。


SD5600MX100:

國(guó)儀海聚打造,為智能系統(tǒng)與平臺(tái)提供高算力核心,滿足車規(guī)、工業(yè)自動(dòng)化、醫(yī)療等行業(yè)需求,擁有出色的成本控制以及靈活的I/O設(shè)計(jì)。


后羿智盒HOUYI-1000B:

全愛(ài)科技的GPU大模型AI端側(cè)部署工控機(jī),3.5寸標(biāo)準(zhǔn)工業(yè)主板形態(tài),無(wú)風(fēng)扇散熱,可適應(yīng)更嚴(yán)苛場(chǎng)景,可支持32B大模型的端側(cè)部署,滿足深度學(xué)習(xí)、機(jī)器視覺(jué)推理、無(wú)人機(jī)、智能車等復(fù)雜AI任務(wù)的需求,廣泛應(yīng)用于安防、交通、科研、教育等眾多領(lǐng)域。


后羿智盒HOUYI-Pi-B:

全愛(ài)科技打造,超小體積,可實(shí)現(xiàn)端側(cè)大模型的廣泛應(yīng)用,支持i32B大模型的端側(cè)部署,能夠滿足深度學(xué)習(xí)機(jī)器視覺(jué)推理等復(fù)雜AI任務(wù)的需求,廣泛用于機(jī)器人、無(wú)人機(jī)、視頻服務(wù)器等場(chǎng)景。


物流無(wú)人機(jī):

紫光計(jì)算機(jī)的小載重四旋翼末端配送設(shè)備,專為1千克小型包裹運(yùn)輸資料設(shè)計(jì),支持4G/5G/專網(wǎng)通信,采用RTK+視覺(jué)融合精準(zhǔn)降落,搭配訂單APP、飛行管理平臺(tái)及機(jī)庫(kù),可自主完成航線飛行與投遞任務(wù)。


柳工CLG922E挖掘機(jī)(圖為示意模型):

基于MindEdge L100邊緣計(jì)算平臺(tái),有效實(shí)現(xiàn)工程機(jī)械的智能化升級(jí),整合設(shè)備運(yùn)行數(shù)據(jù)與音視頻信息,在邊緣側(cè)持續(xù)優(yōu)化故障診斷、壽命預(yù)測(cè)、能效管理及自動(dòng)駕駛等AI模型,有效解決了大型挖掘機(jī)在復(fù)雜工況下的安全、節(jié)能與穩(wěn)定性挑戰(zhàn)。

甚至就連盾構(gòu)機(jī),都用上了摩爾線程GPU!

基于雪浪云研發(fā)的“盾構(gòu)大腦”,打通內(nèi)部七大主要控制系統(tǒng)、外部多個(gè)施工環(huán)境感知和遠(yuǎn)程運(yùn)維系統(tǒng),打造了一體化集成控制的盾構(gòu)機(jī)復(fù)雜工況自適應(yīng)控制中樞,精準(zhǔn)解決了隧道施工過(guò)程掘不快、掘不準(zhǔn)、掘不穩(wěn)的難題。


羅拉超算體LoLR CUBE(法律版):

搭載摩爾線程MTT E300 64GB模組,聯(lián)手打造端側(cè)全棧(CPU+GPU/NPU+FPGA),最高可驅(qū)動(dòng)300億大模型推理,閱卷解析處理快至10秒/頁(yè),相比傳統(tǒng)人工閱卷效率提升約100倍,支持法律文書(shū)批量生成與AI輔助優(yōu)化。


羅拉超算體LoLR CUBE(財(cái)稅版):

同樣搭載摩爾線程MTT E300 64GB模組,配置2000+專業(yè)指標(biāo)、300億AI風(fēng)控大模型,集結(jié)多領(lǐng)域Agent數(shù)字專家,提供7X24小時(shí)實(shí)時(shí)監(jiān)控、100%稅收政策同步與超99%任務(wù)準(zhǔn)確率。


紫光計(jì)算機(jī)UltiStation 800H工作站:

旗艦級(jí)國(guó)產(chǎn)化單路工作站,搭載海光C86-4G處理器,最高支持128GB DDR5內(nèi)存及PCIe 5.0高速存儲(chǔ)與顯卡,搭載摩爾線程高性能專業(yè)顯卡,廣泛應(yīng)用在政府、教育及行業(yè)領(lǐng)域的專業(yè)圖形處理、仿真與AI計(jì)算任務(wù)。

現(xiàn)場(chǎng)還有一套紫光計(jì)算機(jī)100P智算集群,基于摩爾線程MTT S4000。



保障特種作業(yè)人員安全、實(shí)現(xiàn)“無(wú)人化”操作,是核電等高風(fēng)險(xiǎn)行業(yè)轉(zhuǎn)型的核心要?jiǎng)?wù)。

景業(yè)智能打造的VR遙操作機(jī)器人系統(tǒng),已與摩爾線程AI模組MTT E300、高性能顯卡MTT S80完成適配。

操作人員通過(guò)佩戴VR眼鏡,即可遠(yuǎn)程精準(zhǔn)控制特種機(jī)器人,在實(shí)際輻射等高風(fēng)險(xiǎn)環(huán)境中完成精細(xì)任務(wù),實(shí)現(xiàn)“人以遙操,機(jī)器代勞”。

該方案以MTT E300確保機(jī)器人控制與視頻轉(zhuǎn)發(fā)的精準(zhǔn)穩(wěn)定,以MTT S80保障駕駛艙視頻的流暢串流,構(gòu)建超低延遲、高可靠的操控閉環(huán)。



景業(yè)智能打造的智能巡檢機(jī)器狗,具備自主理解與泛化推理能力,通過(guò)全景攝像頭與雙光譜云臺(tái),能在復(fù)雜園區(qū)環(huán)境中自主完成人員識(shí)別、安全隱患排查、設(shè)備狀態(tài)監(jiān)測(cè)等多元任務(wù)。

該方案已與摩爾線程MTT S4000完成適配,通過(guò)全功能GPU的強(qiáng)大算力部署并加速Q(mào)wen大模型,可為巡檢機(jī)器狗賦予關(guān)鍵的場(chǎng)景理解與實(shí)時(shí)推理能力。

中望軟件的全棧國(guó)產(chǎn)化三維CAD一體化解決方案,基于摩爾線程MTT X300專業(yè)顯卡,適配多種國(guó)產(chǎn)CPU與操作系統(tǒng),可流暢渲染復(fù)雜三維模型。

ADAI自研的ADXL Pro Max生圖模型、AD Edit編輯模型,已服務(wù)數(shù)十萬(wàn)C端用戶、500多家行業(yè)用戶,累計(jì)生成圖像數(shù)量突破8000萬(wàn)張,現(xiàn)已深度適配摩爾線程GPU。


北太天元科學(xué)計(jì)算軟件,面向科學(xué)計(jì)算與工程計(jì)算,是國(guó)內(nèi)首款通用型科學(xué)計(jì)算與系統(tǒng)仿真軟件,自主構(gòu)建非開(kāi)源技術(shù)路線,全鏈條自主可控,已集成MUSA加速計(jì)算能力,成為全球首款原生集成AI能力的科學(xué)計(jì)算工具,可全面替代MATLAB、Simulink。


微眸醫(yī)療眼科手術(shù)機(jī)器人,可實(shí)現(xiàn)手術(shù)過(guò)程中的本地化實(shí)時(shí)感知與智能決策,充分滿足眼科手術(shù)對(duì)微米級(jí)操作精度、高安全性、患者隱私保護(hù)的嚴(yán)格要求。



微視威eVTOL全動(dòng)飛行模擬器,全鏈路自主研發(fā),1:1封閉座艙與六自由度運(yùn)動(dòng)平臺(tái),搭載基于北京大學(xué)ViWo引擎的ViSYS視景系統(tǒng),可高質(zhì)量模擬低空飛行場(chǎng)景,國(guó)內(nèi)首個(gè)通過(guò)中國(guó)民航局5級(jí)鑒定的國(guó)產(chǎn)視景系統(tǒng),已成功出口海外。

模擬器基于摩爾線程MTT X300專業(yè)顯卡,首次打通全國(guó)產(chǎn)化視景渲染鏈路,不僅可用于飛行員訓(xùn)練,也支持eVTOL機(jī)型工程驗(yàn)證。


面向文旅、政務(wù)、面試培訓(xùn)等不同領(lǐng)域的數(shù)字人。


摩爾線程MTVSR實(shí)時(shí)視頻超分技術(shù),端側(cè)運(yùn)行,可將分辨率提升2-4倍,多檔質(zhì)量設(shè)定,顯著提升低分辨率視頻在高分辨率屏幕下的清晰度,還將以SDK形式支持播放器、瀏覽器等App集成調(diào)用。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
紅薯立大功!研究發(fā)現(xiàn):堅(jiān)持吃紅薯一段時(shí)間,或迎來(lái)5個(gè)好轉(zhuǎn)信號(hào)

紅薯立大功!研究發(fā)現(xiàn):堅(jiān)持吃紅薯一段時(shí)間,或迎來(lái)5個(gè)好轉(zhuǎn)信號(hào)

全球軍事記
2025-12-27 17:23:45
玩起陰謀,你必然不是對(duì)手的幾大星座

玩起陰謀,你必然不是對(duì)手的幾大星座

星座葉大仙
2025-12-31 11:24:21
世界是巨大的假象,這是人類社會(huì)最大的秘密

世界是巨大的假象,這是人類社會(huì)最大的秘密

水木然
2025-12-30 23:12:13
王思聰包私人飛機(jī)陪懶懶馬爾代夫過(guò)節(jié),緋聞女友王建國(guó)發(fā)文疑吃醋

王思聰包私人飛機(jī)陪懶懶馬爾代夫過(guò)節(jié),緋聞女友王建國(guó)發(fā)文疑吃醋

小咪侃娛圈
2025-12-31 09:40:30
“消失”已久的聾啞女孩邰麗華,結(jié)婚生子后,卻走上了另一條大道

“消失”已久的聾啞女孩邰麗華,結(jié)婚生子后,卻走上了另一條大道

近史談
2025-12-29 12:20:19
剪發(fā)、玩手機(jī)、拒交流!小玥兒這波“無(wú)聲反抗”,狠狠打誰(shuí)的臉?

剪發(fā)、玩手機(jī)、拒交流!小玥兒這波“無(wú)聲反抗”,狠狠打誰(shuí)的臉?

阿廢冷眼觀察所
2025-12-29 03:51:04
西部排名又變了:馬刺爆冷連敗,火箭三喜臨門(mén),2隊(duì)排名互換

西部排名又變了:馬刺爆冷連敗,火箭三喜臨門(mén),2隊(duì)排名互換

籃球大視野
2025-12-30 17:56:10
突然公布!055發(fā)射一枚大型導(dǎo)彈,到底是鷹擊-21還是鷹擊-20?

突然公布!055發(fā)射一枚大型導(dǎo)彈,到底是鷹擊-21還是鷹擊-20?

壹知眠羊
2025-12-31 11:50:13
熟女界的“復(fù)仇者聯(lián)盟”!Madonna 2025十大王牌!

熟女界的“復(fù)仇者聯(lián)盟”!Madonna 2025十大王牌!

孤獨(dú)的獨(dú)角獸影視
2025-12-31 09:10:09
澳洲既有煤礦又有鐵礦,為啥不發(fā)展鋼鐵業(yè),而是直接出口這些礦產(chǎn)

澳洲既有煤礦又有鐵礦,為啥不發(fā)展鋼鐵業(yè),而是直接出口這些礦產(chǎn)

向航說(shuō)
2025-12-24 00:20:02
穎兒攜女回西安婆家聚餐,被拍全程戴墨鏡駝背吃飯,儀態(tài)引熱議

穎兒攜女回西安婆家聚餐,被拍全程戴墨鏡駝背吃飯,儀態(tài)引熱議

最新聲音
2025-12-31 09:12:05
提前放學(xué)!南京不少學(xué)校今天只上半天課

提前放學(xué)!南京不少學(xué)校今天只上半天課

南京擇校
2025-12-31 12:06:10
打爆遼寧隊(duì),碾壓趙睿徐杰,CBA第一后衛(wèi)爆發(fā),中國(guó)男籃必帶他

打爆遼寧隊(duì),碾壓趙睿徐杰,CBA第一后衛(wèi)爆發(fā),中國(guó)男籃必帶他

宗介說(shuō)體育
2025-12-30 17:30:40
永州美女老板徹底拒絕送車!悄悄清空社媒+刪除承諾 球迷:不要臉

永州美女老板徹底拒絕送車!悄悄清空社媒+刪除承諾 球迷:不要臉

風(fēng)過(guò)鄉(xiāng)
2025-12-30 20:54:18
北京市退休老人,平均養(yǎng)老金有沒(méi)有6000元?一起了解計(jì)算公式

北京市退休老人,平均養(yǎng)老金有沒(méi)有6000元?一起了解計(jì)算公式

暖心人社
2025-12-31 00:04:29
李兆會(huì)的18年復(fù)仇路

李兆會(huì)的18年復(fù)仇路

詩(shī)意世界
2025-10-10 14:09:20
上海交大發(fā)現(xiàn):不吃醬油和味精的人,血壓馬上就降低了?真的嗎

上海交大發(fā)現(xiàn):不吃醬油和味精的人,血壓馬上就降低了?真的嗎

健康之光
2025-12-31 13:05:03
汽車“以舊換新”補(bǔ)貼升級(jí):2026年置換最高補(bǔ)1.5萬(wàn)元

汽車“以舊換新”補(bǔ)貼升級(jí):2026年置換最高補(bǔ)1.5萬(wàn)元

艾米手工作品
2025-12-31 12:31:13
蔣介石這個(gè)人講究,比如:不抽煙、不喝飲料、不喝酒、更不品茶

蔣介石這個(gè)人講究,比如:不抽煙、不喝飲料、不喝酒、更不品茶

忠于法紀(jì)
2025-11-25 09:06:26
俄羅斯的“德魯日巴”輸油管道突發(fā)大規(guī)模爆炸!噴出數(shù)十米火球

俄羅斯的“德魯日巴”輸油管道突發(fā)大規(guī)模爆炸!噴出數(shù)十米火球

項(xiàng)鵬飛
2025-12-30 18:21:19
2025-12-31 14:40:49
快科技 incentive-icons
快科技
一起關(guān)注每日科技熱點(diǎn)
102869文章數(shù) 259885關(guān)注度
往期回顧 全部

科技要聞

老羅,演砸了,也封神了?

頭條要聞

敏感時(shí)刻 美國(guó)駐華大使在北京“硬刷存在感”

頭條要聞

敏感時(shí)刻 美國(guó)駐華大使在北京“硬刷存在感”

體育要聞

2025全球射手榜:姆巴佩66球 梅西第6C羅第9

娛樂(lè)要聞

告別2025年!大S、方大同離世青春退場(chǎng)

財(cái)經(jīng)要聞

朱光耀:美關(guān)稅政策正使WTO名存實(shí)亡

汽車要聞

奇瑞QQ3量產(chǎn)版曝光! 軸距2米7配8155芯片

態(tài)度原創(chuàng)

本地
健康
藝術(shù)
游戲
親子

本地新聞

即將過(guò)去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

中國(guó)博物館全書(shū)!看遍中國(guó)8000年頂流審美

PS模擬器時(shí)隔十年首次迎來(lái)更新!可跨平臺(tái)存檔

親子要聞

來(lái)自老師的小紙條,讓孩子們眼里閃著光! 網(wǎng)友:一張小紙條,改變的可能是孩子的一生

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产精品玩偶在线观看| 色七七桃花影院| 亚欧av级毛片在线观看| 亚洲av无码专区在线观看下载| 97狠狠狠狼鲁亚洲综合网| 国产男男做受69高| 精品国产乱码久久久久就一区二区| 粉嫩在线一区二区三区视频| 成人欧美一区二区三区视频网页 | 制服丝袜AV无码专区完整版| 被黑人猛躁10次高潮视频| 亚洲精品乱码久久久久久9色| 人妻体体内射精一区二区| XXX,性COM| 国产精品美女久久久久AⅤ | 日韩aⅴ一区二区三区| 久久亚洲日韩AV一区二区三区| 亚洲视频婷婷| 国产精品 Ⅹ| 日韩内射视频| 欧美视频在线电影网| 久久影院九九被窝爽爽| 国产you精品在线| 日本一区二区在线播放| 欧美喷潮久久久xxxxx| 翁公粗大挺进王丽霞高潮嗨文| 日本一区二区不卡精品| JAPAN成熟少妇VIDEOS| 国产精品美女爽爽爽WWW视频| 日本丰滿岳乱DVD| 日韩欧美在线操b| 国产三级无码视频| 交换配乱婬XXXX复古| 亚洲综合欧美色五月俺也去| 天天色天天综合网| 十八禁 蜜桃视一区二区三区频| 2020久久超碰国产精品最新 | 伊人久久大香线蕉av网| 国产激情无码视频在线播放性色| 一产二产久久久| 国产精品一区二区不卡91|