夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

羅福莉首秀前,小米突然發(fā)布!代碼全球最強(qiáng),總體媲美DeepSeek-V3.2【附實(shí)測(cè)】

0
分享至


智東西
作者 程茜
編輯 李水青

智東西12月17日?qǐng)?bào)道,今天,小米發(fā)布并開源了最新MoE大模型MiMo-V2-Flash,總參數(shù)309B,激活參數(shù)15B。今日上午,小米2025小米人車家全生態(tài)合作伙伴大會(huì)上,Xiaomi MiMO大模型負(fù)責(zé)人羅福莉將首秀并發(fā)布主題演講。


該模型專為推理、編碼和Agent場(chǎng)景構(gòu)建,支持混合思維模式,允許用戶切換模型是“思考”還是即時(shí)回答。它能一鍵生成功能齊全的HTML網(wǎng)頁(yè),并與Claude Code、Cursor和Cline等氛圍編碼框架協(xié)同。該模型提供256k上下文窗口,能夠完成數(shù)百輪Agent交互和工具調(diào)用的任務(wù)。

基準(zhǔn)測(cè)試結(jié)果顯示,MiMo-V2-Flash的性能基本與DeepSeek-V3.2相當(dāng),僅在不使用任何工具輔助的“人類最后一場(chǎng)考試”和創(chuàng)意文本生成評(píng)估ARENA-HARD中略遜色于DeepSeek-V3.2,但時(shí)延更小。


MiMo-V2-Flash能以每秒150個(gè)token的速度實(shí)現(xiàn)極其快速的推理,價(jià)格方面,其每百萬(wàn)輸入token 0.7元、每百萬(wàn)輸出token 2.1元。


小米已經(jīng)開源了MiMo-V2-Flash所有內(nèi)容,并向開發(fā)者社區(qū)SGLang貢獻(xiàn)了所有推理代碼,API限時(shí)免費(fèi)。目前,用戶可以在網(wǎng)頁(yè)端免費(fèi)體驗(yàn)MiMo-V2-Flash。

開源地址:https://t.co/4Etm0yZKTL

體驗(yàn)地址:https://aistudio.xiaomimimo.com/#/

技術(shù)報(bào)告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

一、能寫長(zhǎng)文、做精美網(wǎng)頁(yè),但實(shí)測(cè)尚不穩(wěn)定

智東西先實(shí)測(cè)了下MiMo的網(wǎng)頁(yè)開發(fā)能力。

首先,智東西讓其生成了一個(gè)電商頁(yè)面,需要包含商品主圖輪播、規(guī)格選擇、價(jià)格、庫(kù)存等要素。代碼生成后,MiMo會(huì)在右側(cè)顯示預(yù)覽界面,除查看商品大圖功能需要在完整版使用,其他元素幾乎和真實(shí)的線上購(gòu)物沒有差別。


然后加大難度,智東西讓其生成了一個(gè)網(wǎng)頁(yè)版迷宮闖關(guān)小游戲,需要包含四個(gè)難度,能通過鼠標(biāo)和鍵盤控制。在生成的網(wǎng)頁(yè)里,MiMo還增加了提示、積分、計(jì)時(shí)等功能,整個(gè)交互體驗(yàn)更加完整。


智東西還讓其生成了“圣誕樹裝飾”交互網(wǎng)頁(yè)。網(wǎng)頁(yè)左側(cè)有彩燈、鈴鐺、星星、禮物盒、蝴蝶結(jié),可以拖動(dòng)這些物品裝飾到右側(cè)的圣誕樹上,也可以一鍵清空或者直接生成隨機(jī)裝飾。整個(gè)畫面會(huì)不斷飄落雪花,還可以播放背景音樂。


對(duì)于聊天能力,智東西先讓MiMo“用程序員的語(yǔ)氣安慰一只失戀的貓”,MiMo會(huì)讓小貓“清理緩存”忘掉不開心的事,還讓小貓“升級(jí)硬件”,順便幫小米打了波廣告。


最后智東西讓MiMo生成了一部科幻懸疑題材的AI短劇劇本。一上來,MiMo就給出了深潛記憶提取頭盔、真理之環(huán)AI倫理防火墻兩個(gè)關(guān)鍵要素,通過檢索發(fā)現(xiàn),MiMo在后續(xù)劇情中將這兩大物體融入進(jìn)去,直接作為推動(dòng)劇情發(fā)展的關(guān)鍵。


此外,小米在官方博客也放出了不少案例。

首先是網(wǎng)頁(yè)生成能力上,其第一個(gè)官方案例是“用HTML生成一個(gè)漂亮、可用的macOS模擬操作系統(tǒng)”。在最終的生成界面中,包含了基本的macOS風(fēng)格桌面圖標(biāo),還可以切換背景、打開Finder。


其次是,打造“豪華互動(dòng)圣誕樹”高保真3D網(wǎng)頁(yè)應(yīng)用,并要求視覺效果奢華,MiMo的生成結(jié)果能切換圣誕樹和混沌狀態(tài),支持手勢(shì)交互等。


第三個(gè)演示是用HTML創(chuàng)建交互式太陽(yáng)系探測(cè)器。當(dāng)用戶點(diǎn)擊每個(gè)球體就會(huì)出現(xiàn)行星的簡(jiǎn)介。


智東西也讓MiMo“用HTML創(chuàng)建一個(gè)教育性的交互式太陽(yáng)系探索器”,不過最后的結(jié)果并不如官方演示的質(zhì)感。其第一次生成時(shí)行星無法選擇,重新生成后可選擇行星下面的選項(xiàng)直接不見了。


聊天能力方面,MiMo既能回答“大語(yǔ)言模型擁有知識(shí)嗎”這類硬核科普類知識(shí)。


MiMo還可以回答“要不要吃長(zhǎng)生不老藥丸”,MiMo還會(huì)站在人類視角分析要不要吃、可能有哪些條件。


此外,該模型還具備長(zhǎng)文本撰寫能力,其可以“寫一個(gè)關(guān)于誤送信件的憂郁愛情故事”。


MiMo還能寫深刻的非虛構(gòu)作品,如以一位獨(dú)居老人為中心,以他一周內(nèi)收到的郵件為主,探討現(xiàn)代社會(huì)中的孤獨(dú)。


二、專為推理、編碼和Agent構(gòu)建,與K2 Thinking和DeepSeek V3.2 Thinking相當(dāng)

在數(shù)學(xué)競(jìng)賽AIME 2025和科學(xué)知識(shí)基準(zhǔn)GPQA-Diamond中,MiMo-V2-Flash的表現(xiàn)是開源模型中前二。在軟件工程能力的SWE驗(yàn)證與多語(yǔ)言基準(zhǔn)測(cè)試中,MiMo-V2-Flash在所有開源模型中位列第一,與全球頂尖閉源模型齊名。

從總的基準(zhǔn)測(cè)試結(jié)果來看,MiMo-V2-Flash在大多數(shù)推理基準(zhǔn)測(cè)試中的性能可與K2 Thinking和DeepSeek V3.2 Thinking相當(dāng),同時(shí)保持高質(zhì)量開放式回答的競(jìng)爭(zhēng)力。

在長(zhǎng)上下文評(píng)估中,MiMo的模型超過了K2 Thinking。


在Agent任務(wù)中,MiMo-V2-Flash在SWE-Bench Verified中超越所有開源競(jìng)爭(zhēng)對(duì)手,性能接近 GPT-5-High。在SWE-Bench多語(yǔ)版本中,MiMo-V2-Flash解決了71.7%的問題。

在搜索Agent評(píng)估方面,MiMo-V2-Flash在BrowseComp上得分為45.4,配合上下文管理進(jìn)一步提升至58.3。


小米已經(jīng)共享所有推理代碼至SGLang并開源,社區(qū)實(shí)測(cè)單機(jī)結(jié)果如下:

在Prefill單機(jī)吞吐約50000 toks/s的條件下,不同Context Length都取得了優(yōu)越的TTFT性能。


得益于3層MTP,在16K的Context Length情況下,Decode可以做到單機(jī)吞吐5000 ~ 15000 toks/s的同時(shí)達(dá)到151~115 toks/s的單請(qǐng)求吞吐。


三、引入MTP訓(xùn)練,后訓(xùn)練階段提出MOPD

MiMo-V2-Flash的效率提升是因?yàn)槠錇楦咄客评碓O(shè)計(jì)了創(chuàng)新架構(gòu)進(jìn)步。

該模型全局注意力(GA)和滑動(dòng)窗口注意力(SWA)的1:5混合結(jié)構(gòu)。小米MiMo研究團(tuán)隊(duì)大量的實(shí)證結(jié)果表明,SWA簡(jiǎn)單、高效且易于使用,在通用任務(wù)、長(zhǎng)上下文負(fù)載和推理方面整體表現(xiàn)優(yōu)于線性注意力。


它還提供固定大小的KV緩存,便于與現(xiàn)有的訓(xùn)練和推理基礎(chǔ)設(shè)施集成。

研究人員重新定義了并行解碼,以實(shí)現(xiàn)極高的輸出token吞吐量:通過引入多詞元預(yù)測(cè)(MTP)訓(xùn)練,提升了基礎(chǔ)模型的能力,并在推理過程中并行驗(yàn)證了MTP。


MiMo-V2-Flash利用MTP作為原生草稿模型進(jìn)行自我推測(cè)解碼,實(shí)現(xiàn)了實(shí)際部署加速。

大語(yǔ)言模型的解碼過程本質(zhì)上受限于內(nèi)存,這是由其低運(yùn)算密度特性決定的。業(yè)界通常采用批量級(jí)并行技術(shù)提升前饋網(wǎng)絡(luò)(FFN)的運(yùn)算密度,但該方法對(duì)注意力計(jì)算環(huán)節(jié)并無增益,原因在于每個(gè)推理請(qǐng)求都需維護(hù)獨(dú)立的KV cache。

相比之下,MTP技術(shù)通過一次性生成多個(gè)草稿token,同步提升了前饋網(wǎng)絡(luò)(FFN)與注意力機(jī)制的運(yùn)算密度,后續(xù)主模型可對(duì)這些草稿token進(jìn)行并行驗(yàn)證。這種方案能夠?qū)崿F(xiàn)token級(jí)并行計(jì)算,且不會(huì)增加KV cache的輸入輸出開銷。

在MiMo-V2-Flash模型中,MTP模塊采用稠密前饋網(wǎng)絡(luò)來控制參數(shù)量,同時(shí)使用滑動(dòng)窗口注意力機(jī)制,從而降低KV cache與注意力計(jì)算的成本。

實(shí)測(cè)數(shù)據(jù)顯示,3層結(jié)構(gòu)的MTP模塊可達(dá)到2.8-3.6個(gè)token的有效接受長(zhǎng)度,并實(shí)現(xiàn)2.0-2.6倍的推理速度提升。


MiMo-V2-Flash預(yù)訓(xùn)練使用FP8混合精度和原生32k序列長(zhǎng)度,使用27T token進(jìn)行訓(xùn)練。

在后訓(xùn)練階段,為高效拓展強(qiáng)化學(xué)習(xí)的計(jì)算規(guī)模,同時(shí)增強(qiáng)模型的推理能力與智能體自主決策能力,研究人員提出了多教師在線策略蒸餾(MOPD)。

該范式先通過監(jiān)督微調(diào)(SFT)或強(qiáng)化學(xué)習(xí)(RL)技術(shù)得到各領(lǐng)域的專家教師模型,再讓學(xué)生模型基于自身的策略分布進(jìn)行采樣,并利用多個(gè)教師模型提供的稠密型token級(jí)獎(jiǎng)勵(lì)信號(hào)完成優(yōu)化。

MOPD訓(xùn)練只需不到傳統(tǒng)SFT+RL流程的1/50計(jì)算資源,即可匹配教師模型的峰值表現(xiàn)。

此外,MOPD采用解耦設(shè)計(jì),支持新教師與ORM(教學(xué)與學(xué)習(xí))的靈活整合,自然實(shí)現(xiàn)“教學(xué)與學(xué)習(xí)”閉環(huán)迭代,精煉學(xué)生模式可演變?yōu)楦鼜?qiáng)的教師,實(shí)現(xiàn)持續(xù)自我提升的能力。


結(jié)語(yǔ):小米大模型研發(fā)踩下油門

小米憑借混合注意力機(jī)制與MOPD等技術(shù)創(chuàng)新,大幅優(yōu)化大模型的研發(fā)成本與運(yùn)行效率;同時(shí)開源全部相關(guān)成果,有效降低行業(yè)研發(fā)門檻。此外,近幾個(gè)月以來,Xiaomi MiMo大模型團(tuán)隊(duì)踩下油門,發(fā)布數(shù)篇論文并開源多個(gè)模型。

12月5日,小米集團(tuán)合伙人、總裁盧偉冰透露,公司AI大模型業(yè)務(wù)過去四個(gè)季度投入環(huán)比增速超50%,目前進(jìn)展“已超出董事會(huì)預(yù)期”,并宣布將AI與“現(xiàn)實(shí)世界深度結(jié)合”列為未來十年核心戰(zhàn)略。同時(shí),小米正式啟動(dòng)全球人才招募計(jì)劃,單崗位薪酬上限開至千萬(wàn)元級(jí)別,目標(biāo)“在最短時(shí)間內(nèi)補(bǔ)齊大模型尖端人才缺口”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
G聯(lián)賽:楊瀚森背靠背14+6秀暴扣手腕出現(xiàn)不適 混音慘負(fù)國(guó)王

G聯(lián)賽:楊瀚森背靠背14+6秀暴扣手腕出現(xiàn)不適 混音慘負(fù)國(guó)王

醉臥浮生
2025-12-17 12:08:51
12架日機(jī)攜48彈直撲遼寧艦,美媒直接報(bào)喪:被解放軍全面碾壓

12架日機(jī)攜48彈直撲遼寧艦,美媒直接報(bào)喪:被解放軍全面碾壓

星落山間
2025-12-15 05:10:17
蘋果新iPhone 20曝光,致敬喬布斯!

蘋果新iPhone 20曝光,致敬喬布斯!

科技堡壘
2025-12-16 17:35:48
“性侵工傷認(rèn)定”案當(dāng)事人崔麗麗最新發(fā)聲:被正式評(píng)定為工傷十級(jí)傷殘,今天我身穿被侵害之日的襯衣,邀請(qǐng)大家與它、與我共同見證法律正義

“性侵工傷認(rèn)定”案當(dāng)事人崔麗麗最新發(fā)聲:被正式評(píng)定為工傷十級(jí)傷殘,今天我身穿被侵害之日的襯衣,邀請(qǐng)大家與它、與我共同見證法律正義

揚(yáng)子晚報(bào)
2025-12-17 15:02:17
2026款奔馳GLS上市 售價(jià)96.8-139.82萬(wàn)元

2026款奔馳GLS上市 售價(jià)96.8-139.82萬(wàn)元

車質(zhì)網(wǎng)
2025-12-17 09:26:12
返回艙被覬覦,技術(shù)骨干成內(nèi)鬼!中國(guó)航天首次公開重大安全問題

返回艙被覬覦,技術(shù)骨干成內(nèi)鬼!中國(guó)航天首次公開重大安全問題

林子說事
2025-12-17 14:44:41
最新談判結(jié)果公布!特朗普突然改口,烏軍發(fā)起反攻,俄羅斯上當(dāng)了

最新談判結(jié)果公布!特朗普突然改口,烏軍發(fā)起反攻,俄羅斯上當(dāng)了

博覽歷史
2025-12-16 18:16:57
都別再有一天滅日本的幻想了,如果真的開戰(zhàn),日本有著三重防線

都別再有一天滅日本的幻想了,如果真的開戰(zhàn),日本有著三重防線

陳博世財(cái)經(jīng)
2025-12-17 11:09:53
公安部發(fā)布取保候?qū)徯乱?guī),2025年12月12日起施行

公安部發(fā)布取保候?qū)徯乱?guī),2025年12月12日起施行

法律內(nèi)參
2025-12-16 23:54:43
杭州小米交付中心車禍!小米內(nèi)部人士曝原因,被撞家屬稱:人沒了

杭州小米交付中心車禍!小米內(nèi)部人士曝原因,被撞家屬稱:人沒了

書中自有顏如玉
2025-12-16 10:22:30
霍啟剛攜手妻子現(xiàn)身哈爾濱,穿正裝戴眼鏡十分紳士,郭晶晶也時(shí)髦

霍啟剛攜手妻子現(xiàn)身哈爾濱,穿正裝戴眼鏡十分紳士,郭晶晶也時(shí)髦

八八尚語(yǔ)
2025-12-16 16:15:09
盟友一哄而散,與中國(guó)決裂的立陶宛急忙建小組,全力尋求中國(guó)諒解

盟友一哄而散,與中國(guó)決裂的立陶宛急忙建小組,全力尋求中國(guó)諒解

趣文說娛
2025-12-17 15:47:31
又死一個(gè)!游戲周年慶剛過就停更,玩家吐槽是“快進(jìn)式跑路”

又死一個(gè)!游戲周年慶剛過就停更,玩家吐槽是“快進(jìn)式跑路”

17173游戲網(wǎng)
2025-12-16 18:26:12
媒體人:國(guó)安曾希望讓邵佳一接手,新主帥大概率還是歐洲外教

媒體人:國(guó)安曾希望讓邵佳一接手,新主帥大概率還是歐洲外教

懂球帝
2025-12-17 20:40:07
萬(wàn)科王石最新照片:戴上了假發(fā),古稀之年依然不服老

萬(wàn)科王石最新照片:戴上了假發(fā),古稀之年依然不服老

微微熱評(píng)
2025-12-17 11:28:02
失地不收是高明之策?被強(qiáng)占60年的藏南,已成印度擺脫不了的噩夢(mèng)

失地不收是高明之策?被強(qiáng)占60年的藏南,已成印度擺脫不了的噩夢(mèng)

我心縱橫天地間
2025-12-15 16:44:20
日本媒體稱,在中國(guó)赴日提醒一個(gè)月后,日本的旅游業(yè)擔(dān)憂長(zhǎng)期化

日本媒體稱,在中國(guó)赴日提醒一個(gè)月后,日本的旅游業(yè)擔(dān)憂長(zhǎng)期化

深度報(bào)
2025-12-16 23:31:07
這8種東西“沒有保質(zhì)期”,過期了就扔太浪費(fèi),別當(dāng)冤大頭了

這8種東西“沒有保質(zhì)期”,過期了就扔太浪費(fèi),別當(dāng)冤大頭了

Home范
2025-12-11 21:20:03
丁嘉麗:我這輩子最后悔的決定,就是捧紅孫紅雷這個(gè)“白眼狼”

丁嘉麗:我這輩子最后悔的決定,就是捧紅孫紅雷這個(gè)“白眼狼”

小熊侃史
2025-12-17 09:46:44
世界冠軍總決賽連敗!奧運(yùn)冠軍輸球,國(guó)羽4勝2負(fù),石宇奇迎首秀!

世界冠軍總決賽連敗!奧運(yùn)冠軍輸球,國(guó)羽4勝2負(fù),石宇奇迎首秀!

劉姚堯的文字城堡
2025-12-17 19:47:53
2025-12-17 22:51:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
10925文章數(shù) 116928關(guān)注度
往期回顧 全部

科技要聞

特斯拉值1.6萬(wàn)億靠畫餅 Waymo值千億靠跑單

頭條要聞

捐贈(zèng)博物館價(jià)值8800萬(wàn)的名畫現(xiàn)身拍賣市場(chǎng) 捐贈(zèng)方發(fā)聲

頭條要聞

捐贈(zèng)博物館價(jià)值8800萬(wàn)的名畫現(xiàn)身拍賣市場(chǎng) 捐贈(zèng)方發(fā)聲

體育要聞

短短一年,從爭(zhēng)冠到0勝墊底...

娛樂要聞

狗仔曝?zé)岵〗愕軕僬嬲劻耍???/h3>

財(cái)經(jīng)要聞

重磅信號(hào)!收入分配制度或迎重大突破

汽車要聞

一車多動(dòng)力+雙姿態(tài) 長(zhǎng)城歐拉5上市 限時(shí)9.18萬(wàn)元起

態(tài)度原創(chuàng)

數(shù)碼
本地
健康
教育
旅游

數(shù)碼要聞

連續(xù)五年全國(guó)銷量第一 添可洗地機(jī)為何被稱一次性用品?

本地新聞

云游安徽|踏過戰(zhàn)壕與石板,讀一部活的淮北史

這些新療法,讓化療不再那么痛苦

教育要聞

明早9點(diǎn),“三尺之外”城市教育談?wù)介_講!點(diǎn)這里預(yù)約直播

旅游要聞

大理洱源縣境內(nèi)的G214國(guó)道擅長(zhǎng)蛇形走位,堪稱經(jīng)典的天險(xiǎn)路段

無障礙瀏覽 進(jìn)入關(guān)懷版 国产精品中文字幕一区二区中文视频网| 小污女小欲女导航| 国产原创中文av在线播放| 精品熟女免费视频网站| 日韩无码一区二区散区| 激情小说网站| 放荡网com| 亚洲精品女女久久久久久| 国产一区二区三区免费观看在线| 高清无码的黄色视频| 亚洲AV旡码高清在线观看| 欧美精品三区四区| 久久久一区二区三区精品无码| 97超碰国产精品最新| 亚洲视频啪啪啪| 国产av一区二区午夜福利| 日本亲近相奷中文字幕| 国产午夜精品久久久久久久| 人人看人人人澡人人擦| 嫩草研究院久久久精品| 老熟女爱草逼| 亚洲成人强奸短视| 亚洲人成网址在线播放| 亚洲综合人成网免费视频| 国产本道久久一区二区三区| 日韩理伦片一区二区三区| 丰满少妇久久无码精品| 99re热久久6| 精品一日韩美女性夜视频| 92国产精品午夜福利免费| 毛茸茸富婆XXXX乱大交| 精品国产午夜理论片不卡精品| 国产精品无遮挡毛片无码| 亚洲av无码一区二区三区18| 午夜肉伦伦影院| 社交狠狠躁夜夜躁日日躁| 女人逼激烈视频| 国产毛片网站| 亚洲三级片网站视频| 在线观看资源天堂国产视频| 成人无码视频|