夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Mistral開源兩大編程模型!大參數(shù)模型性能超Kimi、Qwen,小參數(shù)模型PC可跑

0
分享至


智東西
編譯 王欣逸
編輯 程茜

智東西12月10日消息,昨晚,法國大模型獨角獸Mistral AI發(fā)布并開源編程系列模型Devstral 2,該系列分為兩個不同規(guī)格的模型Devstral 2 132B和Devstral Small 2 24B。此外,Mistral還同時推出了原生CLI工具Mistral Vibe,能實現(xiàn)端到端的代碼自動化。此次發(fā)布距Mistral 3系列模型才過去一周。


Devstral 2參數(shù)為123B,支持256K上下文窗口,可以探索代碼庫,并能在保持架構層面上下文理解的同時,進行跨文件協(xié)調(diào)更改;Devstral Small 2參數(shù)為24B,同樣具備256K上下文窗口,支持快速推理和反饋,可以定制和本地部署,同時還支持圖像輸入,可應用于多模態(tài)Agents。

在SWE-bench Verified編程基準測試中,Devstral 2取得了72.2%的成績,優(yōu)于Qwen 3 coder plus、Kimi K2 Thinking等開源模型,僅次于DeepSeek V3.2;Devstral Small 2取得了68.8%的成績,超過GPT-OOS-120B,和GLM 4.6持平;在針對實際編程任務進行的人工測試中,Devstral 2表現(xiàn)優(yōu)于DeepSeek V3.2?;鶞蕼y試結果如下:


此外,在部署上,Devstral 2至少需要四塊H100級GPU,更輕量化的Devstral Small 2可以在消費級硬件上本地運行。

Mistral Vibe是一個由Devstral驅動的開源命令行編程助手,集成了文件操作、代碼搜索、版本控制及命令執(zhí)行等工具。

Mistral AI是一家法國創(chuàng)企,成立于2023年,由前DeepMind和Meta研究人員成立,專注于開源模型開發(fā)。今年9月,該公司宣布獲得17億歐元(約合人民幣139.9億元)C輪融資,估值達到117億歐元(約合人民幣962.6億元),英偉達曾三次投資這家公司。

一、基準測試位列開源第二,和頂尖閉源還有性能差距

據(jù)Mistral官網(wǎng),Devstral 2 123B支持探索代碼庫,能跨多個文件協(xié)調(diào)修改,還能保持上下文理解。它可以跟蹤框架依賴、檢測故障,并能通過修正后重試,從而解決如修復錯誤、改造遺留系統(tǒng)等復雜挑戰(zhàn)。

該模型支持微調(diào),可針對特定編程語言進行優(yōu)化,適配大型企業(yè)代碼庫的需求。

不過,Devstral 2以修改版的MIT協(xié)議發(fā)布,這一協(xié)議對大企業(yè)進行了限制:月收入超過2000萬美元(約合人民幣1.41億元)的公司,在未獲得Mistral單獨商業(yè)許可的情況下,無法使用該模型。

更輕量化的模型Devstral Small 2 24B支持快速推理、迭代反饋和定制,可本地部署,同時還支持圖像輸入,可應用于多模態(tài)Agents。

從基準測試來看,Devstral 2模型位列開源模型的第二名,并正趕超頂尖閉源模型。

Devstral 2在SWE-bench Verified編程基準測試中取得了72.2%的得分,Devstral Small 2取得了68%的得分,在開源模型中已經(jīng)達到了領先水平,Devstral 2的得分僅次于DeepSeek V3.2。


Devstral 2系列模型的亮點在于小參數(shù)設計,其模型在關鍵基準測試中展現(xiàn)出和頂尖開源模型齊平的性能,卻僅需后者幾分之一的參數(shù)量。

得分只比Devstral 2高0.9%的DeepSeek V3.2,其參數(shù)大小是Devstral 2的5倍,是Devstral Small 2的28倍,而表現(xiàn)次于Devstral 2的Kimi K2 Thinking,其參數(shù)大小是Devstral 2的8倍,是Devstral Small 2的41倍。


不過,Devstral 2系列模型與頂尖閉源模型之間還存在差距。

人工評測結果顯示,在Cline構建的任務場景中,Devstral 2相對DeepSeek V3.2優(yōu)勢明顯,勝率為42.8%,敗率為28.6%。然而,Devstral 2相對頂尖閉源模型Claude Sonnet 4.5敗下陣來,勝率僅為21.4%,敗率為53.1%。


二、端到端代碼自動化,能進行架構級推理

Mistral Vibe是基于Devstral模型構建的開源命令行編程助手,能通過自然語言交互,接入IDE,實現(xiàn)對代碼庫的探索、修改與變更執(zhí)行。


Mistral Vibe提供了一個交互式對話界面,集成了文件操作、代碼搜索、版本控制及命令執(zhí)行等工具。

它能自動掃描用戶文件結構及Git狀態(tài),提供相關上下文信息,能理解整個代碼庫的架構,并進行架構級推理,此外,它還擁有智能引用、持久化歷史、自動補全和可自定義主題等功能。

開發(fā)者可以通過腳本編程方式運行Mistral Vibe,啟用工具執(zhí)行的自動批準功能,通過簡潔的config.toml配置文件管理本地模型與供應商設置,靈活控制工具權限。

結語:平衡高性能與小參數(shù),為企業(yè)提供了低門檻解決方案

從Mistral 3到Devstral 2系列、Mistral Vibe,Mistral AI正以相當快的進擊速度參與AI競爭,并在模型的高性能與輕量化間實現(xiàn)了平衡,從測試結果看,Devstral Small 2模型在參數(shù)僅為24B的情況下,依然優(yōu)于不少開源模型,和GLM 4.6打平。

Mistral AI在公告中提到,Devstral 2系列模型專為生產(chǎn)級工作流打造,并被定位為下一代SOTA編程模型。盡管和頂尖閉源編程模型還有很大差距,不過,對大多數(shù)企業(yè)而言,Devstral 2和Devstral Small 2可以作為一個低門檻的初步解決方案,尤其是在和Mistral Vibe的搭配使用上,Devstral 2系列模型或將在特定的生產(chǎn)環(huán)節(jié)發(fā)揮作用。

來源:Mistral AI

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
慘烈!汕頭一五金店發(fā)生火災,一家12口被燒死,知情者曝更多細節(jié)

慘烈!汕頭一五金店發(fā)生火災,一家12口被燒死,知情者曝更多細節(jié)

派大星紀錄片
2025-12-10 13:09:36
對話當事人 | 清華博士斬獲Excel世錦賽第9名:不比做表格,“縮圈”惡戰(zhàn)闖進決賽

對話當事人 | 清華博士斬獲Excel世錦賽第9名:不比做表格,“縮圈”惡戰(zhàn)闖進決賽

上游新聞
2025-12-10 21:00:07
爆發(fā)了!1換1神級交易!謝謝你,快船!

爆發(fā)了!1換1神級交易!謝謝你,快船!

籃球實戰(zhàn)寶典
2025-12-10 23:09:37
官媒親宣!40歲梁文鋒再破天花板,這次,他讓雷軍和科技圈沉默了

官媒親宣!40歲梁文鋒再破天花板,這次,他讓雷軍和科技圈沉默了

凡知
2025-12-10 09:01:28
北理工教授愛上男學生后續(xù)!與舉報強奸的學生和好,炸裂往事被扒

北理工教授愛上男學生后續(xù)!與舉報強奸的學生和好,炸裂往事被扒

派大星紀錄片
2025-12-10 15:41:34
大跳水!美聯(lián)儲,大消息!

大跳水!美聯(lián)儲,大消息!

魏家東
2025-12-10 12:44:12
“約談風波”不到3天,郭德綱再迎噩耗!中國曲協(xié)的態(tài)度說明一切

“約談風波”不到3天,郭德綱再迎噩耗!中國曲協(xié)的態(tài)度說明一切

知法而形
2025-12-10 10:55:43
生命以負熵為食,科學家揭秘:人活著,就是在對抗全宇宙

生命以負熵為食,科學家揭秘:人活著,就是在對抗全宇宙

觀察宇宙
2025-12-09 22:05:39
為何中國急需實施“休養(yǎng)生息”戰(zhàn)略?

為何中國急需實施“休養(yǎng)生息”戰(zhàn)略?

西虹市閑話
2025-12-09 14:22:19
剛剛,脫發(fā)界大地震!革命性生發(fā)藥即將上市?改善率539%!

剛剛,脫發(fā)界大地震!革命性生發(fā)藥即將上市?改善率539%!

徐德文科學頻道
2025-12-10 19:24:47
12月25日前必辦!人社部提醒:有老人的家庭,這3件事拖不得,

12月25日前必辦!人社部提醒:有老人的家庭,這3件事拖不得,

叮當當科技
2025-12-10 12:45:41
雷軍新車“昆侖”曝光,網(wǎng)友又炸鍋了

雷軍新車“昆侖”曝光,網(wǎng)友又炸鍋了

熱點菌本君
2025-12-10 15:54:07
不痛不癢只是泛紅,竟是癌癥中期!44歲男子悔慘…尿色不對趕緊查

不痛不癢只是泛紅,竟是癌癥中期!44歲男子悔慘…尿色不對趕緊查

極目新聞
2025-12-10 11:14:32
“這是國家的恥辱,高市內(nèi)閣必須辭職”

“這是國家的恥辱,高市內(nèi)閣必須辭職”

環(huán)球時報國際
2025-12-10 14:56:31
隨著曼城2-1皇馬,阿森納3-0,歐冠最新積分榜:第3到第9只差1分

隨著曼城2-1皇馬,阿森納3-0,歐冠最新積分榜:第3到第9只差1分

侃球熊弟
2025-12-11 04:52:35
倆初中女孩被堵廁所遭連續(xù)掌摑,當?shù)亟逃纸槿耄揭蚜?>
    </a>
        <h3>
      <a href=大風新聞
2025-12-10 20:35:05
中國手機市場最新排名:華為被反超!

中國手機市場最新排名:華為被反超!

EETOP半導體社區(qū)
2025-12-10 13:26:16
普京動作太快了:還沒等中國出手,就派紹伊古去切斷了日本的后路

普京動作太快了:還沒等中國出手,就派紹伊古去切斷了日本的后路

博覽歷史
2025-12-10 05:20:07
小S曬S媽收到獎杯視頻,意外曝光家中靈堂,大S遺像出鏡

小S曬S媽收到獎杯視頻,意外曝光家中靈堂,大S遺像出鏡

李健政觀察
2025-12-10 22:26:28
兩件事得罪中國,英國首相訪華行程黃了,中方已確認將其拒之門外

兩件事得罪中國,英國首相訪華行程黃了,中方已確認將其拒之門外

臨云史策
2025-12-10 23:07:06
2025-12-11 06:39:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產(chǎn)業(yè)升級。
10884文章數(shù) 116925關注度
往期回顧 全部

科技要聞

防"走私",英偉達被曝開發(fā)“芯片定位”技術

頭條要聞

挑起中日對立后 高市早苗求見特朗普

頭條要聞

挑起中日對立后 高市早苗求見特朗普

體育要聞

試訓20支球隊,落選,成為NBA新秀助攻王

娛樂要聞

為何網(wǎng)友不再相信張柏芝的“故事”?

財經(jīng)要聞

美聯(lián)儲降息25基點 預計2026年降息一次

汽車要聞

有動力操控 有智能座艙 6萬多的第五代帝豪掀桌子了

態(tài)度原創(chuàng)

房產(chǎn)
旅游
時尚
手機
健康

房產(chǎn)要聞

斷供10年,終迎破局者!三亞核心區(qū),突然殺出新標桿!

旅游要聞

美國計劃要求免簽入境外國游客披露社交媒體記錄

這些才是普通人都該學的冬季穿搭!不浮夸、不單薄,自然保暖

手機要聞

中國信通院:10月國內(nèi)市場手機出貨量3226.7萬部 同比增長8.7%

甲狀腺結節(jié)到這個程度,該穿刺了!

無障礙瀏覽 進入關懷版 在线成人看片黄A免费看| 天天爽夜夜爽天天爽| 亚洲国产欧美在线看片一国产| 韩日av无码在线| 中文天堂最新版www| 无遮挡十八禁污污网站在线观看| 久久久无码福利视频| 在线亚洲精品国产二区图片欧美 | 国产成人综合A区| se色 69| 国产伦精品一区二区三区照片91| 亚洲少妇一二三区| 国产精华7777777| 鲁一鲁AV2022| 国产色域视频| 一本一本久久a久久精品综合1| 国产精品成人99一区无码| 国产无套中出学生姝| 天码av无码一区二区三区四区| 一区二区三区高清视频一| 久久精品一品道久久精品9| 亚洲无码一二三四| 欧美自拍嘿咻内射在线观看| 中文字幕第一区高清AV| 久久99精品国产99久久6尤物| 69久久夜色国产精品69乱| 国产偷国产偷在线高清| 亚洲无码 玉梅| 日朝一区二区| 日韩小电影在线观看| 西西人体在线观看| 亚洲激情视频| 美女久久AV| 在国产线视频a在线视频| 江苏极品身材白嫩少妇自拍| 厨房疯狂高潮呻吟摸揉视频| 欧美性爱啪啪网| 无码我要内射| 伊人久久凹凸熟女爆白浆| 成人一区二区三区视频| 久久久久久亚洲AV成人无码国产|