夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

???微博7800美元訓(xùn)的大模型,數(shù)學能力超了DeepSeek-R1

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

當整個AI行業(yè)陷入“參數(shù)競賽”的狂熱時,微博AI交出了一份出乎意料的答卷,為沸騰的大模型戰(zhàn)場開辟了一條充滿想象力的新路徑。

近日,微博正式發(fā)布首個自研開源大模型VibeThinker,這個僅擁有15億參數(shù)的“輕量級選手”,在國際頂級數(shù)學競賽基準測試上擊敗了參數(shù)量是其數(shù)百倍的、高達6710億的DeepSeek R1模型。

更令人矚目的是,其單次“后訓(xùn)練”的成本僅7800美元,對比DeepSeek-R1和MiniMax-M1等成本直接降低了幾十倍。

這一突破不僅重新定義了大模型的技術(shù)評價標準,更有望推動AI產(chǎn)業(yè)從“規(guī)模競賽”轉(zhuǎn)向“效率革命”。



行業(yè)黑馬:小模型打破參數(shù)崇拜

在AI發(fā)展史上,參數(shù)量曾被視為衡量模型能力的核心指標。

行業(yè)普遍認為,復(fù)雜推理能力需要1000億以上參數(shù)才能涌現(xiàn),而小模型則因無法處理高難度問題被視為“天生不足”。

但如果從小模型入手,通過巧妙的訓(xùn)練策略,能否挖掘出隱藏的推理能力?

微博自研開源大模型VibeThinker,給出了行業(yè)一個肯定的答案。

當大多數(shù)AI廠商仍遵循著“規(guī)模擴大即智能提升”的Scaling Law法則時,微博AI研發(fā)人員轉(zhuǎn)而優(yōu)化模型結(jié)構(gòu)和訓(xùn)練范式,并創(chuàng)新提出了“頻譜到信號原理”(SSP)方法訓(xùn)練,創(chuàng)造出了一個僅擁有15億參數(shù)的“輕量級選手”,但在AI競技場上戰(zhàn)勝了超越其數(shù)百倍體量的“巨人”。

VibeThinker一經(jīng)發(fā)布,立即引起了全球AI研究界的廣泛關(guān)注,因其在一系列涵蓋數(shù)學、編碼的權(quán)威基準測試中,交出了一份出乎意料的答卷:


△HuggingFace官方主動下場發(fā)文宣傳VibeThinker論文

在AIME24、AIME25以及HMMT25三個高難度數(shù)學測試集上的表現(xiàn),VibeThinker超越了參數(shù)量超其400倍的模型DeepSeek-R1-0120版本(模型大小671B),與規(guī)模為456B的MiniMax-M1效果接近或相當,甚至媲美Gemini 2.5 flash和Claude Opus 4。

此外,在LiveCodeBench v6(編程算法題測試集)中的成績,VibeThinker成功追平參數(shù)量數(shù)超其數(shù)十倍的模型,比如歐洲領(lǐng)先AI企業(yè)Minstral.AI的深度思考模型Magistral-Medium-2506版本。

VibeThinker雄辯地證明,通過精巧的算法設(shè)計和訓(xùn)練策略,一個小規(guī)模模型完全有潛力在復(fù)雜的邏輯推理任務(wù)上,達到甚至超越那些體量龐大數(shù)百倍的巨型模型,更為AI產(chǎn)業(yè)的成本結(jié)構(gòu)、技術(shù)路線和資本布局帶來了全新的思考路徑。

需要說明的是,VibeThinker目前發(fā)布的版本尚處于實驗性版本,其研發(fā)重點主要集中于極大強化小模型復(fù)雜數(shù)學與競賽編程等方面的能力,其在日常聊天等能力還沒有做過針對性訓(xùn)練優(yōu)化,所以暫不適合作為日常聊天工具進行互動,更適用于數(shù)學和代碼等高智能應(yīng)用場景。

成本革命:7800美元門檻重塑產(chǎn)業(yè)生態(tài)

訓(xùn)練成本一直是制約AI技術(shù)普及的關(guān)鍵瓶頸,VibeThinker的成就不僅在于驚艷的性能,更在于其極致的成本效益

根據(jù)公開數(shù)據(jù),2025年主流大模型單次后訓(xùn)練(Post-Training)成本普遍在數(shù)十萬美元級別。

上海AI企業(yè)MiniMax于今年6月發(fā)布的M1模型,使用512塊H800 GPU訓(xùn)練三周,租賃成本約53.5萬美元,創(chuàng)始人發(fā)文表示:“第一次感覺到大山不是不能翻越?!?/p>

今年9月,AI初創(chuàng)公司DeepSeek(深度求索)的論文登上《自然》雜志。論文首次揭示了訓(xùn)練R1的成本:僅為29.4萬美元。這不包括DeepSeek公司在開發(fā)R1所基于的基礎(chǔ)LLM(即DeepSeek-V3)上花費的約600萬美元,但總成本仍然遠低于競爭對手模型被認為花費的數(shù)千萬美元。

在這樣的行業(yè)背景下,VibeThinker整個后訓(xùn)練過程(包括SFT和RL階段)總共只花費了約3900個GPU小時。按照當時的市場租賃價格,總計算成本僅7800美元



這也意味著,其用不到8000美元的成本,達到了需要花費30萬、甚至50萬美元才能企及的性能水平,成本效益比達到了驚人的30到60倍

這種成本上的顯著優(yōu)勢,也意味著強大的AI推理能力不再是少數(shù)科技巨頭的專利,原本被巨頭壟斷的技術(shù)資源得以普惠,更多中小型公司、研究機構(gòu)和大學,都有機會參與到前沿AI創(chuàng)新開發(fā)中來,極大地促進了AI研究的普惠化,推動整個行業(yè)朝著更開放、更多元、更具活力的方向發(fā)展。

應(yīng)用落地:微博AI生態(tài)多點開花

技術(shù)突破的最終價值在于應(yīng)用落地

微博積極擁抱人工智能發(fā)展趨勢,全面促進AI技術(shù)在多項業(yè)務(wù)場景的落地。

2024年,微博自主研發(fā)“知微”大語言模型,并成功通過備案,更陸續(xù)推出微博智搜、內(nèi)容總結(jié)、AI互動號等前沿功能,優(yōu)化用戶體驗,提升內(nèi)容生產(chǎn)和互動效率。

基于自研的“知微”大模型,微博構(gòu)建了適配微博場景的AI應(yīng)用生態(tài),并創(chuàng)造了兩大頂流AI產(chǎn)品:

  • 一是微博智搜,它通過深度分析平臺內(nèi)海量優(yōu)質(zhì)內(nèi)容,構(gòu)建可信知識圖譜,實現(xiàn)“精準捕捉用戶需求、理解情感與場景”的突破性體驗,6月智搜月活躍用戶突破5000萬;
  • 二是評論羅伯特,作為AI互動賬號,它從毒舌風格起步,逐漸進化出溫情與聰明版本,成為廣大用戶“又愛又恨”的交流對象,全網(wǎng)粉絲近200萬,展現(xiàn)了AI評論助手的另一種可能性。

隨著自研大模型VibeThinker取得突破,更標志著微博AI戰(zhàn)略邁入新階段。

立足于自研大模型VibeThinker,微博的未來規(guī)劃凸顯了鮮明的“數(shù)據(jù)賦能”路徑。公司計劃深度融合其在心理等垂直領(lǐng)域積累的獨特數(shù)據(jù)資產(chǎn),目標是打造一個更洞悉公眾情緒、更能服務(wù)社會化需求的專屬模型。

微博不僅是在優(yōu)化一個大模型,更是在解鎖其數(shù)據(jù)生態(tài)的深層價值,以提供更精準、更懂用戶心理狀態(tài)的下一代社交服務(wù)。

VibeThinker的強大技術(shù)能力,或?qū)⒊蔀轵?qū)動微博AI應(yīng)用“多點開花”的核心引擎,深度融入平臺全業(yè)務(wù)生態(tài)。

未來,VibeThinker有望在微博智搜等核心AI產(chǎn)品中落地,不僅能持續(xù)提升用戶使用體驗,更有望打破場景邊界,裂變出兼具社交屬性與智能服務(wù)的下一個“社交超級生態(tài)”。

此外,VibeThinker的技術(shù)突破有望大幅降低微博AI應(yīng)用成本

無論是智能搜索的算力損耗,還是實時互動場景的AI響應(yīng)成本,都將得到高效優(yōu)化,讓平臺在規(guī)?;度階I能力時無需承擔過高的資源壓力,進一步釋放微博的生態(tài)創(chuàng)新能力,為用戶帶來更豐富、更便捷的智能體驗。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
U22中國0-0烏茲別克斯坦U22無緣冠軍,汪士欽報復(fù)推人染紅

U22中國0-0烏茲別克斯坦U22無緣冠軍,汪士欽報復(fù)推人染紅

懂球帝
2025-11-18 21:33:16
34+32!神級大交易!謝謝你,杜蘭特!

34+32!神級大交易!謝謝你,杜蘭特!

籃球?qū)崙?zhàn)寶典
2025-11-18 15:26:21
隨著韓國1-0越南,熊貓杯最終積分榜:國足屈居亞軍,汪士欽染紅

隨著韓國1-0越南,熊貓杯最終積分榜:國足屈居亞軍,汪士欽染紅

侃球熊弟
2025-11-18 17:26:04
賈乃亮和“李小璐”合體直播帶貨,網(wǎng)友炸鍋了

賈乃亮和“李小璐”合體直播帶貨,網(wǎng)友炸鍋了

黎兜兜
2025-11-17 22:12:41
日本擬恢復(fù)“大佐”等舊日軍軍階用語,外交部:絕不允許日本軍國主義復(fù)活

日本擬恢復(fù)“大佐”等舊日軍軍階用語,外交部:絕不允許日本軍國主義復(fù)活

澎湃新聞
2025-11-18 15:30:28
正接受調(diào)查!首席科學家被曝只有高中學歷,院士頭銜造假,30 年履歷全靠編

正接受調(diào)查!首席科學家被曝只有高中學歷,院士頭銜造假,30 年履歷全靠編

生物學霸
2025-11-18 17:22:15
爆大冷!女團半決賽對陣出爐,衛(wèi)冕冠軍被淘汰,孫穎莎連剃光頭

爆大冷!女團半決賽對陣出爐,衛(wèi)冕冠軍被淘汰,孫穎莎連剃光頭

知軒體育
2025-11-18 15:08:04
高盛報告:中國房價何時止跌

高盛報告:中國房價何時止跌

譚談投研
2025-11-16 18:04:50
長榮貨輪入天津港被拒?幫美運坦克入臺!損失慘重苦不堪言

長榮貨輪入天津港被拒?幫美運坦克入臺!損失慘重苦不堪言

云舟史策
2025-11-18 07:30:28
解放軍說出日本最悲慘的下場,中國不介意把日本變成主戰(zhàn)場

解放軍說出日本最悲慘的下場,中國不介意把日本變成主戰(zhàn)場

孔孔說體育
2025-11-17 10:39:24
里子面子都丟了,森林北公布體檢結(jié)果,把汪峰的體面撕個粉碎

里子面子都丟了,森林北公布體檢結(jié)果,把汪峰的體面撕個粉碎

鋭娛之樂
2025-11-18 12:44:19
中J幾個局都開始兇猛裁員了!

中J幾個局都開始兇猛裁員了!

黯泉
2025-11-18 14:20:30
聯(lián)合國回應(yīng)高市早苗言論

聯(lián)合國回應(yīng)高市早苗言論

每日經(jīng)濟新聞
2025-11-18 14:17:06
謝謝陳思誠,貢獻出25年年底內(nèi)娛最大的笑話!

謝謝陳思誠,貢獻出25年年底內(nèi)娛最大的笑話!

娛樂圈筆娛君
2025-11-18 18:12:15
多地發(fā)文!立即解散約車群、拼車群,否則追究群主法律責任!

多地發(fā)文!立即解散約車群、拼車群,否則追究群主法律責任!

網(wǎng)約車焦點
2025-11-17 12:00:54
陳海強出任浙商銀行黨委書記,擬任董事長

陳海強出任浙商銀行黨委書記,擬任董事長

魯中晨報
2025-11-18 19:03:04
城里沒工打,村里無地種,冬已至,但真正的寒冬還未來臨……

城里沒工打,村里無地種,冬已至,但真正的寒冬還未來臨……

村里的月光
2025-11-18 14:38:14
20歲四川音樂學院王璇媛確診癌癥,長得漂亮成績好,因起紅疹確診

20歲四川音樂學院王璇媛確診癌癥,長得漂亮成績好,因起紅疹確診

180視角
2025-11-18 15:01:57
機器人集結(jié)交付畫面被質(zhì)疑視頻造假?優(yōu)必選回應(yīng):系實拍

機器人集結(jié)交付畫面被質(zhì)疑視頻造假?優(yōu)必選回應(yīng):系實拍

南方都市報
2025-11-18 19:18:07
“內(nèi)部信”風波后,俞敏洪連發(fā)10條南極旅游視頻,旅行社:該行程20天人均花費30萬元

“內(nèi)部信”風波后,俞敏洪連發(fā)10條南極旅游視頻,旅行社:該行程20天人均花費30萬元

極目新聞
2025-11-18 14:06:30
2025-11-18 23:11:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11701文章數(shù) 176333關(guān)注度
往期回顧 全部

科技要聞

谷歌CEO警告:若AI泡沫破裂,沒公司能幸免

頭條要聞

荒野求生成流量風口:有女子辭職參賽結(jié)果燙傷花光積蓄

頭條要聞

荒野求生成流量風口:有女子辭職參賽結(jié)果燙傷花光積蓄

體育要聞

結(jié)束最后一次對決,陳夢和朱雨玲笑著相擁

娛樂要聞

宋佳奪影后動了誰的奶酪

財經(jīng)要聞

中美機器人爆發(fā)了一場論戰(zhàn)

汽車要聞

硬核配置旗艦氣場 嵐圖泰山售37.99萬起

態(tài)度原創(chuàng)

家居
時尚
旅游
教育
軍事航空

家居要聞

彰顯奢華 意式經(jīng)典風格

秋天穿衣暫時沒靈感?趕緊看看這27套穿搭,舒適自然又大方

旅游要聞

大型旅行社稱已陸續(xù)有游客取消日本行程!新馬等地咨詢量上漲

教育要聞

安徽農(nóng)業(yè)大學2026保研459人,計算機科學與技術(shù)19人

軍事要聞

日媒揚言要"擊沉福建艦" 專家:玩火自焚

無障礙瀏覽 進入關(guān)懷版 亚洲小说春色综合另类| 国产精品高清网站| 亚洲国产日韩视频观看| 最新无码天堂| 精品女人久久久| 久久久久久久性潮| 日韩精品成人一区二区三区 | ...国产av一区二区三区精品| 成熟女人毛片www免费版在线| 18禁黄网站禁片免费观看女女| 好了AV四色综合无码久久| 亚洲精品午夜理伦不卡在线观看| 色av永久无码影院av| 久久久米奇777精品一区| 国产一精品一av一免费爽爽| 国产乱子伦精品免费视频| 仓库糟蹋丰满少妇| 亚洲欧美精品在线| 大屁股 少妇 肥臀 小说| 干少妇B视频| 成人在线91| 亚洲国产一区二区三区在线播放| 国产成人免费综合| 天堂网在线最新版www| 国内精品综合久久久40p| 欧美午夜一区| 2017日日夜夜| 成人av天堂网在线观看| 欧美少妇影院| 欧洲一卡2卡3卡4卡乱码视频| 少妇人妻无码专区视频| 久久在线视频免费观看| 奇米影视综合网| 日本在线一区二区三区| 激情小说区图片区| 国产精品久久福利网站| 欧美综合自拍亚洲综合区| 国产精品老熟女视频一区二区| 一本久久a久久精品vr综合| 亚洲欧美日韩国产手机在线| 少妇BB一二区|