網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

中國AI技術再創(chuàng)新高，為教育界作出巨大貢獻，反超美國拉大差距

2025-09-21 01:33:20　來源: 小聰明說科普

四川舉報

分享至

現(xiàn)在的大語言模型就像準備高考的學生，做純文本推理題時已經(jīng)得心應手，但遇到圖文結合的綜合題就容易翻車。

這背后有兩個大麻煩：一是圖像、文字混合的題目太多樣，平時練的和考場上遇到的差距太大，二是練習題里魚龍混雜，總有不少錯題、偏題，越練反而越糊涂。

最近某高校曹琪博士生和謝彭濤副教授團隊搞出了個新模型DreamPRM-1.5，思路挺有意思，不讓AI盲目刷題，而是學會給習題挑重點，高質(zhì)量的題多練，垃圾題少看。

就靠這招，他們在包含30個學科的"終極測驗"里，成績直接超過了GPT-5和Gemini這些國際大牌。

以前的AI訓練像粗放式復習，比如把數(shù)學、語文按科目劃分重點，這就是DreamPRM初代版本的做法，但實際考試時，同一科目里有的題價值高，有的就是浪費時間。

DreamPRM-1.5玩了把精細操作，給每個訓練樣本單獨標權重，就像好學生整理錯題本，會給經(jīng)典例題畫三顆星，偏題怪題直接打叉，他們搞了兩種實現(xiàn)方式。

InstanceTable就像給每道題單獨寫批注，靈活是靈活，但題目一多就記不過來，適合小規(guī)模數(shù)據(jù)集。

InstanceNet則像總結出一套評分標準，不管多少題都能用這套規(guī)則打分，參數(shù)量固定，應付大規(guī)模訓練更在行。

這種從“按科目加權”到“按樣本加權”的升級，讓AI能在海量數(shù)據(jù)里精準抓重點，避免在垃圾數(shù)據(jù)上浪費算力。

光有加權規(guī)則還不夠，關鍵是權重能跟著效果動態(tài)調(diào)整，團隊用的雙層優(yōu)化框架，就像帶反饋的教學系統(tǒng)。

下層優(yōu)化是學生按當前重點刷題，用樣本權重更新模型參數(shù)，上層優(yōu)化是老師根據(jù)?？冀Y果調(diào)整重點，在元數(shù)據(jù)集上評估效果后反過來更新權重，這種設計讓權重不是死的，而是跟著推理效果實時變動。

打分機制也很有講究，用生成式獎勵模型給推理過程每步打分，就像老師批改作文不僅看結論，還會逐段批注，每步推理合理就打“+”，不合理就打“-”，最后算平均分。

訓練過程也很實在：先用20k樣本冷啟動，讓模型學會基本的打分規(guī)則，再用100k步迭代精調(diào)，單卡NVIDIAA100跑了72小時才完成。

檢驗成果的MMMU基準可不是一般的測試，涵蓋30個學科、183個子領域，從圖表分析到化學結構無所不包，堪稱多模態(tài)推理的“高考地獄模式”。

結果相當亮眼：GPT-5-mini基礎版考了80分，用DreamPRM-1.5的InstanceTable方案直接沖到84.6分，InstanceNet也有83.6分。

更厲害的是，這成績超過了GPT-5原版（84.2分）和Gemini2.5Pro（84.0分）這些閉源大模型。

對比實驗很能說明問題：不做加權的對照組只拿79.1分，比基線還低，用了400k大數(shù)據(jù)的VisualPRM才80.5分，證明數(shù)據(jù)多不如數(shù)據(jù)精，經(jīng)典的Self-consistency方法81.4分，還是拼不過動態(tài)加權。

DreamPRM-1.5的突破，本質(zhì)上是讓AI訓練從“題海戰(zhàn)術”轉向“精準教學”，在大模型參數(shù)競賽遇到瓶頸的今天，這種精打細算的數(shù)據(jù)利用方式，可能比盲目擴大參數(shù)量更有前途。

就像好老師懂得因材施教，好的AI訓練框架也該懂得“因數(shù)據(jù)施教”，中國團隊這次拿出的不僅是個SOTA模型，更提供了一種思路，在數(shù)據(jù)爆炸的時代，學會篩選和聚焦，比貪多求全更重要。

未來的AI競爭，或許不再是誰的模型更大，而是誰能更聰明地利用數(shù)據(jù)，畢竟真正的智慧不在于擁有多少信息，而在于能從中提取多少價值。

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

丟失33年千萬富翁與母相認見面禮送成都房子和銀行卡

大象新聞 2025-09-27 23:06:14
9131 跟貼 9131
9月25日，雷軍年度演講稱：iphone不做的我們來做。新品充電寶全面兼容蘋果17系列。（編輯：楊

中安在線 2025-09-26 10:05:13
1929 跟貼 1929

美媒：美或向烏克蘭提供"戰(zhàn)斧" 可能導致局勢升級

環(huán)球網(wǎng)資訊 2025-09-28 07:02:06
10843 跟貼 10843

無人扶我青云志，我自己浪到第八強！“蘇超”淘汰賽會上演“黑八奇跡”嗎？

江蘇新聞 2025-09-28 07:21:50
453 跟貼 453
管慶良案，判了！當縣長，他想方設法架空縣委書記，當書記后又想方設法架空縣長

新京報政事兒 2025-09-27 16:48:05
471 跟貼 471

“蘇超”第一階段收官，八強戰(zhàn)“蘇北四虎”分頭出戰(zhàn)南通、南京、無錫、泰州

文匯報 2025-09-28 04:23:08
191 跟貼 191

陜西渭南官方從黑磚廠解救多名疑似殘障人士：已安置在救助中心，正逐一核實身份

紅星新聞 2025-09-27 23:15:08
2307 跟貼 2307
三星堆公布重大發(fā)現(xiàn)！專家：種種跡象表明，三星堆可能爆發(fā)過內(nèi)戰(zhàn)，神權貴族集團受到嚴重打擊，城市水系也因此改變

每日經(jīng)濟新聞 2025-09-27 22:27:12
16 跟貼 16

大國工程+1！世界第一高橋花江峽谷大橋今日通車

極目新聞 2025-09-28 07:13:51
1075 跟貼 1075
廣東一男子確診，2次擅離病房！被罰

南方都市報 2025-09-28 08:39:01
157 跟貼 157
孝義市、榆次區(qū)、太谷區(qū)、平魯區(qū)、沁縣、交口縣被約談，政府主要負責人表態(tài)

新京報政事兒 2025-09-28 14:44:21
0 跟貼 0
哥倫比亞總統(tǒng)：聯(lián)合國總部不應留在紐約

新華社 2025-09-28 06:48:01
1069 跟貼 1069
售價近50萬，印度首批Model Y 正式交付

每日經(jīng)濟新聞 2025-09-27 22:38:05
675 跟貼 675
景區(qū)著名爛尾樓重生豪華酒店此前投資曾高達2.56億元

每日經(jīng)濟新聞 2025-09-27 22:05:58
1013 跟貼 1013
周大福、周生生等確認一口價黃金將調(diào)價，部分產(chǎn)品漲幅或達40%

新京報 2025-09-27 17:26:56
282 跟貼 282
中企派2000名工人赴歐洲建廠英媒還在存心挑撥

澎湃新聞 2025-09-28 14:12:48
98 跟貼 98
四川一公路被指鋪好未滿一年出現(xiàn)沉陷，交通局稱尚未交付驗收

澎湃新聞 2025-09-28 15:12:28
206 跟貼 206
辛巴關聯(lián)公司被稅務催報

封面新聞 2025-09-28 12:45:11
121 跟貼 121
LV首爾開餐廳，3只牛肉餃子售價243元，預約秒售罄一席難求

瀟湘晨報 2025-09-28 10:16:54
0 跟貼 0
這里的人吃了五十年預制菜

中國新聞周刊 2025-09-25 07:26:04
0 跟貼 0
926元的褲子掉色維權難？崇川打造放心消費環(huán)境

城市日歷 2025-09-28 16:31:56
0 跟貼 0
昨晚東海大橋兩輛集卡追尾一名駕駛員被困受傷送醫(yī)

上海法治聲音 2025-09-28 16:31:05
0 跟貼 0
公司補班1天被員工舉報，反手取消14天年假福利和所有額外假期？最新回應

人力資源報 2025-09-28 16:35:06
0 跟貼 0
瞬間天黑，瀑布一樣！這波很猛，浙江人下班趕緊回家

FM93浙江交通之聲 2025-09-28 15:30:58
0 跟貼 0
10歲女童攀巖安全繩疑脫落，7米高空墜下骨盆摔骨折；家長：醫(yī)療費對方墊付了，后續(xù)賠償還沒談

大風新聞 2025-09-28 16:35:18
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

中國AI技術再創(chuàng)新高，為教育界作出巨大貢獻，反超美國拉大差距

付鵬：全球生產(chǎn)率停滯了20年，AI就是解藥

被網(wǎng)友質(zhì)疑要兩千萬私了 遭老板性侵女高管爆粗回懟

被網(wǎng)友質(zhì)疑要兩千萬私了 遭老板性侵女高管爆粗回懟

哭泣的西蒙尼，給年輕的阿隆索上了一課

董璇女兒和佟麗婭兒子同登灣區(qū)晚會！

連王健林都被限消了

對話欽培吉：77歲的蓮花，不做六邊形戰(zhàn)士

態(tài)度原創(chuàng)

全國模范教師受邀參加公祭孔子大典

舅舅稱PS6掌機或定價3500元：但要放棄一項特色才行

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

熱聞|清明假期將至，熱門目的地有哪些?

重塑品牌 煙火氣與價值

中國AI技術再創(chuàng)新高，為教育界作出巨大貢獻，反超美國拉大差距

付鵬：全球生產(chǎn)率停滯了20年，AI就是解藥

被網(wǎng)友質(zhì)疑要兩千萬私了遭老板性侵女高管爆粗回懟

被網(wǎng)友質(zhì)疑要兩千萬私了遭老板性侵女高管爆粗回懟

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

熱聞|清明假期將至，熱門目的地有哪些?

重塑品牌煙火氣與價值