夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中國AI技術再創(chuàng)新高,為教育界作出巨大貢獻,反超美國拉大差距

0
分享至

現(xiàn)在的大語言模型就像準備高考的學生,做純文本推理題時已經(jīng)得心應手,但遇到圖文結合的綜合題就容易翻車。

這背后有兩個大麻煩:一是圖像、文字混合的題目太多樣,平時練的和考場上遇到的差距太大,二是練習題里魚龍混雜,總有不少錯題、偏題,越練反而越糊涂。

最近某高校曹琪博士生和謝彭濤副教授團隊搞出了個新模型DreamPRM-1.5,思路挺有意思,不讓AI盲目刷題,而是學會給習題挑重點,高質(zhì)量的題多練,垃圾題少看。

就靠這招,他們在包含30個學科的"終極測驗"里,成績直接超過了GPT-5和Gemini這些國際大牌。



以前的AI訓練像粗放式復習,比如把數(shù)學、語文按科目劃分重點,這就是DreamPRM初代版本的做法,但實際考試時,同一科目里有的題價值高,有的就是浪費時間。

DreamPRM-1.5玩了把精細操作,給每個訓練樣本單獨標權重,就像好學生整理錯題本,會給經(jīng)典例題畫三顆星,偏題怪題直接打叉,他們搞了兩種實現(xiàn)方式。

InstanceTable就像給每道題單獨寫批注,靈活是靈活,但題目一多就記不過來,適合小規(guī)模數(shù)據(jù)集。



InstanceNet則像總結出一套評分標準,不管多少題都能用這套規(guī)則打分,參數(shù)量固定,應付大規(guī)模訓練更在行。

這種從“按科目加權”到“按樣本加權”的升級,讓AI能在海量數(shù)據(jù)里精準抓重點,避免在垃圾數(shù)據(jù)上浪費算力。

光有加權規(guī)則還不夠,關鍵是權重能跟著效果動態(tài)調(diào)整,團隊用的雙層優(yōu)化框架,就像帶反饋的教學系統(tǒng)。

下層優(yōu)化是學生按當前重點刷題,用樣本權重更新模型參數(shù),上層優(yōu)化是老師根據(jù)??冀Y果調(diào)整重點,在元數(shù)據(jù)集上評估效果后反過來更新權重,這種設計讓權重不是死的,而是跟著推理效果實時變動。



打分機制也很有講究,用生成式獎勵模型給推理過程每步打分,就像老師批改作文不僅看結論,還會逐段批注,每步推理合理就打“+”,不合理就打“-”,最后算平均分。

訓練過程也很實在:先用20k樣本冷啟動,讓模型學會基本的打分規(guī)則,再用100k步迭代精調(diào),單卡NVIDIAA100跑了72小時才完成。



檢驗成果的MMMU基準可不是一般的測試,涵蓋30個學科、183個子領域,從圖表分析到化學結構無所不包,堪稱多模態(tài)推理的“高考地獄模式”。

結果相當亮眼:GPT-5-mini基礎版考了80分,用DreamPRM-1.5的InstanceTable方案直接沖到84.6分,InstanceNet也有83.6分。

更厲害的是,這成績超過了GPT-5原版(84.2分)和Gemini2.5Pro(84.0分)這些閉源大模型。

對比實驗很能說明問題:不做加權的對照組只拿79.1分,比基線還低,用了400k大數(shù)據(jù)的VisualPRM才80.5分,證明數(shù)據(jù)多不如數(shù)據(jù)精,經(jīng)典的Self-consistency方法81.4分,還是拼不過動態(tài)加權。



DreamPRM-1.5的突破,本質(zhì)上是讓AI訓練從“題海戰(zhàn)術”轉向“精準教學”,在大模型參數(shù)競賽遇到瓶頸的今天,這種精打細算的數(shù)據(jù)利用方式,可能比盲目擴大參數(shù)量更有前途。

就像好老師懂得因材施教,好的AI訓練框架也該懂得“因數(shù)據(jù)施教”,中國團隊這次拿出的不僅是個SOTA模型,更提供了一種思路,在數(shù)據(jù)爆炸的時代,學會篩選和聚焦,比貪多求全更重要。

未來的AI競爭,或許不再是誰的模型更大,而是誰能更聰明地利用數(shù)據(jù),畢竟真正的智慧不在于擁有多少信息,而在于能從中提取多少價值。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
連續(xù)5個漲停板!股民:跨節(jié)龍的潛力!

連續(xù)5個漲停板!股民:跨節(jié)龍的潛力!

數(shù)據(jù)挖掘分析
2025-09-28 14:32:36
他決定:全部退款!細節(jié)曝光

他決定:全部退款!細節(jié)曝光

FM93浙江交通之聲
2025-09-27 21:16:09
終于露出獠牙,若大陸強攻美軍必出手?中方反手就是一記重拳打出

終于露出獠牙,若大陸強攻美軍必出手?中方反手就是一記重拳打出

書中自有顏如玉
2025-09-28 14:28:18
36歲夕又米給兒子慶生,圈外老公年輕帥氣家境好,比高曉松強太多

36歲夕又米給兒子慶生,圈外老公年輕帥氣家境好,比高曉松強太多

瘋說時尚
2025-09-28 11:38:43
蘇柳找人重新為《我的樓蘭》譜曲,讓云朵唱?刀郎的回應來了!

蘇柳找人重新為《我的樓蘭》譜曲,讓云朵唱?刀郎的回應來了!

丁丁鯉史紀
2025-09-25 15:40:57
安德列娃:小時候就喜歡看朱琳的比賽,贏球后很開心

安德列娃:小時候就喜歡看朱琳的比賽,贏球后很開心

直播吧
2025-09-27 13:29:04
內(nèi)特-威廉姆斯加盟湖人!老隊友伊森轉發(fā)消息 并送上祝福

內(nèi)特-威廉姆斯加盟湖人!老隊友伊森轉發(fā)消息 并送上祝福

直播吧
2025-09-28 14:24:05
殺瘋了!1400萬外國人涌入中國,重慶大街上,擠滿了老外

殺瘋了!1400萬外國人涌入中國,重慶大街上,擠滿了老外

南權先生
2025-09-26 11:54:37
回顧:蘇享茂哥哥怒曝翟欣欣聊天記錄,內(nèi)容下流至極看完三觀盡毀

回顧:蘇享茂哥哥怒曝翟欣欣聊天記錄,內(nèi)容下流至極看完三觀盡毀

春序娛樂
2025-09-23 11:27:16
柏拉圖為什么偉大?因他在2400年前,就回答了今天的所有人生困惑

柏拉圖為什么偉大?因他在2400年前,就回答了今天的所有人生困惑

詩意世界
2025-09-18 11:39:14
雙色球第25112期觀察:前區(qū)06、23后區(qū)05或者06

雙色球第25112期觀察:前區(qū)06、23后區(qū)05或者06

好笑娛樂君每一天
2025-09-28 14:03:15
弗格森語出驚人:我執(zhí)教曼聯(lián)26年,只有這四名球員是世界級的

弗格森語出驚人:我執(zhí)教曼聯(lián)26年,只有這四名球員是世界級的

生活新鮮市
2025-09-27 14:41:17
同年退休的3位同學4年走了兩個,回顧他們經(jīng)歷,我決定躺平為妙

同年退休的3位同學4年走了兩個,回顧他們經(jīng)歷,我決定躺平為妙

人間百態(tài)大全
2025-09-27 08:20:03
自曝年入9位數(shù)后,千萬網(wǎng)紅“藍戰(zhàn)非”賬號被禁關,本人發(fā)聲喊冤

自曝年入9位數(shù)后,千萬網(wǎng)紅“藍戰(zhàn)非”賬號被禁關,本人發(fā)聲喊冤

夢史
2025-09-26 11:47:01
比亞迪,又降價了

比亞迪,又降價了

大象新聞
2025-09-27 13:51:09
嚴孟宇董事長向北京理工大學捐贈,祝賀母校成立85周年

嚴孟宇董事長向北京理工大學捐贈,祝賀母校成立85周年

新浪財經(jīng)
2025-09-28 12:36:03
錢學森教授唯一的孫子今何在:不是阿里副總裁,是軍委正團級參謀

錢學森教授唯一的孫子今何在:不是阿里副總裁,是軍委正團級參謀

冰雅憶史
2025-08-22 03:45:03
男孩摔死3只小奶貓后續(xù):母貓落淚,家長狠護犢子,父親身份被扒

男孩摔死3只小奶貓后續(xù):母貓落淚,家長狠護犢子,父親身份被扒

子芫伴你成長
2025-09-26 20:19:52
釋永信交代的情況令人吃驚!你想象不到他的生活有多豪!

釋永信交代的情況令人吃驚!你想象不到他的生活有多豪!

巷子里的歷史
2025-09-19 08:25:23
北約警告俄羅斯,普京盟友突然辭職,俄外長首次提到“妥協(xié)”二字

北約警告俄羅斯,普京盟友突然辭職,俄外長首次提到“妥協(xié)”二字

博覽歷史
2025-09-28 13:36:34
2025-09-28 16:51:00
小聰明說科普
小聰明說科普
我是小聰明,帶你走進不一樣的科普世界
1114文章數(shù) 1428關注度
往期回顧 全部

科技要聞

付鵬:全球生產(chǎn)率停滯了20年,AI就是解藥

頭條要聞

被網(wǎng)友質(zhì)疑要兩千萬私了 遭老板性侵女高管爆粗回懟

頭條要聞

被網(wǎng)友質(zhì)疑要兩千萬私了 遭老板性侵女高管爆粗回懟

體育要聞

哭泣的西蒙尼,給年輕的阿隆索上了一課

娛樂要聞

董璇女兒和佟麗婭兒子同登灣區(qū)晚會!

財經(jīng)要聞

連王健林都被限消了

汽車要聞

對話欽培吉:77歲的蓮花,不做六邊形戰(zhàn)士

態(tài)度原創(chuàng)

教育
游戲
藝術
旅游
家居

教育要聞

全國模范教師受邀參加公祭孔子大典

舅舅稱PS6掌機或定價3500元:但要放棄一項特色才行

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

重塑品牌 煙火氣與價值

無障礙瀏覽 進入關懷版 阿V视频在线观看| 久久久久人妻一区精品| 粗又黑又硬好爽高潮视频| 国产对白老熟女正在播放| 乱码人妻久久| 亚洲乱码在线卡一卡二卡新区| 亚洲日韩精品无码av海量| 亚洲国产精品一区二区第一页免| 未满十八禁止观看视频内射1000部| 熟女一区二区不卡| 亚洲日韩乱码中文无码蜜桃臀网站| 亚洲国产精品综合久久网络| 浪货跪下给我好好含着羞辱调教| 国产精品无码av一区二区三区| 国产又色又刺激高潮视频| 九九热免费在线视频| 91网站在线看| 亚洲AV无码日韩AV无码中文| 久久免费福利视频| 欧美人与动牲交a免费| 天天草舔欧美夜夜高朝| 伊人久久大香线蕉精品| 国产精品vⅰdeoxxxx国产| av无码久久久精品免费| 久久久久香蕉国产线看观看伊| 中出人妻中文字幕无码| 欧美孕妇XXX| 亚洲综合一区二区| 亚洲无人区视频在线观看| 国产激情久久久久| 91精品人妻一区二区六十路| 欧美精品一二三区| 色婷婷六月亚洲综合香蕉| 丰满白嫩的大屁股哺乳期偷吃少妇| AV国内高清啪啪| 岳每晚被弄得嗷嗷到高潮 | 欧洲无码观看| 欧美精品人人做人人爱视频| 亚洲无码视频一区二区三区| 亚洲人成电影网站色迅雷| 欧美疯狂做受xxxx|