夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

上海“書(shū)生”大模型奧數(shù)高分奪金,解法“前所未見(jiàn)”讓閱卷專(zhuān)家驚嘆

0
分享至


數(shù)學(xué)奧賽猶如智慧皇冠上的明珠,是頂尖智力的競(jìng)技,也一度成為人工智能(AI)難以攻克的高地。在近日揭曉的全國(guó)中學(xué)生數(shù)學(xué)奧林匹克競(jìng)賽(CMO)決賽中,由上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)研發(fā)的“書(shū)生”科學(xué)多模態(tài)大模型(Intern-S1)斬獲102分的高分,不僅遠(yuǎn)超78分的金牌分?jǐn)?shù)線,更跨過(guò)了87分的國(guó)家集訓(xùn)隊(duì)入選線,位列大模型得分榜首。

這一突破標(biāo)志著國(guó)產(chǎn)大模型在復(fù)雜邏輯推理方面邁出關(guān)鍵一步。上海AI實(shí)驗(yàn)室青年領(lǐng)軍科學(xué)家陳愷認(rèn)為,數(shù)學(xué)奧賽終于迎來(lái)“AlphaGo時(shí)刻”,顯示出人工智能在高難度代數(shù)、幾何、數(shù)論、組合數(shù)學(xué)證明題領(lǐng)域的巨大潛力。


從“做對(duì)題”邁向“創(chuàng)造性解題”

CMO是中國(guó)最高規(guī)格的高中生數(shù)學(xué)奧林匹克競(jìng)賽,難度不亞于國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO),試題以條件隱蔽、邏輯鏈條極長(zhǎng)等著稱(chēng),且所有題型均為證明題,相比解答題,對(duì)AI的挑戰(zhàn)要大得多。本次CMO決賽的700多名參賽者中,首次納入AI模型,堪稱(chēng)一場(chǎng)史無(wú)前例的“人機(jī)同考”,雙方面臨的是相同的時(shí)長(zhǎng)和閱卷標(biāo)準(zhǔn)。

最終,“書(shū)生”大模型展現(xiàn)出了驚人的思維能力。在全部6題中,有4題獲得滿(mǎn)分21分,另兩題則因?yàn)椤拔醋C明最優(yōu)性”“部分不嚴(yán)格”而分別得到9分。閱卷專(zhuān)家驚嘆其表達(dá)方式“非常接近人類(lèi)”。

最震撼的是其中第4題的解答,這是一道涉及30種顏色、2100張紙牌操作的復(fù)雜組合題。“書(shū)生”模型不僅在規(guī)定時(shí)間內(nèi)得出了正確結(jié)論,其解題思路被專(zhuān)家評(píng)價(jià)為“一個(gè)新的解法,巧妙的調(diào)整法,在學(xué)生的解法中沒(méi)有見(jiàn)過(guò)”。

未曾見(jiàn)過(guò)的解法,對(duì)AI來(lái)說(shuō),意味著它絕非“知識(shí)的搬運(yùn)工”,而是可以突破人類(lèi)思維局限,從“做對(duì)題”邁向“創(chuàng)造性解題”。而這一點(diǎn),哪怕是對(duì)人類(lèi)參賽者而言,這也是一個(gè)了不起的成就。

對(duì)于此次“書(shū)生”大模型的突破,第50屆國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽金牌選手鄭凡表示,這徹底改變了他對(duì)當(dāng)前大模型數(shù)學(xué)能力上限的看法,未來(lái)大模型有望成為一名真正的“研究伙伴”,和人類(lèi)攜手探索數(shù)學(xué),乃至更廣闊的科學(xué)疆域。


“通專(zhuān)融合”走出“第三條路”

“書(shū)生”模型之所以能取得如此突破,關(guān)鍵在于它采用了上海AI實(shí)驗(yàn)室提出的“通專(zhuān)融合”技術(shù)架構(gòu)。

當(dāng)前,全球圍繞科研領(lǐng)域的AI競(jìng)賽存在兩條主要技術(shù)路線:一條是“專(zhuān)業(yè)派”,以谷歌AlphaProof為代表,核心是基于形式化語(yǔ)言的專(zhuān)業(yè)模型,其推理過(guò)程絕對(duì)嚴(yán)謹(jǐn),但泛化性差、效率低;另一條是“通用派”,主要采用基于自然語(yǔ)言的通用模型,泛化性強(qiáng),但容易產(chǎn)生幻覺(jué),難以保證推理的嚴(yán)謹(jǐn)性。

“書(shū)生”走出了獨(dú)特的“第三條路”。據(jù)項(xiàng)目團(tuán)隊(duì)介紹,該模型通過(guò)多項(xiàng)核心技術(shù)創(chuàng)新,實(shí)現(xiàn)了“通專(zhuān)融合”,使得通用模型也具備進(jìn)行超長(zhǎng)程的嚴(yán)謹(jǐn)推理能力。

首先是以數(shù)學(xué)引理為核心的多輪分層推理機(jī)制。面對(duì)高難度數(shù)學(xué)問(wèn)題,大模型像數(shù)學(xué)家一樣將復(fù)雜推理拆解為一個(gè)個(gè)可復(fù)用的“引理模塊”,通過(guò)多種模型的分工協(xié)作,突破了單次上下文長(zhǎng)度限制,實(shí)現(xiàn)了分階段探索與校驗(yàn)。

二是基于結(jié)果的過(guò)程校驗(yàn)。針對(duì)AI在進(jìn)行長(zhǎng)鏈條推理時(shí)容易出錯(cuò)的痛點(diǎn),科研人員引入了高密度的監(jiān)督機(jī)制,顯著提升了證明過(guò)程的嚴(yán)謹(jǐn)性。

三是將通用模型與專(zhuān)業(yè)符號(hào)引擎結(jié)合,使AI兼具“發(fā)散性思維”和精確嚴(yán)謹(jǐn),使其能像人類(lèi)科學(xué)家一樣逐步推導(dǎo)、試錯(cuò)和修正。

值得一提的是,上海AI實(shí)驗(yàn)室的這一技術(shù)路線已展現(xiàn)出極高的數(shù)據(jù)效率。相比于谷歌的幾何模型AlphaGeometry2,“書(shū)生”僅需不到萬(wàn)分之一的訓(xùn)練樣本就實(shí)現(xiàn)了超越,擺脫了對(duì)超大規(guī)模合成數(shù)據(jù)的依賴(lài)。


上海AI實(shí)驗(yàn)室主任、首席科學(xué)家周伯文

AI接連攻克基礎(chǔ)科學(xué)堡壘

此次在數(shù)學(xué)奧賽中取得佳績(jī),并非上海AI實(shí)驗(yàn)室在科學(xué)領(lǐng)域的“首金”。就在上個(gè)月,該實(shí)驗(yàn)室的AI模型同樣經(jīng)受了2025年國(guó)際物理奧賽(IPhO)的考驗(yàn),并拿下金牌,成為首個(gè)也是唯一獲得金牌的開(kāi)源模型。接連攻克兩座基礎(chǔ)科學(xué)的“堡壘”,某種意義上標(biāo)志著AI正從單一任務(wù)的求解者,逐漸向具備跨學(xué)科能力的“全能科學(xué)家”演進(jìn)。

當(dāng)前,全球科技巨頭都在競(jìng)相布局AI for Science(人工智能驅(qū)動(dòng)的科學(xué)研究),但往往受困于無(wú)法突破“長(zhǎng)程思考”的瓶頸。上海AI實(shí)驗(yàn)室的探索證明,“通專(zhuān)融合”在賦能多領(lǐng)域科研方面的技術(shù)可行性。

正如上海AI實(shí)驗(yàn)室主任、首席科學(xué)家周伯文所說(shuō),AI for Science應(yīng)當(dāng)在未來(lái)邁向AGI(通用人工智能) for Science,這意味著需要從純粹依賴(lài)自然語(yǔ)言,走向自然語(yǔ)言與符號(hào)語(yǔ)言等多種表示形式的融合?!皶?shū)生”模型正是這一理念的體現(xiàn)。

當(dāng)前,不少科學(xué)領(lǐng)域都積累了許多專(zhuān)業(yè)工具和計(jì)算引擎。一旦AI模型能夠展現(xiàn)出足夠的泛化能力,那么采取“通專(zhuān)融合”的路線,疊加相關(guān)學(xué)科領(lǐng)域的專(zhuān)業(yè)工具,AI有望快速達(dá)到該領(lǐng)域?qū)<宜健?/p>

據(jù)上海AI實(shí)驗(yàn)室透露,他們計(jì)劃將“書(shū)生”模型的長(zhǎng)程推理能力,拓展至物理、化學(xué)、生命科學(xué)等更廣泛的基礎(chǔ)科研領(lǐng)域,不斷推進(jìn)“長(zhǎng)時(shí)間獨(dú)立思考”,甚至是“長(zhǎng)時(shí)間獨(dú)立科研”,從而加速各領(lǐng)域科研范式的根本性變革,為重大科學(xué)突破提供關(guān)鍵支撐,賦能未來(lái)的科學(xué)發(fā)現(xiàn)進(jìn)程。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這款有人喜歡沒(méi)!我喜歡,不看前面我怕失望!

這款有人喜歡沒(méi)!我喜歡,不看前面我怕失望!

水泥土的搞笑
2025-11-30 10:04:34
隨著孫穎莎4-0,蒯曼4-2,國(guó)乒包攬女單四強(qiáng),日本+韓國(guó)全軍覆沒(méi)

隨著孫穎莎4-0,蒯曼4-2,國(guó)乒包攬女單四強(qiáng),日本+韓國(guó)全軍覆沒(méi)

侃球熊弟
2025-12-12 22:18:25
中國(guó)清點(diǎn)在日人數(shù),日本嗅到不平常信號(hào),一通緊急電話打往美國(guó)

中國(guó)清點(diǎn)在日人數(shù),日本嗅到不平常信號(hào),一通緊急電話打往美國(guó)

南宮一二
2025-12-12 16:57:30
郭德綱也沒(méi)想到,被約談五天后岳云鵬的救場(chǎng),讓德云社口碑翻盤(pán)了

郭德綱也沒(méi)想到,被約談五天后岳云鵬的救場(chǎng),讓德云社口碑翻盤(pán)了

一娛三分地
2025-12-12 17:10:53
志愿軍三個(gè)副司令,回國(guó)后三種命:鄧華跌得最慘,韓先楚穩(wěn)坐23年,只有他活成了兩代上將

志愿軍三個(gè)副司令,回國(guó)后三種命:鄧華跌得最慘,韓先楚穩(wěn)坐23年,只有他活成了兩代上將

文史明鑒
2025-12-12 21:08:17
躺醫(yī)院七年半的“無(wú)名”,最新DNA比對(duì)結(jié)果出來(lái)了

躺醫(yī)院七年半的“無(wú)名”,最新DNA比對(duì)結(jié)果出來(lái)了

極目新聞
2025-12-12 20:33:57
膝蓋的“頭號(hào)敵人”,不是跑步,而是它!7個(gè)動(dòng)作保養(yǎng)你的膝蓋

膝蓋的“頭號(hào)敵人”,不是跑步,而是它!7個(gè)動(dòng)作保養(yǎng)你的膝蓋

瑜伽解剖學(xué)
2025-12-11 08:28:04
CBA歷史首次潛力賽:山西27-24險(xiǎn)勝?gòu)V廈 張寧葛昭寶參賽引爭(zhēng)議

CBA歷史首次潛力賽:山西27-24險(xiǎn)勝?gòu)V廈 張寧葛昭寶參賽引爭(zhēng)議

醉臥浮生
2025-12-12 22:15:14
范曾得子斷親不到24小時(shí),小50歲嬌妻遭殃,爭(zhēng)家產(chǎn)只是冰山一角

范曾得子斷親不到24小時(shí),小50歲嬌妻遭殃,爭(zhēng)家產(chǎn)只是冰山一角

娛說(shuō)瑜悅
2025-12-12 15:21:22
難以置信!10年無(wú)人發(fā)現(xiàn)993萬(wàn)流失,政務(wù)大廳居然放置個(gè)人收款碼

難以置信!10年無(wú)人發(fā)現(xiàn)993萬(wàn)流失,政務(wù)大廳居然放置個(gè)人收款碼

火山詩(shī)話
2025-12-13 06:53:21
荒淫無(wú)恥!原中行董事長(zhǎng)劉連舸把兒媳睡成第四房姨太太

荒淫無(wú)恥!原中行董事長(zhǎng)劉連舸把兒媳睡成第四房姨太太

大嘴説
2025-12-12 21:59:53
大快人心!歐盟出手快速又巧妙,將俄羅斯資產(chǎn)改為“永久凍結(jié)”

大快人心!歐盟出手快速又巧妙,將俄羅斯資產(chǎn)改為“永久凍結(jié)”

鷹眼Defence
2025-12-12 17:51:52
宗慶后18億美元信托案再度反轉(zhuǎn):宗馥莉?yàn)楸@^承權(quán)正當(dāng)性在香港上訴

宗慶后18億美元信托案再度反轉(zhuǎn):宗馥莉?yàn)楸@^承權(quán)正當(dāng)性在香港上訴

經(jīng)理人雜志
2025-12-12 20:36:45
廣東一男子偷情被抓:10分鐘視頻流出,正面照曝光,對(duì)話內(nèi)容泄露

廣東一男子偷情被抓:10分鐘視頻流出,正面照曝光,對(duì)話內(nèi)容泄露

博士觀察
2025-12-12 20:32:19
暴雪、寒潮、大風(fēng),中央氣象臺(tái)繼續(xù)三預(yù)警齊發(fā)

暴雪、寒潮、大風(fēng),中央氣象臺(tái)繼續(xù)三預(yù)警齊發(fā)

界面新聞
2025-12-12 18:11:30
自絕后路不到24小時(shí),范曾擔(dān)心的事發(fā)生,遭殃的何止小50歲的嬌妻

自絕后路不到24小時(shí),范曾擔(dān)心的事發(fā)生,遭殃的何止小50歲的嬌妻

阿纂看事
2025-12-12 10:08:39
國(guó)道重啟收費(fèi)引熱議:燃油稅已交,為何還要再掏過(guò)路費(fèi)?

國(guó)道重啟收費(fèi)引熱議:燃油稅已交,為何還要再掏過(guò)路費(fèi)?

胡嚴(yán)亂語(yǔ)
2025-12-12 14:39:09
49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當(dāng)年小燕子徹底涼透了

49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當(dāng)年小燕子徹底涼透了

阿纂看事
2025-12-12 09:18:29
媒體人:張寧的動(dòng)作放在FIBA體系下考量是災(zāi)難 多練球技少練連招吧

媒體人:張寧的動(dòng)作放在FIBA體系下考量是災(zāi)難 多練球技少練連招吧

狼叔評(píng)論
2025-12-12 23:34:06
看完CBA揭幕戰(zhàn)廣廈戰(zhàn)勝山西,明白中國(guó)男籃為何慘敗給韓國(guó)隊(duì)了

看完CBA揭幕戰(zhàn)廣廈戰(zhàn)勝山西,明白中國(guó)男籃為何慘敗給韓國(guó)隊(duì)了

姜大叔侃球
2025-12-12 22:11:22
2025-12-13 09:15:00
文匯報(bào) incentive-icons
文匯報(bào)
華語(yǔ)世界高品質(zhì)人文閱讀平臺(tái)
265884文章數(shù) 309806關(guān)注度
往期回顧 全部

教育要聞

正向反饋效應(yīng):讓孩子從厭學(xué)到愛(ài)上學(xué)習(xí)

頭條要聞

開(kāi)寶馬男子盜車(chē)搶走金店老板價(jià)值237萬(wàn)首飾 獲刑15年

頭條要聞

開(kāi)寶馬男子盜車(chē)搶走金店老板價(jià)值237萬(wàn)首飾 獲刑15年

體育要聞

15輪2分,他們?cè)趺闯闪擞⒊顮€球隊(duì)?

娛樂(lè)要聞

上海這一夜,33歲陳麗君秒了32歲吉娜?

財(cái)經(jīng)要聞

鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

科技要聞

凌晨突發(fā)!GPT-5.2上線,首批實(shí)測(cè)感受來(lái)了

汽車(chē)要聞

表面風(fēng)平浪靜 內(nèi)里翻天覆地!試駕銀河星艦7 EM-i

態(tài)度原創(chuàng)

房產(chǎn)
親子
家居
本地
軍事航空

房產(chǎn)要聞

每日狂增1300+企業(yè)!封關(guān)在即,海南徹底爆發(fā)!

親子要聞

50天小寶寶理發(fā),網(wǎng)友評(píng)論炸了!

家居要聞

溫潤(rùn)質(zhì)感 打造干凈空間

本地新聞

云游安徽|阜陽(yáng)三朝風(fēng)骨,傳承千年墨香

軍事要聞

俄烏“和平計(jì)劃”磋商頓巴斯成焦點(diǎn)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产国产人免费视频成69| 亚洲在战av极品无码| 91人妻人人爽人人澡| 国产色综合久久无码有码| 野花视频在线观看免费观看最新| 国产三区四区| 老熟女精品视频一区| 亚洲12色吧| 亚洲AV永久无码天堂网一线| 一个人免费视频观看在线WWW| 丝袜不卡肉肉| 国产亚洲精品成人av久| XXXX性xXX乱公交车| 七十二性插图大香焦| 国产盗摄xxxx视频xxxx| 精东麻豆蜜桃91av亚洲一区| 精品久久久久久成人影院免费 | 丰满大肚子孕妇毛片| 天天爽夜夜爱| 精品无码A∨一区二区三区少奶| 韩一区二区三区| 亚洲卡1卡2卡新区网站| 一个人免费视频观看在线WWW| 噜噜噜噜久久久久久久久| 五月天久久久噜噜噜久久| 国产一区二区在线视频| 欧美性爱一级视频| 国产一精品一aⅴ免费| 亚洲熟妇无码一区二区三区导航 | 女狠狠噜天天噜日日噜| 亚洲色大成网站www国产| 欧美一区二区高潮白浆| 亚洲日韩久久综合中文字幕| 亚洲一区二区观看播放| 亚洲精品成人无码av毛片在线| 国产伦精品一区二区妓女| 美国一区二区三区无码视频| 久久AV激情| 国内极度色诱视频网站| 免费毛片大肚孕妇孕交AV| 久久丫精品久久丫|