夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,OpenAI在ICPC 2025編程賽上滿分登頂,Gemini也達(dá)到金牌水平

0
分享至



機(jī)器之心報(bào)道

編輯:楊文、+0

IMO 之后,OpenAI 與 Gemini 雙雙加冕 ICPC 2025 金牌。

就在剛剛,OpenAI 和 Gemini 都聲稱達(dá)到了 ICPC 金牌水平。

其中,OpenAI 在 5 個(gè)小時(shí)內(nèi)解決了所有 12 個(gè)問題,相當(dāng)于人類排名第 1 位,超過了所有參賽大學(xué)團(tuán)隊(duì)。



而 Gemini 解決了 12 個(gè)問題中的 10 個(gè),總用時(shí) 677 分鐘,達(dá)到了金牌水平,如果與人類團(tuán)隊(duì)比較,將排名第 2。



人類團(tuán)隊(duì)方面,俄羅斯圣彼得堡國立大學(xué)的參賽隊(duì)伍排名第 1,解決了 11 個(gè)問題。北京交通大學(xué)、清華大學(xué)、北京大學(xué)、中國科學(xué)技術(shù)大學(xué)的參賽隊(duì)伍分別排名 2、4、5、9。



ICPC,即國際大學(xué)生程序設(shè)計(jì)競賽,是全球公認(rèn)的歷史最悠久、規(guī)模最大、最負(fù)盛名的大學(xué)級(jí)算法編程競賽,它比 IMO 等高中奧林匹克競賽更高一級(jí)。每年,來自近 3000 所大學(xué)和 103 個(gè)國家的參賽者齊聚一堂,挑戰(zhàn)現(xiàn)實(shí)世界的編程難題。

今年的 ICPC 世界決賽于 9 月 4 日在阿塞拜疆的巴庫舉行,匯集了來自競賽早期階段的頂級(jí)隊(duì)伍。在五小時(shí)的比賽中,每支隊(duì)伍解決了一組復(fù)雜的算法問題。最終排名嚴(yán)格依據(jù)兩個(gè)原則:只有完美的解決方案才能得分,每一分鐘都至關(guān)重要。在 139 支參賽隊(duì)伍中,只有前四支隊(duì)伍獲得了金牌。

下面是 ICPC 的原題,感興趣的讀者可以親自嘗試一下。

https://worldfinals.icpc.global/problems/2025/finals/index.html

OpenAI 5 小時(shí)內(nèi)解決 12 個(gè)問題

超過人類團(tuán)隊(duì)

OpenAI 的 與人類頂尖選手在完全同等的條件下競技:面對(duì)完全相同的賽題,擁有相同的 5 小時(shí)時(shí)限,并由與 ICPC 全球總決賽標(biāo)準(zhǔn)一致的本地系統(tǒng)進(jìn)行實(shí)時(shí)評(píng)判。

整個(gè)過程中,AI 系統(tǒng)在沒有任何定制化測試工具的輔助下,獨(dú)立分析問題并自主決定提交最終答案。

比賽結(jié)果令人矚目:在全部 12 個(gè)問題中,該 AI 系統(tǒng)對(duì)其中 11 個(gè)問題的首次提交便獲得了正確答案。即便是全場難度最高、困住所有人類隊(duì)伍的最后一個(gè)問題,AI 也在經(jīng)過 9 次嘗試后成功攻克。相比之下,本次競賽表現(xiàn)最出色的人類團(tuán)隊(duì)成功解決了 11 個(gè)問題。



其中問題 G,OpenAI 嘗試 9 次后成功解決,該問題也是 DeepMind 未能解決的兩道難題之一。作為參考,解題速度最快的人類選手也耗時(shí) 270 分鐘(競賽總時(shí)長 300 分鐘)。



OpenAI 方面透露,此次參賽的 AI 由一個(gè)「通用推理模型集成體」構(gòu)成,并未針對(duì) ICPC 競賽進(jìn)行任何專門的優(yōu)化或訓(xùn)練。

在解題過程中,系統(tǒng)結(jié)合了其下一代模型 GPT-5 與一個(gè)前沿的實(shí)驗(yàn)性推理模型。其中,GPT-5 精準(zhǔn)地解答了 11 題,而那款實(shí)驗(yàn)性模型則最終完成了對(duì)最難題目的關(guān)鍵一擊。

這一成果是 OpenAI 一系列展示推理系統(tǒng)驚人進(jìn)步速度的絕佳里程碑。同一組模型已在國際數(shù)學(xué)奧林匹克(IMO)和國際信息學(xué)奧林匹克(IOI)等競賽中證明了其實(shí)力,充分印證了其強(qiáng)大的通用性與廣泛的適用潛力。

OpenAI 員工 Borys Minaiev 和 Mostafa Rohaninejad 也在 X 上發(fā)文慶賀。

Borys Minaiev



Borys Minaiev 是 OpenAI 的研究員,專注于大規(guī)模推理模型的開發(fā)與應(yīng)用,尤其在編程競賽和復(fù)雜推理任務(wù)中展現(xiàn)了卓越能力。

他畢業(yè)于圣彼得堡國立信息技術(shù)、機(jī)械與光學(xué)大學(xué)(ITMO University),并在編程競賽領(lǐng)域取得了顯著成就。2015 年,他作為 ITMO 大學(xué)隊(duì)員之一,贏得了國際大學(xué)生程序設(shè)計(jì)競賽(ICPC)世界總決賽的冠軍,這是該賽事歷史上唯一一支在比賽結(jié)束前解決所有問題的隊(duì)伍。



在加入 OpenAI 后,Borys Minaiev 成為大型推理模型研究的核心成員之一,參與了多個(gè)關(guān)鍵項(xiàng)目,包括 o1、o3 和 o4-mini 等模型的開發(fā)。

此外,Borys Minaiev 還活躍于開源社區(qū),在 GitHub 上分享了多個(gè)項(xiàng)目,并在個(gè)人博客中深入探討了模擬退火算法、Rust 編程語言以及 AI 在教育中的應(yīng)用等主題。

Mostafa Rohaninejad



Mostafa Rohaninejad 是 OpenAI 的研究科學(xué)家,專注于元學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和人工智能系統(tǒng)的推理能力。

他于 2023 年加入 OpenAI,參與了多個(gè)關(guān)鍵項(xiàng)目,包括 GPT-5 和 OpenAI o1 等大規(guī)模推理模型的開發(fā)。

在加入 OpenAI 之前,Mostafa 曾在加州大學(xué)伯克利分校攻讀計(jì)算機(jī)科學(xué)碩士學(xué)位,并在該校的 BAIR 實(shí)驗(yàn)室與 Pieter Abbeel 教授合作,研究元學(xué)習(xí)和生成模型。他是著名的 SNAIL 架構(gòu)的共同作者,該架構(gòu)在少樣本學(xué)習(xí)任務(wù)中表現(xiàn)出色。



Mostafa 的研究興趣主要集中在如何使人工智能系統(tǒng)具備更強(qiáng)的推理能力和適應(yīng)性,特別是在復(fù)雜任務(wù)和動(dòng)態(tài)環(huán)境中的表現(xiàn)。他在 OpenAI 的工作不僅推動(dòng)了 AI 技術(shù)的發(fā)展,也為實(shí)現(xiàn)更智能、更人性化的 AI 系統(tǒng)奠定了基礎(chǔ)。

谷歌 Gemini 解決 10 個(gè)難題

達(dá)到金牌級(jí)別

Gemini 2.5 Deep Think 的高級(jí)版本在 ICPC 規(guī)則下,以遠(yuǎn)程在線環(huán)境參與競賽,并在比賽組織者的指導(dǎo)下進(jìn)行。

它比人類參賽者晚了 10 分鐘開始,但在五小時(shí)的時(shí)間限制內(nèi)正確解決了 12 個(gè)問題中的 10 個(gè),達(dá)到了金牌級(jí)表現(xiàn)。

Gemini 2025 ICPC 世界總決賽代碼:https://github.com/google-deepmind/gemini_icpc2025

Gemini 在僅 45 分鐘內(nèi)就解決了 8 個(gè)問題,接著在三小時(shí)內(nèi)又解決了兩個(gè)問題,使用了各種高級(jí)數(shù)據(jù)結(jié)構(gòu)和算法來生成解決方案。通過 677 分鐘的總時(shí)間解決了 10 個(gè)問題,若與大學(xué)隊(duì)伍的成績相比,Gemini 2.5 Deep Think 將排名第二。



圖片顯示了在 2025 年 ICPC 世界決賽中每個(gè)問題的解題時(shí)間。Gemini 的時(shí)間以藍(lán)色表示,最快的大學(xué)隊(duì)伍時(shí)間以灰色表示。

值得一提的是,Gemini 在半小時(shí)內(nèi)成功解決了 C 題,而這道題在競賽中沒有任何大學(xué)隊(duì)伍解出。



這道題目要求找到一種解決方案,通過一系列相互連接的管道將液體分配到多個(gè)水庫中,目標(biāo)是找到一種配置使液體盡快充滿所有水庫。由于每個(gè)管道可能是開放的、關(guān)閉的,甚至是部分開放的,因此存在無限多種可能的配置,這使得尋找最優(yōu)配置變得非常困難。

Gemini 找到了一種有效的解決方案:它首先假設(shè)每個(gè)水庫都有一個(gè)「優(yōu)先級(jí)值」,表示該水庫相對(duì)于其他水庫的偏好程度。在給定一組優(yōu)先級(jí)值后,可以通過動(dòng)態(tài)規(guī)劃算法找到最優(yōu)的管道配置。Gemini 發(fā)現(xiàn),通過應(yīng)用極小極大定理,可以將原問題轉(zhuǎn)化為尋找使得流量最受限制的優(yōu)先級(jí)值。利用優(yōu)先級(jí)值與最優(yōu)流量之間的關(guān)系,Gemini 通過嵌套三分查找迅速找到最優(yōu)的優(yōu)先級(jí)值,從而成功解決了 C 題。

據(jù)谷歌內(nèi)部研究表明,類似版本的 Gemini 2.5 Deep Think 也可以在 2023 年和 2024 年 ICPC 世界總決賽中取得金牌級(jí)別的表現(xiàn),與全球前 20 名的編程選手表現(xiàn)相當(dāng)。

此外,谷歌官方博客還感謝了一眾這個(gè)項(xiàng)目背后的貢獻(xiàn)者。其中 Hanzhao (Maggie) Lin 領(lǐng)導(dǎo)了 Gemini 競賽編程和 ICPC 2025 工作的整體技術(shù)方向,并與 Heng-Tze Cheng 共同領(lǐng)導(dǎo)了整體研究和執(zhí)行工作。

Hanzhao (Maggie) Lin



Hanzhao (Maggie) Lin 是 Google DeepMind 的高級(jí)研究科學(xué)家,專注于大規(guī)模語言模型和多模態(tài)系統(tǒng)的研究與開發(fā)。

她的研究方向主要涵蓋大規(guī)模語言模型、系統(tǒng)架構(gòu)以及其在教育和復(fù)雜推理中的應(yīng)用。她在 AI 領(lǐng)域的貢獻(xiàn)包括參與了 Google DeepMind 的 LaMDA 和 PaLM 2 等大型語言模型的后訓(xùn)練研究,并推動(dòng)了模型在多模態(tài)理解、推理和工具使用等方面的能力提升。

此外,她還主導(dǎo)了 Gemini Deep Think 模型在國際數(shù)學(xué)奧林匹克(IMO)競賽中的應(yīng)用,取得了金牌級(jí)別的表現(xiàn),展示了 AI 在復(fù)雜數(shù)學(xué)推理中的潛力。

Heng-Tze Cheng



Heng-Tze Cheng 是 Google DeepMind 的研究總監(jiān)兼首席研究科學(xué)家,專注于大語言模型和對(duì)話 AI 的研究與應(yīng)用。他在自然語言處理(NLP)、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)和多模態(tài)推理等領(lǐng)域具有深厚的研究背景。

他本科畢業(yè)于臺(tái)灣大學(xué)電機(jī)工程系,2013 年于卡內(nèi)基梅隆大學(xué)獲得電氣與計(jì)算機(jī)工程博士學(xué)位,研究方向包括機(jī)器學(xué)習(xí)和多模態(tài)信號(hào)處理,2014 年加入 Google,先后在 Google Brain 和 DeepMind 擔(dān)任技術(shù)領(lǐng)導(dǎo)職務(wù)。



ICPC 所要求的技能,比如理解復(fù)雜問題、制定多步驟的邏輯計(jì)劃并精準(zhǔn)執(zhí)行,正是許多科學(xué)和工程領(lǐng)域所需的核心能力。

AI 此次在 ICPC 中獲得金牌級(jí)成績凸顯了 AI 在提供創(chuàng)新性解決方案方面的獨(dú)特優(yōu)勢,能夠有效補(bǔ)充人類專家的技能和知識(shí)。這也表明,AI 正從單純的信息處理工具,轉(zhuǎn)變?yōu)閰f(xié)助解決復(fù)雜推理問題的關(guān)鍵力量。

https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

https://x.com/HengTze/status/1968359525339246825

https://x.com/MostafaRohani/status/1968360976379703569

https://x.com/bminaiev/status/1968363052329484642

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
名記Lowe:雷霆新賽季拿不到70勝,西部整體實(shí)力太強(qiáng)了

名記Lowe:雷霆新賽季拿不到70勝,西部整體實(shí)力太強(qiáng)了

雷速體育
2025-09-20 10:53:16
浙大發(fā)現(xiàn):血糖不超過這個(gè)值,不用太克制自己,吃點(diǎn)饅頭或許更好

浙大發(fā)現(xiàn):血糖不超過這個(gè)值,不用太克制自己,吃點(diǎn)饅頭或許更好

泠泠說史
2025-09-18 16:24:54
實(shí)地探訪西貝線下門店,飯點(diǎn)高峰期沒人就餐,多年老粉選擇退卡

實(shí)地探訪西貝線下門店,飯點(diǎn)高峰期沒人就餐,多年老粉選擇退卡

娛小北
2025-09-18 17:10:21
稻盛和夫:站在1樓,有人罵我,我很生氣;站在10樓,有人罵我...

稻盛和夫:站在1樓,有人罵我,我很生氣;站在10樓,有人罵我...

清風(fēng)拂心
2025-09-15 14:15:08
100-59!追夢格林上演鎖喉!最會(huì)整活的百分大戰(zhàn)

100-59!追夢格林上演鎖喉!最會(huì)整活的百分大戰(zhàn)

籃球?qū)崙?zhàn)寶典
2025-09-19 23:05:00
王允除掉董卓后,大權(quán)在握,為什么轉(zhuǎn)眼間就家破人亡了?

王允除掉董卓后,大權(quán)在握,為什么轉(zhuǎn)眼間就家破人亡了?

掠影后有感
2025-09-19 14:55:16
那么多年過去,干活的還是80后…

那么多年過去,干活的還是80后…

槽邏輯
2025-09-19 18:53:53
英超點(diǎn)球戴帽!小克魯伊維特獲吉尼斯世界紀(jì)錄證書

英超點(diǎn)球戴帽!小克魯伊維特獲吉尼斯世界紀(jì)錄證書

直播吧
2025-09-19 19:22:01
完?duì)僮樱∽竽_手術(shù)+賽季報(bào)銷,1.5億續(xù)約懸了,剛打出最佳表現(xiàn)啊

完?duì)僮?!左腳手術(shù)+賽季報(bào)銷,1.5億續(xù)約懸了,剛打出最佳表現(xiàn)啊

球童無忌
2025-09-20 01:08:28
錢再多也沒用!繼李連杰后黃渤又傳“噩耗”,妻兒成了唯一牽掛

錢再多也沒用!繼李連杰后黃渤又傳“噩耗”,妻兒成了唯一牽掛

小楊侃事
2025-09-20 09:23:48
換了四輛車之后,我對(duì)六座SUV徹底失望了,這些家庭要買更不推薦

換了四輛車之后,我對(duì)六座SUV徹底失望了,這些家庭要買更不推薦

小李車評(píng)李建紅
2025-09-19 06:51:08
發(fā)現(xiàn)沒?阿拉伯世界覺醒了!

發(fā)現(xiàn)沒?阿拉伯世界覺醒了!

176翠翠
2025-09-20 10:46:50
喝酒四巨頭:不到兩年全沒,有的去世當(dāng)天喝4瓶白酒,最小的才26

喝酒四巨頭:不到兩年全沒,有的去世當(dāng)天喝4瓶白酒,最小的才26

法老不說教
2025-09-18 14:46:46
大廠被裁,帶300多萬回縣城,本想躺平,誰知兩個(gè)月后“逃離”……

大廠被裁,帶300多萬回縣城,本想躺平,誰知兩個(gè)月后“逃離”……

毯叔盤錢
2025-09-17 19:29:12
大三男生出軌兩高顏值女生,兩分內(nèi)部鐘視頻流出,一畫面信息量大

大三男生出軌兩高顏值女生,兩分內(nèi)部鐘視頻流出,一畫面信息量大

博士觀察
2025-09-19 19:18:03
王朝朝奪得東京田徑世錦賽男子20公里競走亞軍

王朝朝奪得東京田徑世錦賽男子20公里競走亞軍

魯中晨報(bào)
2025-09-20 10:50:11
他假冒軍人15年,騙380萬加倆老婆,給自己升官,被抓時(shí)已是少將

他假冒軍人15年,騙380萬加倆老婆,給自己升官,被抓時(shí)已是少將

浩舞默畫
2025-09-18 08:47:27
將生產(chǎn)兩款純電SUV 豐田最新消息曝光

將生產(chǎn)兩款純電SUV 豐田最新消息曝光

樂選愛車
2025-09-20 08:00:03
8500萬先生!冷知識(shí):沃爾特馬德剛完成歐冠首秀,上賽季沒報(bào)名

8500萬先生!冷知識(shí):沃爾特馬德剛完成歐冠首秀,上賽季沒報(bào)名

直播吧
2025-09-19 18:27:04
武大郎用生命告誡,沒錢別玩高配;西門慶用生命告誡,有錢也不能亂來;潘金蓮告訴我們……

武大郎用生命告誡,沒錢別玩高配;西門慶用生命告誡,有錢也不能亂來;潘金蓮告訴我們……

詩詞世界
2025-09-19 06:05:51
2025-09-20 12:04:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11322文章數(shù) 142453關(guān)注度
往期回顧 全部

科技要聞

字節(jié)跳動(dòng)凌晨發(fā)布公告

頭條要聞

媒體:特朗普稱美軍要重返阿富汗 或看九三閱兵焦慮了

頭條要聞

媒體:特朗普稱美軍要重返阿富汗 或看九三閱兵焦慮了

體育要聞

亞洲天王效應(yīng) 孫興慜球衣售150萬件破梅西紀(jì)錄

娛樂要聞

香港愛馬仕大秀,古天樂面相變了

財(cái)經(jīng)要聞

最重要的一個(gè)電話,信息量果然很大

汽車要聞

標(biāo)配華為輔助駕駛 傳祺向往S9上市售22.99萬元起

態(tài)度原創(chuàng)

家居
本地
親子
公開課
軍事航空

家居要聞

公共藝術(shù) 限時(shí)體驗(yàn)打造

本地新聞

大學(xué)生軍訓(xùn)哪家強(qiáng),廣西申請(qǐng)“出戰(zhàn)”!

親子要聞

孕晚期才知道老公藏了十年的精神病,該怎么辦了?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以軍兩個(gè)方向朝加沙城市中心推進(jìn)

無障礙瀏覽 進(jìn)入關(guān)懷版 毛多水多日B片| 99精品毛片| 老熟女爱草逼| 黑人干亚洲女| 性色AV乱码一区二区三区麻豆| 老司机亚洲精品一区二区| 久久久www.| 7777米奇网| 亚洲一二三四区| 在线视频中文字幕二区| 少妇一区二区自慰AV| 最新AV中文字幕无码专区| 国产精品自拍视频免费看| 全免费a级毛片| 午夜在线河南实验黄色片视频| 欧美人与马的性爱| 亚洲综合网国产精品一区| 国产美女自慰在线| 日本A级网站| 寂寞少妇啊轻点灬太粗太长了视频| 韩国无码视频一区| 中文字幕av一区二区三区人妻少妇| 国产精品传媒二区| 日本中文字幕免费| 国产精品自在在线午夜| 激情偷乱人伦在线视频| 免费A级毛片无码蜜芽欣赏网| 日韩 另类 综合 自拍 亚洲| 精品人妻在线| 性感美女黄色视频| 色鬼7777久久| 好屌妞在线播放| 国产精品亚洲二区在线看| 乱人妻中文字幕| 国产成人精彩在线视频| 日韩无矿砖一线二线卡乱| 欧美少妇高潮喷水| 国产浮力第一页草草影院| 欧美九九九久久久久久| 中文字幕av无码不卡| 欧美金发尤物大战黑人|