機(jī)器之心報(bào)道
編輯:楊文、+0
IMO 之后,OpenAI 與 Gemini 雙雙加冕 ICPC 2025 金牌。
就在剛剛,OpenAI 和 Gemini 都聲稱達(dá)到了 ICPC 金牌水平。
其中,OpenAI 在 5 個(gè)小時(shí)內(nèi)解決了所有 12 個(gè)問題,相當(dāng)于人類排名第 1 位,超過了所有參賽大學(xué)團(tuán)隊(duì)。
而 Gemini 解決了 12 個(gè)問題中的 10 個(gè),總用時(shí) 677 分鐘,達(dá)到了金牌水平,如果與人類團(tuán)隊(duì)比較,將排名第 2。
人類團(tuán)隊(duì)方面,俄羅斯圣彼得堡國立大學(xué)的參賽隊(duì)伍排名第 1,解決了 11 個(gè)問題。北京交通大學(xué)、清華大學(xué)、北京大學(xué)、中國科學(xué)技術(shù)大學(xué)的參賽隊(duì)伍分別排名 2、4、5、9。
ICPC,即國際大學(xué)生程序設(shè)計(jì)競賽,是全球公認(rèn)的歷史最悠久、規(guī)模最大、最負(fù)盛名的大學(xué)級(jí)算法編程競賽,它比 IMO 等高中奧林匹克競賽更高一級(jí)。每年,來自近 3000 所大學(xué)和 103 個(gè)國家的參賽者齊聚一堂,挑戰(zhàn)現(xiàn)實(shí)世界的編程難題。
今年的 ICPC 世界決賽于 9 月 4 日在阿塞拜疆的巴庫舉行,匯集了來自競賽早期階段的頂級(jí)隊(duì)伍。在五小時(shí)的比賽中,每支隊(duì)伍解決了一組復(fù)雜的算法問題。最終排名嚴(yán)格依據(jù)兩個(gè)原則:只有完美的解決方案才能得分,每一分鐘都至關(guān)重要。在 139 支參賽隊(duì)伍中,只有前四支隊(duì)伍獲得了金牌。
下面是 ICPC 的原題,感興趣的讀者可以親自嘗試一下。
https://worldfinals.icpc.global/problems/2025/finals/index.html
OpenAI 5 小時(shí)內(nèi)解決 12 個(gè)問題
超過人類團(tuán)隊(duì)
OpenAI 的 與人類頂尖選手在完全同等的條件下競技:面對(duì)完全相同的賽題,擁有相同的 5 小時(shí)時(shí)限,并由與 ICPC 全球總決賽標(biāo)準(zhǔn)一致的本地系統(tǒng)進(jìn)行實(shí)時(shí)評(píng)判。
整個(gè)過程中,AI 系統(tǒng)在沒有任何定制化測試工具的輔助下,獨(dú)立分析問題并自主決定提交最終答案。
比賽結(jié)果令人矚目:在全部 12 個(gè)問題中,該 AI 系統(tǒng)對(duì)其中 11 個(gè)問題的首次提交便獲得了正確答案。即便是全場難度最高、困住所有人類隊(duì)伍的最后一個(gè)問題,AI 也在經(jīng)過 9 次嘗試后成功攻克。相比之下,本次競賽表現(xiàn)最出色的人類團(tuán)隊(duì)成功解決了 11 個(gè)問題。
其中問題 G,OpenAI 嘗試 9 次后成功解決,該問題也是 DeepMind 未能解決的兩道難題之一。作為參考,解題速度最快的人類選手也耗時(shí) 270 分鐘(競賽總時(shí)長 300 分鐘)。
OpenAI 方面透露,此次參賽的 AI 由一個(gè)「通用推理模型集成體」構(gòu)成,并未針對(duì) ICPC 競賽進(jìn)行任何專門的優(yōu)化或訓(xùn)練。
在解題過程中,系統(tǒng)結(jié)合了其下一代模型 GPT-5 與一個(gè)前沿的實(shí)驗(yàn)性推理模型。其中,GPT-5 精準(zhǔn)地解答了 11 題,而那款實(shí)驗(yàn)性模型則最終完成了對(duì)最難題目的關(guān)鍵一擊。
這一成果是 OpenAI 一系列展示推理系統(tǒng)驚人進(jìn)步速度的絕佳里程碑。同一組模型已在國際數(shù)學(xué)奧林匹克(IMO)和國際信息學(xué)奧林匹克(IOI)等競賽中證明了其實(shí)力,充分印證了其強(qiáng)大的通用性與廣泛的適用潛力。
OpenAI 員工 Borys Minaiev 和 Mostafa Rohaninejad 也在 X 上發(fā)文慶賀。
Borys Minaiev
Borys Minaiev 是 OpenAI 的研究員,專注于大規(guī)模推理模型的開發(fā)與應(yīng)用,尤其在編程競賽和復(fù)雜推理任務(wù)中展現(xiàn)了卓越能力。
他畢業(yè)于圣彼得堡國立信息技術(shù)、機(jī)械與光學(xué)大學(xué)(ITMO University),并在編程競賽領(lǐng)域取得了顯著成就。2015 年,他作為 ITMO 大學(xué)隊(duì)員之一,贏得了國際大學(xué)生程序設(shè)計(jì)競賽(ICPC)世界總決賽的冠軍,這是該賽事歷史上唯一一支在比賽結(jié)束前解決所有問題的隊(duì)伍。
在加入 OpenAI 后,Borys Minaiev 成為大型推理模型研究的核心成員之一,參與了多個(gè)關(guān)鍵項(xiàng)目,包括 o1、o3 和 o4-mini 等模型的開發(fā)。
此外,Borys Minaiev 還活躍于開源社區(qū),在 GitHub 上分享了多個(gè)項(xiàng)目,并在個(gè)人博客中深入探討了模擬退火算法、Rust 編程語言以及 AI 在教育中的應(yīng)用等主題。
Mostafa Rohaninejad
Mostafa Rohaninejad 是 OpenAI 的研究科學(xué)家,專注于元學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和人工智能系統(tǒng)的推理能力。
他于 2023 年加入 OpenAI,參與了多個(gè)關(guān)鍵項(xiàng)目,包括 GPT-5 和 OpenAI o1 等大規(guī)模推理模型的開發(fā)。
在加入 OpenAI 之前,Mostafa 曾在加州大學(xué)伯克利分校攻讀計(jì)算機(jī)科學(xué)碩士學(xué)位,并在該校的 BAIR 實(shí)驗(yàn)室與 Pieter Abbeel 教授合作,研究元學(xué)習(xí)和生成模型。他是著名的 SNAIL 架構(gòu)的共同作者,該架構(gòu)在少樣本學(xué)習(xí)任務(wù)中表現(xiàn)出色。
Mostafa 的研究興趣主要集中在如何使人工智能系統(tǒng)具備更強(qiáng)的推理能力和適應(yīng)性,特別是在復(fù)雜任務(wù)和動(dòng)態(tài)環(huán)境中的表現(xiàn)。他在 OpenAI 的工作不僅推動(dòng)了 AI 技術(shù)的發(fā)展,也為實(shí)現(xiàn)更智能、更人性化的 AI 系統(tǒng)奠定了基礎(chǔ)。
谷歌 Gemini 解決 10 個(gè)難題
達(dá)到金牌級(jí)別
Gemini 2.5 Deep Think 的高級(jí)版本在 ICPC 規(guī)則下,以遠(yuǎn)程在線環(huán)境參與競賽,并在比賽組織者的指導(dǎo)下進(jìn)行。
它比人類參賽者晚了 10 分鐘開始,但在五小時(shí)的時(shí)間限制內(nèi)正確解決了 12 個(gè)問題中的 10 個(gè),達(dá)到了金牌級(jí)表現(xiàn)。
Gemini 2025 ICPC 世界總決賽代碼:https://github.com/google-deepmind/gemini_icpc2025
Gemini 在僅 45 分鐘內(nèi)就解決了 8 個(gè)問題,接著在三小時(shí)內(nèi)又解決了兩個(gè)問題,使用了各種高級(jí)數(shù)據(jù)結(jié)構(gòu)和算法來生成解決方案。通過 677 分鐘的總時(shí)間解決了 10 個(gè)問題,若與大學(xué)隊(duì)伍的成績相比,Gemini 2.5 Deep Think 將排名第二。
圖片顯示了在 2025 年 ICPC 世界決賽中每個(gè)問題的解題時(shí)間。Gemini 的時(shí)間以藍(lán)色表示,最快的大學(xué)隊(duì)伍時(shí)間以灰色表示。
值得一提的是,Gemini 在半小時(shí)內(nèi)成功解決了 C 題,而這道題在競賽中沒有任何大學(xué)隊(duì)伍解出。
這道題目要求找到一種解決方案,通過一系列相互連接的管道將液體分配到多個(gè)水庫中,目標(biāo)是找到一種配置使液體盡快充滿所有水庫。由于每個(gè)管道可能是開放的、關(guān)閉的,甚至是部分開放的,因此存在無限多種可能的配置,這使得尋找最優(yōu)配置變得非常困難。
Gemini 找到了一種有效的解決方案:它首先假設(shè)每個(gè)水庫都有一個(gè)「優(yōu)先級(jí)值」,表示該水庫相對(duì)于其他水庫的偏好程度。在給定一組優(yōu)先級(jí)值后,可以通過動(dòng)態(tài)規(guī)劃算法找到最優(yōu)的管道配置。Gemini 發(fā)現(xiàn),通過應(yīng)用極小極大定理,可以將原問題轉(zhuǎn)化為尋找使得流量最受限制的優(yōu)先級(jí)值。利用優(yōu)先級(jí)值與最優(yōu)流量之間的關(guān)系,Gemini 通過嵌套三分查找迅速找到最優(yōu)的優(yōu)先級(jí)值,從而成功解決了 C 題。
據(jù)谷歌內(nèi)部研究表明,類似版本的 Gemini 2.5 Deep Think 也可以在 2023 年和 2024 年 ICPC 世界總決賽中取得金牌級(jí)別的表現(xiàn),與全球前 20 名的編程選手表現(xiàn)相當(dāng)。
此外,谷歌官方博客還感謝了一眾這個(gè)項(xiàng)目背后的貢獻(xiàn)者。其中 Hanzhao (Maggie) Lin 領(lǐng)導(dǎo)了 Gemini 競賽編程和 ICPC 2025 工作的整體技術(shù)方向,并與 Heng-Tze Cheng 共同領(lǐng)導(dǎo)了整體研究和執(zhí)行工作。
Hanzhao (Maggie) Lin
Hanzhao (Maggie) Lin 是 Google DeepMind 的高級(jí)研究科學(xué)家,專注于大規(guī)模語言模型和多模態(tài)系統(tǒng)的研究與開發(fā)。
她的研究方向主要涵蓋大規(guī)模語言模型、系統(tǒng)架構(gòu)以及其在教育和復(fù)雜推理中的應(yīng)用。她在 AI 領(lǐng)域的貢獻(xiàn)包括參與了 Google DeepMind 的 LaMDA 和 PaLM 2 等大型語言模型的后訓(xùn)練研究,并推動(dòng)了模型在多模態(tài)理解、推理和工具使用等方面的能力提升。
此外,她還主導(dǎo)了 Gemini Deep Think 模型在國際數(shù)學(xué)奧林匹克(IMO)競賽中的應(yīng)用,取得了金牌級(jí)別的表現(xiàn),展示了 AI 在復(fù)雜數(shù)學(xué)推理中的潛力。
Heng-Tze Cheng
Heng-Tze Cheng 是 Google DeepMind 的研究總監(jiān)兼首席研究科學(xué)家,專注于大語言模型和對(duì)話 AI 的研究與應(yīng)用。他在自然語言處理(NLP)、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)和多模態(tài)推理等領(lǐng)域具有深厚的研究背景。
他本科畢業(yè)于臺(tái)灣大學(xué)電機(jī)工程系,2013 年于卡內(nèi)基梅隆大學(xué)獲得電氣與計(jì)算機(jī)工程博士學(xué)位,研究方向包括機(jī)器學(xué)習(xí)和多模態(tài)信號(hào)處理,2014 年加入 Google,先后在 Google Brain 和 DeepMind 擔(dān)任技術(shù)領(lǐng)導(dǎo)職務(wù)。
ICPC 所要求的技能,比如理解復(fù)雜問題、制定多步驟的邏輯計(jì)劃并精準(zhǔn)執(zhí)行,正是許多科學(xué)和工程領(lǐng)域所需的核心能力。
AI 此次在 ICPC 中獲得金牌級(jí)成績凸顯了 AI 在提供創(chuàng)新性解決方案方面的獨(dú)特優(yōu)勢,能夠有效補(bǔ)充人類專家的技能和知識(shí)。這也表明,AI 正從單純的信息處理工具,轉(zhuǎn)變?yōu)閰f(xié)助解決復(fù)雜推理問題的關(guān)鍵力量。
https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/
https://x.com/HengTze/status/1968359525339246825
https://x.com/MostafaRohani/status/1968360976379703569
https://x.com/bminaiev/status/1968363052329484642
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.