網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛,OpenAI在ICPC 2025編程賽上滿分登頂,Gemini也達(dá)到金牌水平

2025-09-18 14:12:04　來源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心報(bào)道

編輯：楊文、+0

IMO 之后，OpenAI 與 Gemini 雙雙加冕 ICPC 2025 金牌。

就在剛剛，OpenAI 和 Gemini 都聲稱達(dá)到了 ICPC 金牌水平。

其中，OpenAI 在 5 個(gè)小時(shí)內(nèi)解決了所有 12 個(gè)問題，相當(dāng)于人類排名第 1 位，超過了所有參賽大學(xué)團(tuán)隊(duì)。

而 Gemini 解決了 12 個(gè)問題中的 10 個(gè)，總用時(shí) 677 分鐘，達(dá)到了金牌水平，如果與人類團(tuán)隊(duì)比較，將排名第 2。

人類團(tuán)隊(duì)方面，俄羅斯圣彼得堡國立大學(xué)的參賽隊(duì)伍排名第 1，解決了 11 個(gè)問題。北京交通大學(xué)、清華大學(xué)、北京大學(xué)、中國科學(xué)技術(shù)大學(xué)的參賽隊(duì)伍分別排名 2、4、5、9。

ICPC，即國際大學(xué)生程序設(shè)計(jì)競賽，是全球公認(rèn)的歷史最悠久、規(guī)模最大、最負(fù)盛名的大學(xué)級(jí)算法編程競賽，它比 IMO 等高中奧林匹克競賽更高一級(jí)。每年，來自近 3000 所大學(xué)和 103 個(gè)國家的參賽者齊聚一堂，挑戰(zhàn)現(xiàn)實(shí)世界的編程難題。

今年的 ICPC 世界決賽于 9 月 4 日在阿塞拜疆的巴庫舉行，匯集了來自競賽早期階段的頂級(jí)隊(duì)伍。在五小時(shí)的比賽中，每支隊(duì)伍解決了一組復(fù)雜的算法問題。最終排名嚴(yán)格依據(jù)兩個(gè)原則：只有完美的解決方案才能得分，每一分鐘都至關(guān)重要。在 139 支參賽隊(duì)伍中，只有前四支隊(duì)伍獲得了金牌。

下面是 ICPC 的原題，感興趣的讀者可以親自嘗試一下。

https://worldfinals.icpc.global/problems/2025/finals/index.html

OpenAI 5 小時(shí)內(nèi)解決 12 個(gè)問題

超過人類團(tuán)隊(duì)

OpenAI 的與人類頂尖選手在完全同等的條件下競技：面對(duì)完全相同的賽題，擁有相同的 5 小時(shí)時(shí)限，并由與 ICPC 全球總決賽標(biāo)準(zhǔn)一致的本地系統(tǒng)進(jìn)行實(shí)時(shí)評(píng)判。

整個(gè)過程中，AI 系統(tǒng)在沒有任何定制化測試工具的輔助下，獨(dú)立分析問題并自主決定提交最終答案。

比賽結(jié)果令人矚目：在全部 12 個(gè)問題中，該 AI 系統(tǒng)對(duì)其中 11 個(gè)問題的首次提交便獲得了正確答案。即便是全場難度最高、困住所有人類隊(duì)伍的最后一個(gè)問題，AI 也在經(jīng)過 9 次嘗試后成功攻克。相比之下，本次競賽表現(xiàn)最出色的人類團(tuán)隊(duì)成功解決了 11 個(gè)問題。

其中問題 G，OpenAI 嘗試 9 次后成功解決，該問題也是 DeepMind 未能解決的兩道難題之一。作為參考，解題速度最快的人類選手也耗時(shí) 270 分鐘（競賽總時(shí)長 300 分鐘）。

OpenAI 方面透露，此次參賽的 AI 由一個(gè)「通用推理模型集成體」構(gòu)成，并未針對(duì) ICPC 競賽進(jìn)行任何專門的優(yōu)化或訓(xùn)練。

在解題過程中，系統(tǒng)結(jié)合了其下一代模型 GPT-5 與一個(gè)前沿的實(shí)驗(yàn)性推理模型。其中，GPT-5 精準(zhǔn)地解答了 11 題，而那款實(shí)驗(yàn)性模型則最終完成了對(duì)最難題目的關(guān)鍵一擊。

這一成果是 OpenAI 一系列展示推理系統(tǒng)驚人進(jìn)步速度的絕佳里程碑。同一組模型已在國際數(shù)學(xué)奧林匹克（IMO）和國際信息學(xué)奧林匹克（IOI）等競賽中證明了其實(shí)力，充分印證了其強(qiáng)大的通用性與廣泛的適用潛力。

OpenAI 員工 Borys Minaiev 和 Mostafa Rohaninejad 也在 X 上發(fā)文慶賀。

Borys Minaiev

Borys Minaiev 是 OpenAI 的研究員，專注于大規(guī)模推理模型的開發(fā)與應(yīng)用，尤其在編程競賽和復(fù)雜推理任務(wù)中展現(xiàn)了卓越能力。

他畢業(yè)于圣彼得堡國立信息技術(shù)、機(jī)械與光學(xué)大學(xué)（ITMO University），并在編程競賽領(lǐng)域取得了顯著成就。2015 年，他作為 ITMO 大學(xué)隊(duì)員之一，贏得了國際大學(xué)生程序設(shè)計(jì)競賽（ICPC）世界總決賽的冠軍，這是該賽事歷史上唯一一支在比賽結(jié)束前解決所有問題的隊(duì)伍。

在加入 OpenAI 后，Borys Minaiev 成為大型推理模型研究的核心成員之一，參與了多個(gè)關(guān)鍵項(xiàng)目，包括 o1、o3 和 o4-mini 等模型的開發(fā)。

此外，Borys Minaiev 還活躍于開源社區(qū)，在 GitHub 上分享了多個(gè)項(xiàng)目，并在個(gè)人博客中深入探討了模擬退火算法、Rust 編程語言以及 AI 在教育中的應(yīng)用等主題。

Mostafa Rohaninejad

Mostafa Rohaninejad 是 OpenAI 的研究科學(xué)家，專注于元學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和人工智能系統(tǒng)的推理能力。

他于 2023 年加入 OpenAI，參與了多個(gè)關(guān)鍵項(xiàng)目，包括 GPT-5 和 OpenAI o1 等大規(guī)模推理模型的開發(fā)。

在加入 OpenAI 之前，Mostafa 曾在加州大學(xué)伯克利分校攻讀計(jì)算機(jī)科學(xué)碩士學(xué)位，并在該校的 BAIR 實(shí)驗(yàn)室與 Pieter Abbeel 教授合作，研究元學(xué)習(xí)和生成模型。他是著名的 SNAIL 架構(gòu)的共同作者，該架構(gòu)在少樣本學(xué)習(xí)任務(wù)中表現(xiàn)出色。

Mostafa 的研究興趣主要集中在如何使人工智能系統(tǒng)具備更強(qiáng)的推理能力和適應(yīng)性，特別是在復(fù)雜任務(wù)和動(dòng)態(tài)環(huán)境中的表現(xiàn)。他在 OpenAI 的工作不僅推動(dòng)了 AI 技術(shù)的發(fā)展，也為實(shí)現(xiàn)更智能、更人性化的 AI 系統(tǒng)奠定了基礎(chǔ)。

谷歌 Gemini 解決 10 個(gè)難題

達(dá)到金牌級(jí)別

Gemini 2.5 Deep Think 的高級(jí)版本在 ICPC 規(guī)則下，以遠(yuǎn)程在線環(huán)境參與競賽，并在比賽組織者的指導(dǎo)下進(jìn)行。

它比人類參賽者晚了 10 分鐘開始，但在五小時(shí)的時(shí)間限制內(nèi)正確解決了 12 個(gè)問題中的 10 個(gè)，達(dá)到了金牌級(jí)表現(xiàn)。

Gemini 2025 ICPC 世界總決賽代碼：https://github.com/google-deepmind/gemini_icpc2025

Gemini 在僅 45 分鐘內(nèi)就解決了 8 個(gè)問題，接著在三小時(shí)內(nèi)又解決了兩個(gè)問題，使用了各種高級(jí)數(shù)據(jù)結(jié)構(gòu)和算法來生成解決方案。通過 677 分鐘的總時(shí)間解決了 10 個(gè)問題，若與大學(xué)隊(duì)伍的成績相比，Gemini 2.5 Deep Think 將排名第二。

圖片顯示了在 2025 年 ICPC 世界決賽中每個(gè)問題的解題時(shí)間。Gemini 的時(shí)間以藍(lán)色表示，最快的大學(xué)隊(duì)伍時(shí)間以灰色表示。

值得一提的是，Gemini 在半小時(shí)內(nèi)成功解決了 C 題，而這道題在競賽中沒有任何大學(xué)隊(duì)伍解出。

這道題目要求找到一種解決方案，通過一系列相互連接的管道將液體分配到多個(gè)水庫中，目標(biāo)是找到一種配置使液體盡快充滿所有水庫。由于每個(gè)管道可能是開放的、關(guān)閉的，甚至是部分開放的，因此存在無限多種可能的配置，這使得尋找最優(yōu)配置變得非常困難。

Gemini 找到了一種有效的解決方案：它首先假設(shè)每個(gè)水庫都有一個(gè)「優(yōu)先級(jí)值」，表示該水庫相對(duì)于其他水庫的偏好程度。在給定一組優(yōu)先級(jí)值后，可以通過動(dòng)態(tài)規(guī)劃算法找到最優(yōu)的管道配置。Gemini 發(fā)現(xiàn)，通過應(yīng)用極小極大定理，可以將原問題轉(zhuǎn)化為尋找使得流量最受限制的優(yōu)先級(jí)值。利用優(yōu)先級(jí)值與最優(yōu)流量之間的關(guān)系，Gemini 通過嵌套三分查找迅速找到最優(yōu)的優(yōu)先級(jí)值，從而成功解決了 C 題。

據(jù)谷歌內(nèi)部研究表明，類似版本的 Gemini 2.5 Deep Think 也可以在 2023 年和 2024 年 ICPC 世界總決賽中取得金牌級(jí)別的表現(xiàn)，與全球前 20 名的編程選手表現(xiàn)相當(dāng)。

此外，谷歌官方博客還感謝了一眾這個(gè)項(xiàng)目背后的貢獻(xiàn)者。其中 Hanzhao (Maggie) Lin 領(lǐng)導(dǎo)了 Gemini 競賽編程和 ICPC 2025 工作的整體技術(shù)方向，并與 Heng-Tze Cheng 共同領(lǐng)導(dǎo)了整體研究和執(zhí)行工作。

Hanzhao (Maggie) Lin

Hanzhao (Maggie) Lin 是 Google DeepMind 的高級(jí)研究科學(xué)家，專注于大規(guī)模語言模型和多模態(tài)系統(tǒng)的研究與開發(fā)。

她的研究方向主要涵蓋大規(guī)模語言模型、系統(tǒng)架構(gòu)以及其在教育和復(fù)雜推理中的應(yīng)用。她在 AI 領(lǐng)域的貢獻(xiàn)包括參與了 Google DeepMind 的 LaMDA 和 PaLM 2 等大型語言模型的后訓(xùn)練研究，并推動(dòng)了模型在多模態(tài)理解、推理和工具使用等方面的能力提升。

此外，她還主導(dǎo)了 Gemini Deep Think 模型在國際數(shù)學(xué)奧林匹克（IMO）競賽中的應(yīng)用，取得了金牌級(jí)別的表現(xiàn)，展示了 AI 在復(fù)雜數(shù)學(xué)推理中的潛力。

Heng-Tze Cheng

Heng-Tze Cheng 是 Google DeepMind 的研究總監(jiān)兼首席研究科學(xué)家，專注于大語言模型和對(duì)話 AI 的研究與應(yīng)用。他在自然語言處理（NLP）、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)和多模態(tài)推理等領(lǐng)域具有深厚的研究背景。

他本科畢業(yè)于臺(tái)灣大學(xué)電機(jī)工程系，2013 年于卡內(nèi)基梅隆大學(xué)獲得電氣與計(jì)算機(jī)工程博士學(xué)位，研究方向包括機(jī)器學(xué)習(xí)和多模態(tài)信號(hào)處理，2014 年加入 Google，先后在 Google Brain 和 DeepMind 擔(dān)任技術(shù)領(lǐng)導(dǎo)職務(wù)。

ICPC 所要求的技能，比如理解復(fù)雜問題、制定多步驟的邏輯計(jì)劃并精準(zhǔn)執(zhí)行，正是許多科學(xué)和工程領(lǐng)域所需的核心能力。

AI 此次在 ICPC 中獲得金牌級(jí)成績凸顯了 AI 在提供創(chuàng)新性解決方案方面的獨(dú)特優(yōu)勢，能夠有效補(bǔ)充人類專家的技能和知識(shí)。這也表明，AI 正從單純的信息處理工具，轉(zhuǎn)變?yōu)閰f(xié)助解決復(fù)雜推理問題的關(guān)鍵力量。

https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

https://x.com/HengTze/status/1968359525339246825

https://x.com/MostafaRohani/status/1968360976379703569

https://x.com/bminaiev/status/1968363052329484642

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.