近日,《麻省理工科技評論》與 OpenAI 的兩位研究主管陳信翰(Mark Chen)和雅各布·帕霍基(Jakub Pachocki)進(jìn)行了獨(dú)家對話,探討了如何構(gòu)建更強(qiáng)大推理模型的路徑,以及“超級對齊”的未來。該文章在發(fā)布之后還得到了 OpenAI 首席執(zhí)行官山姆·奧特曼(Sam Altman)在 X 上的轉(zhuǎn)發(fā)。
圖 | 從左到右:馬克·陳和雅各布·帕霍基(來源:OpenAI)
過去幾年,OpenAI 給人的印象仿佛是一家“一個人的公司”。首席執(zhí)行官山姆·奧特曼(Sam Altman)憑借明星般的風(fēng)格和在融資中的高調(diào)表現(xiàn),讓公司其他重要人物都顯得黯然失色。即便曾被“趕下臺”,最終也強(qiáng)勢回歸,比以往更具聲望。但如果撇開這位光鮮的掌舵者,就能更清楚地看見公司真正的方向。畢竟,OpenAI 聲名遠(yuǎn)播的技術(shù),并非出自奧特曼本人之手。
這一責(zé)任落在了 OpenAI 的兩位研究主管——首席研究官馬克·陳(Mark Chen)和首席科學(xué)家雅各布·帕霍基(Jakub Pachocki)肩上。他們共同負(fù)責(zé)確保 OpenAI 始終領(lǐng)先于谷歌等強(qiáng)勁對手。
最近,兩人前往英國倫敦——OpenAI 于 2023 年在此設(shè)立了首個海外辦公室。《麻省理工科技評論》在那次行程中對他們進(jìn)行了獨(dú)家專訪。我們聊到了如何平衡研究與產(chǎn)品之間的天然張力。他們還解釋了為什么認(rèn)為編程和數(shù)學(xué)是通用模型變得更強(qiáng)的關(guān)鍵;他們談?wù)摰?AGI 究竟意味著什么;以及由聯(lián)合創(chuàng)始人、前首席科學(xué)家伊利亞·蘇茨克弗(Ilya Sutskever)成立、旨在預(yù)防“超級智能失控”的超級對齊團(tuán)隊,在他離職后為何迅速解散。
我尤其想了解,在 OpenAI 即將發(fā)布數(shù)月來最重要產(chǎn)品 GPT-5 之際,他們對這項工作的關(guān)注點(diǎn)在哪里。
有報道稱,該公司的下一代模型將于 8 月發(fā)布。OpenAI(或者說奧特曼)給出的官方說法是:GPT-5 將會“很快”上線。人們對此期待已久。GPT-3 和 GPT-4 的接連突破,顯著抬高了公眾對 AI 技術(shù)潛力的認(rèn)知門檻。然而,GPT-5 的推遲也引發(fā)了各種猜測——有人認(rèn)為,OpenAI 正面臨難題,無法打造出連自己都滿意的模型,更別說滿足外界期待了。
奧特曼一改往日風(fēng)格,罕見地表現(xiàn)得頗為低調(diào)。他在 X 上發(fā)文稱:GPT-5 是一個實驗性質(zhì)的模型,融合了我們將在未來模型中采用的新研究方法?!甭犉饋磉@更像是一個進(jìn)行中的嘗試,而不是又一次顛覆式發(fā)布。
但對于一家近幾年一直引領(lǐng)行業(yè)走向的公司來說,管理好外界預(yù)期也是工作的一部分。而在 OpenAI 內(nèi)部,制定議程的人就是陳和帕霍基。
圖 | 奧特曼在 X 上轉(zhuǎn)發(fā)本次文章的英文版(來源:X)
雙峰
OpenAI 在倫敦的主辦公室位于圣詹姆斯公園,距離白金漢宮不遠(yuǎn)。但我是在國王十字附近的一間共享辦公室里見到陳和帕霍基的。這里是 OpenAI 在倫敦科技核心區(qū)的小型據(jù)點(diǎn),附近還有谷歌 DeepMind 和 Meta。OpenAI 的研究傳播主管勞倫斯·??祪?nèi)特(Laurance Fauconnet)坐在桌子盡頭,打開了筆記本電腦。
陳穿著酒紅色 POLO 衫,干凈利落,帶點(diǎn)精英預(yù)科生氣質(zhì)。他接受過媒體培訓(xùn),與記者交流毫不怯場。(他曾在 GPT-4o 發(fā)布視頻中與聊天機(jī)器人打情罵俏。)帕霍基穿著印有大象圖案的黑色 T 恤,氣質(zhì)更像電視劇里的黑客,說話時常盯著自己的手看。
不過兩人合作得比外表更緊密。
帕霍基說,陳主要負(fù)責(zé)組建和管理研究團(tuán)隊?!岸覄t負(fù)責(zé)制定研究路線圖,設(shè)定我們長期的技術(shù)愿景?!?/p>
“但我們的角色是可以互換的?!标愓f,“我們都是研究員,都會深入技術(shù)細(xì)節(jié)。只要發(fā)現(xiàn)有技術(shù)可解的問題,我們都會主動解決。”
陳于 2018 年加入 OpenAI,此前是華爾街 Jane Street 的量化交易員,在那里他開發(fā)了期貨交易的機(jī)器學(xué)習(xí)模型。在 OpenAI,他主導(dǎo)開發(fā)了生成式圖像模型 DALL-E,后又參與 GPT-4 圖像識別功能的實現(xiàn),并帶領(lǐng)團(tuán)隊打造了代碼生成模型 Codex(GitHub Copilot 的核心)。
帕霍基 2017 年從理論計算機(jī)科學(xué)研究領(lǐng)域轉(zhuǎn)向工業(yè)界,加入 OpenAI,并在 2024 年接替蘇茨克弗出任首席科學(xué)家。他是 OpenAI 推理模型(如 o1 和 o3)的主要架構(gòu)師,這些模型專為攻克數(shù)學(xué)、科學(xué)、編程等復(fù)雜任務(wù)而設(shè)計。
我們見面時,兩人正為 OpenAI 技術(shù)的連續(xù)勝利而興奮不已。
7 月 16 日,OpenAI 的大語言模型在 AtCoder 世界總決賽中奪得第二名,這是世界最難的編程競賽之一。7 月 19 日,OpenAI 又宣布其模型在 2025 年國際數(shù)學(xué)奧林匹克競賽(IMO)中取得金牌水平成績。
這一數(shù)學(xué)結(jié)果之所以登上頭條新聞,不僅是因為 OpenAI 取得了非凡成就,還因為兩天后其競爭對手谷歌 DeepMind 透露,其一款模型取得了相同的成績。谷歌 DeepMind 遵守了比賽規(guī)則,在等待主辦方核實結(jié)果后才宣布了這一消息;而 OpenAI 則是自行評分。
對于陳和帕霍基來說,結(jié)果本身就說明了一切。無論如何,他們最興奮的是編程競賽的勝利?!拔艺J(rèn)為這被低估了?!标惛嬖V我。他說,在國際數(shù)學(xué)奧林匹克競賽中獲得金牌意味著你躋身前 20 至 50 名參賽者之列。但在 AtCoder 競賽中,OpenAI 的模型排在前兩名:“真正躋身人類表現(xiàn)的全新層級——這是前所未有的?!?/p>
一切以發(fā)布為核心!
OpenAI 員工仍然喜歡稱自己是在研究實驗室工作,但自三年前 ChatGPT 發(fā)布以來,這家公司早已不可同日而語。它如今估值達(dá) 3000 億美元,正與全球最強(qiáng)的科技巨頭競爭。光有突破性的研究和炫技演示已經(jīng)遠(yuǎn)遠(yuǎn)不夠——它必須推出產(chǎn)品,并讓產(chǎn)品真正落地——而它確實做到了。
OpenAI 持續(xù)推出新產(chǎn)品——對其 GPT-4 系列進(jìn)行了重大更新,發(fā)布了一系列生成式圖像和視頻模型,并引入了用語音與 ChatGPT 對話的功能。六個月前,它推出了名為 o1 的新一代推理模型,隨后又推出了 o3。它還推出了瀏覽器智能體 Operator。目前,其產(chǎn)品每周活躍用戶超 4 億,每天收到 25 億條指令。
OpenAI 即將上任的應(yīng)用程序首席執(zhí)行官菲吉·西莫(Fidji Simo)希望保持這一勢頭。在給公司的一份備忘錄中,她告訴員工,她期待“幫助 OpenAI 的技術(shù)被全球更多人掌握”,這些技術(shù)將“為更多人帶來前所未有的機(jī)會”。預(yù)計產(chǎn)品會源源不斷地推出。
我問 OpenAI 是如何平衡開放式研究和產(chǎn)品開發(fā)的。“這是我們在 ChatGPT 出現(xiàn)之前就一直思考的問題。”帕霍基說?!叭粑覀冋J(rèn)真對待通用人工智能目標(biāo),那在這個過程中,很多研究支線其實本身就會變成偉大的產(chǎn)品。”換言之,就是不斷搖動樹干,總會掉下果子。
OpenAI 員工經(jīng)常提到的一個觀點(diǎn)是,將實驗性模型推向市場,本身就是研究的一部分。其目的是讓人們意識到這項技術(shù)已經(jīng)變得多么出色?!拔覀兿敫嬖V人們即將發(fā)生什么,這樣我們才能參與到一場非常艱難的社會對話中?!眾W特曼(Altman)在 2022 年告訴我。這項奇怪新技術(shù)的創(chuàng)造者也很好奇它可能用于什么:OpenAI 熱衷于將其交到人們手中,看看他們會用它來做什么。
現(xiàn)在還是這樣嗎?他們幾乎同時回答:“是的!”陳說?!霸谀撤N程度上吧。”帕霍基說。
陳笑著示意帕霍基繼續(xù)。帕霍基說:“我不會說研究就是產(chǎn)品迭代。但如今模型在傳統(tǒng)基準(zhǔn)測試上已接近上限,我們長期以來關(guān)注的問題也開始出現(xiàn)突破。我們現(xiàn)在真正想看的是,這些模型在現(xiàn)實世界中能做些什么?!?/p>
就像在編程競賽中與人類一較高下一樣。在今年于日本舉行的 AtCoder 競賽中,擊敗 OpenAI 模型的是一位名叫 Przemys?aw D?biak 的程序員,他也被人們稱為 Psyho。這場競賽是一場解謎馬拉松,參賽者有 10 個小時的時間來尋找解決復(fù)雜編程問題的最有效方法。獲勝后,Psyho 在 X 上發(fā)帖稱:“我完全筋疲力盡了……我快崩潰了?!?/p>
陳和帕霍基與競技編程界有著密切的聯(lián)系。兩人都曾參加過國際編程競賽,陳還執(zhí)教美國計算機(jī)奧林匹克競賽隊。我問他們,他們對編程比賽的熱情是否讓他們過于看重模型在這類挑戰(zhàn)中的表現(xiàn)。
他們都笑了?!按_實如此?!迸粱艋f,“Psyho 算是個傳奇人物,多年來一直是頭號選手。他也是我朋友——我們以前常一起參賽。”他還曾在 OpenAI 工作過。
當(dāng)帕霍基參加編程競賽時,他更青睞那些專注于較短且具有具體解決方案的問題。但 Psyho 則喜歡那些更長、沒有明確正確答案的開放式問題。
“他過去總是取笑我,說我喜歡的那種比賽在他喜歡的那些比賽之前很久就會被自動化?!迸粱艋貞浀?,“所以我在這次最新的比賽中對這個模型的表現(xiàn)寄予了厚望?!?/p>
帕霍基告訴我,他一直守在東京的深夜直播中,看著他的模型獲得第二名:“Psyho 目前還在抵抗?!?/p>
“我們追蹤大模型在編程競賽中的表現(xiàn)已經(jīng)有一段時間了?!标愓f道,“我們見證了它們的表現(xiàn)超越了我,超越了帕霍基。這就像李世石和 AlphaGo 的故事?!?/p>
李世石是圍棋大師,2016 年,他在一系列比賽中輸給了 DeepMind 的游戲模型 AlphaGo。這一結(jié)果震驚了國際圍棋界,并導(dǎo)致李世石放棄了職業(yè)比賽。去年,他告訴《紐約時報》:“從某種意義上說,輸給人工智能意味著我的整個世界正在崩潰……我再也無法享受比賽了?!比欢?,與李世石不同,陳和帕霍基對被超越感到興奮。
但我們普通人為什么要關(guān)心這些小眾領(lǐng)域的勝利呢?很明顯,這項旨在模仿并最終取代人類智能的技術(shù),是由那些認(rèn)為頂尖智能就是數(shù)學(xué)競賽中的高分或能與傳奇程序員一較高下的人所開發(fā)的。這種偏重數(shù)學(xué)和分析能力的智能觀是否過于狹隘?
“你說得沒錯——我們確實有點(diǎn)私心地想造出能提升我們效率的模型?!标愓f?!拔覀冋J(rèn)為這是取得進(jìn)步的一個非常迅速的因素?!?/p>
像陳和帕霍基這樣的研究人員提出的論點(diǎn)是,數(shù)學(xué)和編程是更為普遍的智能形式的基石,這種智能能夠以我們自己可能都沒有想到的方式解決各種各樣的問題?!拔覀冊谶@里談?wù)摰氖蔷幊毯蛿?shù)學(xué)?!迸粱艋f,“但它實際上是關(guān)于創(chuàng)造力,關(guān)于提出新穎的想法,關(guān)于將來自不同領(lǐng)域的想法聯(lián)系起來?!?/p>
看看最近的兩場比賽:“在這兩場比賽中,都出現(xiàn)了需要非常艱難、打破常規(guī)思維的問題。Psyho 在編程比賽的一半時間里都在思考,然后想出了一個非常新穎且與我們模型所見的任何解決方案都截然不同的解決方案?!?/p>
“這確實是我們所追求的?!迸粱艋^續(xù)說道,“我們?nèi)绾巫屇P桶l(fā)現(xiàn)這種新穎的見解?如何真正增進(jìn)我們的知識?我認(rèn)為它們已經(jīng)在某些有限方面具備了這種能力。但我認(rèn)為這項技術(shù)有潛力真正加速科學(xué)進(jìn)步?!?/p>
我回到了關(guān)于對數(shù)學(xué)和編程的關(guān)注是否成問題的問題上,承認(rèn)如果我們正在構(gòu)建的是幫助我們進(jìn)行科學(xué)的工具,那么這或許也沒什么問題。我提出,我們并不一定希望大型語言模型取代政治家,也不希望它們具備人際交往能力。
陳做了個鬼臉,抬頭望向天花板:“有何不可?”
還缺什么?
OpenAI 的誕生帶有一種即便以硅谷標(biāo)準(zhǔn)也算傲慢的雄心。在 AGI 還被視為異想天開的年代,它就大張旗鼓地宣布要實現(xiàn) AGI。如今,OpenAI 對 AGI 的執(zhí)著依舊,并且比多數(shù)公司都更努力地將 AGI 推進(jìn)為主流、甚至千億美元級的技術(shù)方向。但它仍未抵達(dá)終點(diǎn)。我問陳和帕霍基,他們認(rèn)為通向 AGI 還缺了什么。
“我覺得,想象未來最好的方式,是深入研究我們今天已經(jīng)看到的技術(shù)。”帕霍基說。“OpenAI 從一開始就把深度學(xué)習(xí)看作神秘但極具潛力的強(qiáng)大工具。我們一直在試圖理解它的瓶頸:它能做什么?不能做什么?”
陳說,目前最前沿的是推理模型,它們能把大問題拆解成更小、可管理的步驟。但即便如此,模型仍有局限性:“你會發(fā)現(xiàn),有些模型知道很多知識,但無法把這些知識串聯(lián)起來。為什么會這樣?它們?yōu)槭裁床荒芟袢祟惸菢油评恚俊?/p>
OpenAI 正全力以赴想弄清楚這個問題。
“我們可能還處于這種推理范式的初級階段?!迸粱艋嬖V我,“實際上,我們正在思考如何讓這些模型長期學(xué)習(xí)和探索,并真正產(chǎn)生全新的想法?!?/p>
陳進(jìn)一步強(qiáng)調(diào):“我不認(rèn)為我們已經(jīng)攻克了推理??隙ㄟ€沒做到。你得讓模型讀足夠多的文本,才能大致模擬出人類的知識水平。”
OpenAI 不愿透露其用來訓(xùn)練模型的數(shù)據(jù),也不愿詳細(xì)說明這些數(shù)據(jù)的規(guī)模和結(jié)構(gòu)——只是表示他們正在努力提高開發(fā)流程各階段的效率。
這些努力讓他們相信,所謂的“擴(kuò)展定律”(即模型會隨著計算能力的提升而不斷優(yōu)化)并未顯示出失效的跡象。
“我沒看到任何跡象表明擴(kuò)展定律失效了?!标悎苑Q?!捌款i當(dāng)然存在。有時是模型架構(gòu)問題,有時是數(shù)據(jù)問題。但歸根結(jié)底,就是找到能突破當(dāng)前瓶頸的研究路徑?!?/p>
對進(jìn)步的信念是堅定不移的。我提到了帕霍基在 5 月份接受《自然》雜志采訪時談到的關(guān)于 AGI 的事情:“2017 年我加入 OpenAI 時,我仍是公司里最大的懷疑論者之一。”他聽完后顯得有些遲疑。
“我不確定自己是否曾對這個概念持懷疑態(tài)度?!彼f,“但我想我確實懷疑過——”他頓了頓,看著自己放在面前桌子上的雙手?!爱?dāng)我加入 OpenAI 時,我原以為,要達(dá)到我們現(xiàn)在的階段,至少還得花更長時間?!?/p>
“AI 的影響有很多,”他說,“但我最關(guān)注的是自動化研究。當(dāng)我們回顧人類歷史,會發(fā)現(xiàn)其中很多都與科技進(jìn)步、人類創(chuàng)造新技術(shù)有關(guān)。計算機(jī)能夠自行開發(fā)新技術(shù),這一時刻似乎是一個非常重要的轉(zhuǎn)折點(diǎn)?!?/p>
“我們已經(jīng)看到這些模型在輔助科學(xué)家工作。但當(dāng)它們能夠著眼于更長遠(yuǎn)的未來——當(dāng)它們能夠為自己建立研究項目時——世界將會發(fā)生有意義的改變?!?/p>
對于陳而言,模型能夠自主工作更長時間的能力是關(guān)鍵?!拔业囊馑际?,我確實認(rèn)為每個人對 AGI 都有自己的定義?!彼f。“但‘自主時間’這個概念很重要——即模型可以在不陷入死胡同的前提下,持續(xù)解決一個困難問題的時間。這就是我們努力的方向之一?!?/p>
這是一個大膽的愿景——遠(yuǎn)遠(yuǎn)超出了當(dāng)今模型的能力范圍。但陳和帕霍基讓 AGI 聽起來幾乎平淡無奇,這還是讓我感到震驚。這與我 18 個月前與蘇茨克維爾交談時他的回應(yīng)形成了鮮明對比?!斑@將具有里程碑意義,驚天動地?!八嬖V我。它會把歷史劃分為‘之前’和‘之后’?!彼麑?AGI 的信念如此深刻,以至于放棄繼續(xù)研發(fā)最強(qiáng)模型,轉(zhuǎn)而投身研究“如何控制這項可能比他更聰明的技術(shù)”。
兩年前,蘇茨克維爾組建了一支他稱之為“超級對齊”的團(tuán)隊,他將與另一位 OpenAI 安全研究員簡·萊克(Jan Leike)共同領(lǐng)導(dǎo)該團(tuán)隊。據(jù)稱,該團(tuán)隊將把 OpenAI 五分之一的資源投入到研究如何控制一種假設(shè)的超級智能中。如今,包括蘇茨克維爾和萊克在內(nèi)的超級對齊團(tuán)隊的大多數(shù)成員已經(jīng)離開公司,該團(tuán)隊也不復(fù)存在。
萊克辭職時表示,這是因為團(tuán)隊沒有得到他認(rèn)為應(yīng)得的支持。他在 X 上發(fā)帖稱:“打造比人類更智能的機(jī)器是一項本質(zhì)上危險的任務(wù)。OpenAI 肩負(fù)著全人類的巨大責(zé)任。但在過去幾年里,安全文化和流程讓位于光鮮亮麗的產(chǎn)品?!逼渌x職的研究人員也發(fā)表了類似聲明。
我問陳和帕霍基他們對這些擔(dān)憂有何看法?!昂芏嗍虑槎际歉叨葌€人化的決定?!标愓f?!澳阒溃芯咳藛T有時會……”
他停頓了一下,重新組織語言:“他們可能堅信這個領(lǐng)域會以某種方式發(fā)展,他們的研究會取得成功并結(jié)出果實。而且,你知道,也許公司并沒有按照你想要的方式重塑。這是個高度動態(tài)的領(lǐng)域?!?/p>
“很多事情都是個人決定。”他重復(fù)道,“有時候,這個領(lǐng)域的發(fā)展與你做研究的方式并不那么一致。”
但兩人都堅稱,對齊工作如今已成為核心業(yè)務(wù)的一部分,而不再是一個特定團(tuán)隊所關(guān)注的問題。帕霍基表示,除非這些模型能如你所愿地工作,否則它們根本不起作用。而讓現(xiàn)有模型行為符合預(yù)期,已經(jīng)夠難了——沒人還有精力去思考假想中的超級智能該如何對齊。
“兩年前,我們想象中的風(fēng)險大多為理論風(fēng)險?!迸粱艋f,“但現(xiàn)在世界已經(jīng)不同,很多對齊問題已變得非常實際、具體?!?/p>
盡管如此,實驗技術(shù)正以前所未有的速度被轉(zhuǎn)化為大眾市場產(chǎn)品。這真的不會導(dǎo)致兩者之間產(chǎn)生分歧嗎?
“我常常有幸能真正從長遠(yuǎn)角度思考技術(shù)未來的發(fā)展方向?!迸粱艋f,“而應(yīng)對流程中的現(xiàn)實問題——無論是人員方面,還是更廣泛的公司需求方面——則落在馬克身上。這并非真正的分歧,但這些不同的目標(biāo)與公司所面臨的不同挑戰(zhàn)之間,自然而然會產(chǎn)生緊張關(guān)系,而這種關(guān)系在我們之間也體現(xiàn)了出來?!?/p>
陳插話說:“我認(rèn)為這是一種非常微妙的平衡?!?/p>
附 Mark Chen 和雅各布·帕霍基(Jakub Pachocki)的個人介紹:
Mark Chen(陳信翰)是 OpenAI 的核心技術(shù)領(lǐng)導(dǎo)者之一,現(xiàn)任首席研究官(Chief Research Officer),負(fù)責(zé)統(tǒng)籌 OpenAI 的前沿 AI 研究,并推動科研成果向產(chǎn)品轉(zhuǎn)化。他出生于中國臺灣,成長于美國,高中時期隨家人返臺,曾就讀于新竹實驗中學(xué)雙語部,并在麻省理工學(xué)院獲得數(shù)學(xué)與計算機(jī)科學(xué)雙學(xué)位。Mark Chen 在 OpenAI 的貢獻(xiàn)極為突出,曾主導(dǎo)開發(fā)了多個關(guān)鍵 AI 模型,包括:DALL·E 系列:OpenAI 的突破性圖像生成模型。Codex:為 GitHub Copilot 提供支持的 AI 編程系統(tǒng)。GPT-4 視覺功能:為 GPT-4 引入圖像識別能力。GPT-5 研發(fā):目前正與首席科學(xué)家 Jakub Pachocki 共同領(lǐng)導(dǎo) OpenAI 下一代大模型的開發(fā)。2024 年,他升任研究高級副總裁(SVP of Research),并在 OpenAI 高層重組后進(jìn)一步晉升為首席研究官。他以其深厚的技術(shù)背景和領(lǐng)導(dǎo)力,推動 OpenAI 在 AI 競賽(如國際數(shù)學(xué)奧林匹克、AtCoder 編程比賽)中取得突破性成績。此外,他曾在清華大學(xué)發(fā)表演講,分享 ChatGPT 的研發(fā)歷程,展現(xiàn)其技術(shù)影響力。Mark Chen 不僅是 OpenAI 的技術(shù)骨干,也是 AI 安全與推理能力發(fā)展的關(guān)鍵推動者,強(qiáng)調(diào) AI 的穩(wěn)健性和社會價值。
Jakub Pachocki是 OpenAI 的首席科學(xué)家,自 2017 年加入公司以來,一直是推動 AI 前沿技術(shù)發(fā)展的核心人物。他于 2024 年接替 Ilya Sutskever 成為 OpenAI 的首席科學(xué)家,領(lǐng)導(dǎo)了多個關(guān)鍵 AI 模型的研發(fā),包括 GPT-4、OpenAI Five(Dota 2 AI 玩家)以及 o 系列推理模型(如 o1、o3)。Pachocki 在 AI 領(lǐng)域的貢獻(xiàn)不僅限于語言模型,他還專注于 強(qiáng)化學(xué)習(xí)(RL)和 世界模型(World Model)的研究,認(rèn)為 AI 未來將能自主發(fā)現(xiàn)科學(xué)知識,而不僅僅是輔助工具。他強(qiáng)調(diào),AI 推理能力的提升依賴于預(yù)訓(xùn)練與強(qiáng)化學(xué)習(xí)的結(jié)合,使模型能夠“自主思考”而非僅依賴人類引導(dǎo)。在 AGI 的探索上,Pachocki 認(rèn)為 AI 的經(jīng)濟(jì)價值將是關(guān)鍵里程碑,預(yù)計未來五年 AI 將能自主進(jìn)行科學(xué)研究,甚至今年就可能實現(xiàn)近乎自主的軟件開發(fā)。此外,他還帶領(lǐng) OpenAI 的 AI 系統(tǒng)在國際數(shù)學(xué)奧林匹克競賽(IMO)和 AtCoder 編程比賽中取得頂尖成績,證明 AI 已具備高級推理能力。Pachocki 低調(diào)務(wù)實,曾是谷歌 Code Jam 冠軍和 ACM ICPC 金牌得主,擁有深厚的計算機(jī)科學(xué)背景。他的研究正在推動 AI 從工具向自主科研伙伴的轉(zhuǎn)變。
參考資料:
https://www.technologyreview.com/2025/07/31/1120885/the-two-people-shaping-the-future-of-openais-research/
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.