網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

GPT-5破解世紀(jì)難題，竟是上網(wǎng)抄來(lái)的！哈薩比斯：太尷尬了

2025-10-19 13:36:31　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子

【新智元導(dǎo)讀】GPT-5一場(chǎng)鬧劇，讓OpenAI出大糗了！讓所有人都以為GPT-5破解了十道Erdos難題，沒(méi)想到竟是查文獻(xiàn)給出了答案。Hassabis點(diǎn)評(píng)，這太尷尬了。

OpenAI團(tuán)隊(duì)狂吹了一波GPT-5，結(jié)果竟是鬧劇一場(chǎng)......

事情是這樣的。

幾天前，OpenAI科學(xué)家Sebastien Bubeck激動(dòng)轉(zhuǎn)發(fā)，兩位研究員聯(lián)手GPT-5 Pro，僅用了一個(gè)周末，破解了10個(gè)「百年懸案」——

埃爾德什難題（Erdos problems）

緊接著，OpenAI科學(xué)副總裁Kevin Weil等人紛紛加入，大肆宣傳。

然而，真相很快浮出水面：

這十道難題，早就被學(xué)界解決，并非由GPT-5獨(dú)立解決，它只是通過(guò)檢索網(wǎng)絡(luò)文獻(xiàn)給出了答案。

消息一出，輿論嘩然。就連谷歌DeepMind CEO Demis Hassabis也忍不住評(píng)價(jià)，「這也太尬了」。

還有，圖靈獎(jiǎng)得主LeCun閃現(xiàn)X上嘲諷，「簡(jiǎn)直就是，搬起石頭（GPT）砸自己的腳」。

GPT-5，一場(chǎng)鬧劇

這場(chǎng)鬧劇，可以說(shuō)OpenAI團(tuán)隊(duì)的自導(dǎo)自演。

研究人員Mark Sellke和Mehtaab Sawhney發(fā)文很明確，并沒(méi)有說(shuō)GPT-5破解了難題。

他們?cè)?，通過(guò)GPT-5數(shù)千條查詢(xún)后，找到了十個(gè)被列為Erdos問(wèn)題的解。

當(dāng)時(shí)的結(jié)果是，問(wèn)題223、339、494、515、621、822、883、903、1043、1079都得到了解決，同時(shí)在另外 11 個(gè)問(wèn)題上也取得了部分進(jìn)展。

另一方面，這十道難題早已有了答案，只不過(guò)網(wǎng)站管理者并未更新。

傳送門(mén)：https://www.erdosproblems.com/

英國(guó)皇家學(xué)會(huì)研究院Thomas Bloom，網(wǎng)站erdosproblems.com運(yùn)營(yíng)者，卻對(duì)此并不知情。

網(wǎng)站上，「開(kāi)放」?fàn)顟B(tài)僅代表他個(gè)人并不了解該問(wèn)題的解法，而不是表示該問(wèn)題在科學(xué)界尚未被解決。

總言之，兩個(gè)誤會(huì)，湊在了一起，讓人們產(chǎn)生了「幻覺(jué)」——GPT-5攻克了埃爾德什難題。

一方面，難題并非未解決，只是網(wǎng)站維護(hù)者不清楚；另一方面，GPT-5僅通過(guò)搜索文獻(xiàn)完成，并非自己解決。

Sebastien Bubeck尷尬回復(fù)道，GPT-5只是在文獻(xiàn)中找到了解決方案，僅此而已。

即便如此，已經(jīng)非常高效了，因?yàn)槲抑浪阉魑墨I(xiàn)是有多么地困難。

網(wǎng)友熱議，還需同行評(píng)審

評(píng)論區(qū)的大佬們，正坐在前排吃瓜。

通過(guò)這場(chǎng)爭(zhēng)論，開(kāi)發(fā)者M(jìn)att Mazur認(rèn)真地表示，所有人必須謹(jǐn)慎地對(duì)待任何關(guān)于AI發(fā)現(xiàn)新科學(xué)/數(shù)學(xué)成果的說(shuō)法」。

Hyperbolic創(chuàng)始人Yuchen Jin稱(chēng)，「關(guān)于AI發(fā)現(xiàn)科學(xué)/數(shù)學(xué)的新發(fā)現(xiàn)，需要更多的同行評(píng)審」。

不過(guò)也有人認(rèn)為，這對(duì)GPT-5來(lái)說(shuō)并不尷尬，畢竟它在文獻(xiàn)檢索方面表現(xiàn)還是很出色的。

幾天前，陶哲軒也曾發(fā)文表示，我越來(lái)越覺(jué)得，眼下AI要在數(shù)學(xué)領(lǐng)域真正發(fā)揮作用，關(guān)鍵可能不在用最牛的模型去攻克最難的題目——

當(dāng)然偶爾會(huì)有這種案例，特別是當(dāng)人們?cè)伊舜罅克懔蛯?zhuān)家精力進(jìn)去的時(shí)候。

但更靠譜的路線，反而是用中等水平的AI工具，去幫我們搞定那些研究里繞不開(kāi)的瑣碎活、體力活。

無(wú)論何時(shí)，對(duì)AI原創(chuàng)發(fā)現(xiàn)保持審慎都是第一位的，但這并不妨礙AI輔助科研成為未來(lái)的必經(jīng)之路。

參考資料：

https://x.com/SebastienBubeck/status/1979539604522127746

https://x.com/thomasfbloom/status/1979254235075059732

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

馬斯克親自點(diǎn)名Karpathy迎戰(zhàn)Grok 5！別神話LLM，AGI還要等十年

新智元 2025-10-19 13:41:03
3 跟貼 3
小升初奧數(shù)培優(yōu)復(fù)雜的分?jǐn)?shù)列相加，針對(duì)分母使用裂項(xiàng)法打開(kāi)突破口

唐老師小課堂 2025-10-19 00:13:50
0 跟貼 0

四邊形ABCD是一個(gè)長(zhǎng)方形，求陰影部分的面積

公考客棧店小二 2025-10-16 18:00:00
0 跟貼 0

成立的前提條件是底數(shù)和真數(shù)的差相等

阿航觀世界 2025-10-19 11:17:16
12 跟貼 12
小學(xué)數(shù)學(xué)思維提升，在下面的豎式中，abcd各代表什么數(shù)字

公考客棧店小二 2025-10-19 16:00:00
0 跟貼 0

不同的圖形代表不同的數(shù)字，求三種圖形各代表什么數(shù)字

公考客棧店小二 2025-10-17 17:00:00
0 跟貼 0

小學(xué)數(shù)學(xué)思維提升：三年級(jí)拓展思維，不難

公考客棧店小二 2025-10-19 18:00:00
0 跟貼 0
解方程4(6x-1)(4x-1)(3x-1)=1

三樂(lè)大掌柜 2025-10-16 15:31:59
2 跟貼 2

華羅庚競(jìng)賽題：都感覺(jué)簡(jiǎn)單，能做對(duì)的卻很少

郎老師趣味數(shù)學(xué)課堂 2025-10-17 16:36:33
0 跟貼 0
小學(xué)數(shù)學(xué)思維提升，第五屆小學(xué)“希望杯”全國(guó)數(shù)學(xué)邀請(qǐng)賽，有難度

公考客棧店小二 2025-10-17 14:00:00
0 跟貼 0
數(shù)學(xué)小知識(shí):一半模型一半思維小學(xué)數(shù)學(xué)思維訓(xùn)

噗噗小露西 2025-10-17 07:33:26
0 跟貼 0
為什么科學(xué)界都認(rèn)同宇宙是由大爆炸誕生的？有哪些證據(jù)支持呢？

萬(wàn)物研究 2025-10-17 10:24:24
54 跟貼 54
北大強(qiáng)擊數(shù)學(xué)題目，輪換式題目求代數(shù)式的值

三樂(lè)大掌柜 2025-10-16 15:27:36
1 跟貼 1
OpenAI頭號(hào)叛徒，竟然是自學(xué)的AI?

量子位 2025-08-22 16:06:15
0 跟貼 0
看看韋神如何解答這種復(fù)雜乘法算術(shù)題？不學(xué)真是后悔??！

愛(ài)笑西紅柿 2025-10-17 10:33:03
4 跟貼 4
證明題，這思路不好想，看看你有其他方法嗎？

智慧的小老虎 2025-10-19 22:56:53
0 跟貼 0
恭喜！天一中學(xué)、省錫中、梅村、南菁

無(wú)錫eTV全媒體 2025-10-19 17:36:31
3 跟貼 3
2026高考數(shù)學(xué)世紀(jì)金榜一輪復(fù)習(xí)第十二節(jié)導(dǎo)數(shù)的與函數(shù)的單調(diào)性(11)

鄒老實(shí)課堂 2025-10-19 16:01:01
1 跟貼 1
解方程，拿滿(mǎn)分的不多，看看學(xué)霸怎樣突破？

智慧的小老虎 2025-10-19 23:11:37
0 跟貼 0
初中數(shù)學(xué)代數(shù)式求值題目，如何快速求解？

三樂(lè)大掌柜 2025-10-18 10:29:47
1 跟貼 1
每日數(shù)學(xué)鬼畜版學(xué)完強(qiáng)的可怕今天用畫(huà)圖法解道題

Ponyking 2025-10-18 11:59:02
5 跟貼 5
數(shù)學(xué)小知識(shí):數(shù)學(xué)思維，找規(guī)律隔項(xiàng)，兩項(xiàng)之和與

噗噗小露西 2025-10-19 13:32:48
0 跟貼 0
輔導(dǎo)孩子數(shù)學(xué)，爸爸差點(diǎn)被逼瘋，湊十法破十法借十法平十法，網(wǎng)友：看得出來(lái)你知識(shí)點(diǎn)掌握得很牢固

重慶科教融媒體 2025-10-17 15:52:45
0 跟貼 0
高中數(shù)學(xué)專(zhuān)題不等式解集與集合的關(guān)系，注意條件的等價(jià)代換

唐老師小課堂 2025-10-19 00:18:00
0 跟貼 0
老師曬文科班的數(shù)學(xué)答題卡，清一色的白，學(xué)生：對(duì)完選擇題就知道總分了

重慶科教融媒體 2025-10-19 15:09:02
0 跟貼 0
關(guān)于解方程的一道數(shù)學(xué)題，此題的關(guān)鍵在于如何統(tǒng)一分母

三樂(lè)大掌柜 2025-10-18 10:30:03
2 跟貼 2
機(jī)器人跳舞時(shí)差點(diǎn)撞上，還好工作人員及時(shí)拉開(kāi)，網(wǎng)友：感覺(jué)像是代碼寫(xiě)死的

逛吃青島 2025-10-17 19:44:20
31 跟貼 31
OpenAl為何“情迷”變現(xiàn)

虎嗅APP 2025-10-19 21:55:06
2 跟貼 2
科學(xué)界論文高引第一人易主！AI站上歷史巔峰

量子位 2025-08-25 14:10:09
0 跟貼 0
前OpenAI研究員跨界做文創(chuàng)：Ilya發(fā)型帽子走紅，AI成潮牌！

新智元 2025-10-18 16:01:06
2 跟貼 2
DeepMind讓AI當(dāng)「上帝」，導(dǎo)演一場(chǎng)只有AI演員的「西部世界」

機(jī)器之心Pro 2025-07-16 13:55:45
0 跟貼 0
關(guān)于解分式方程的一道題目，搞清規(guī)律后方可快去解題

三樂(lè)大掌柜 2025-10-18 10:30:16
1 跟貼 1
似曾相識(shí)的代數(shù)式求值題，但這次完全不一樣了！

三樂(lè)大掌柜 2025-10-17 14:34:44
1 跟貼 1
圖靈得主Yoshua Bengio，開(kāi)始警惕AI有意識(shí)了

機(jī)器之心Pro 2025-09-22 20:57:57
3 跟貼 3
中國(guó)數(shù)學(xué)會(huì)三大數(shù)學(xué)獎(jiǎng)公布名單，華南理工這位校友入選！

華南理工大學(xué) 2025-10-19 21:26:03
5 跟貼 5
利用三次基本不等式求代數(shù)式的最小值，題目難度大！

三樂(lè)大掌柜 2025-10-15 11:35:49
3 跟貼 3
中方出臺(tái)豁免政策，2招破解美國(guó)船舶收費(fèi)，特朗普發(fā)現(xiàn)中計(jì)了

金梅煮酒 2025-10-17 19:09:00
2 跟貼 2
1995高考題，教室里有10盞燈，拉滅了3盞燈，還剩下幾盞

老Biu 2025-10-19 10:53:42
0 跟貼 0
浙大推出首個(gè)「多圖應(yīng)用題」基準(zhǔn)GSM8K-V，全面評(píng)估 VLM數(shù)學(xué)推理能力

新智元 2025-10-19 17:07:11
0 跟貼 0
“要跪搓衣板了！”浙江男子用100克黃金打吸管喝奶茶，凌晨在街頭丟了

極目新聞 2025-10-19 11:49:32
8952 跟貼 8952

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

GPT-5破解世紀(jì)難題，竟是上網(wǎng)抄來(lái)的！哈薩比斯：太尷尬了

獨(dú)家|楊振寧：最頂尖的學(xué)生不是教出來(lái)的

盧浮宮失竊藏品清單公布 盜賊手法被指"迅速且粗暴"

盧浮宮失竊藏品清單公布 盜賊手法被指"迅速且粗暴"

正在爆火的"拼好球" 馬斯克和樊振東也在玩

竇驍婚變升級(jí)！何超蓮被曝已有新歡

星巴克中國(guó)股權(quán)出售進(jìn)入倒計(jì)時(shí)

最高15000元兜底 智界R7/S7推出購(gòu)置稅補(bǔ)貼方案

態(tài)度原創(chuàng)

真有品味的中年女人，穿衣打扮都有這4個(gè)共同點(diǎn)，你中了嗎？

手機(jī)周邊份額再次出爐：小米第二，華為僅排第四！

因異而生 古今文脈交融

專(zhuān)訪真我徐起：攜理光GR破局影像同質(zhì)化，以街拍基因叩響4000-5000元高端市場(chǎng)

GPT-5破解世紀(jì)難題，竟是上網(wǎng)抄來(lái)的！哈薩比斯：太尷尬了

盧浮宮失竊藏品清單公布盜賊手法被指"迅速且粗暴"

盧浮宮失竊藏品清單公布盜賊手法被指"迅速且粗暴"

最高15000元兜底智界R7/S7推出購(gòu)置稅補(bǔ)貼方案

真有品味的中年女人，穿衣打扮都有這4個(gè)共同點(diǎn)，你中了嗎？

手機(jī)周邊份額再次出爐：小米第二，華為僅排第四！

因異而生古今文脈交融

專(zhuān)訪真我徐起：攜理光GR破局影像同質(zhì)化，以街拍基因叩響4000-5000元高端市場(chǎng)