新智元報(bào)道
編輯:桃子
【新智元導(dǎo)讀】GPT-5一場(chǎng)鬧劇,讓OpenAI出大糗了!讓所有人都以為GPT-5破解了十道Erdos難題,沒(méi)想到竟是查文獻(xiàn)給出了答案。Hassabis點(diǎn)評(píng),這太尷尬了。
OpenAI團(tuán)隊(duì)狂吹了一波GPT-5,結(jié)果竟是鬧劇一場(chǎng)......
事情是這樣的。
幾天前,OpenAI科學(xué)家Sebastien Bubeck激動(dòng)轉(zhuǎn)發(fā),兩位研究員聯(lián)手GPT-5 Pro,僅用了一個(gè)周末,破解了10個(gè)「百年懸案」——
埃爾德什難題(Erdos problems)
緊接著,OpenAI科學(xué)副總裁Kevin Weil等人紛紛加入,大肆宣傳。
然而,真相很快浮出水面:
這十道難題,早就被學(xué)界解決,并非由GPT-5獨(dú)立解決,它只是通過(guò)檢索網(wǎng)絡(luò)文獻(xiàn)給出了答案。
消息一出,輿論嘩然。就連谷歌DeepMind CEO Demis Hassabis也忍不住評(píng)價(jià),「這也太尬了」。
還有,圖靈獎(jiǎng)得主LeCun閃現(xiàn)X上嘲諷,「簡(jiǎn)直就是,搬起石頭(GPT)砸自己的腳」。
GPT-5,一場(chǎng)鬧劇
這場(chǎng)鬧劇,可以說(shuō)OpenAI團(tuán)隊(duì)的自導(dǎo)自演。
研究人員Mark Sellke和Mehtaab Sawhney發(fā)文很明確,并沒(méi)有說(shuō)GPT-5破解了難題。
他們?cè)?,通過(guò)GPT-5數(shù)千條查詢(xún)后,找到了十個(gè)被列為Erdos問(wèn)題的解。
當(dāng)時(shí)的結(jié)果是,問(wèn)題223、339、494、515、621、822、883、903、1043、1079都得到了解決,同時(shí)在另外 11 個(gè)問(wèn)題上也取得了部分進(jìn)展。
另一方面,這十道難題早已有了答案,只不過(guò)網(wǎng)站管理者并未更新。
傳送門(mén):https://www.erdosproblems.com/
英國(guó)皇家學(xué)會(huì)研究院Thomas Bloom,網(wǎng)站erdosproblems.com運(yùn)營(yíng)者,卻對(duì)此并不知情。
網(wǎng)站上,「開(kāi)放」?fàn)顟B(tài)僅代表他個(gè)人并不了解該問(wèn)題的解法,而不是表示該問(wèn)題在科學(xué)界尚未被解決。
總言之,兩個(gè)誤會(huì),湊在了一起,讓人們產(chǎn)生了「幻覺(jué)」——GPT-5攻克了埃爾德什難題。
一方面,難題并非未解決,只是網(wǎng)站維護(hù)者不清楚;另一方面,GPT-5僅通過(guò)搜索文獻(xiàn)完成,并非自己解決。
Sebastien Bubeck尷尬回復(fù)道,GPT-5只是在文獻(xiàn)中找到了解決方案,僅此而已。
即便如此,已經(jīng)非常高效了,因?yàn)槲抑浪阉魑墨I(xiàn)是有多么地困難。
網(wǎng)友熱議,還需同行評(píng)審
評(píng)論區(qū)的大佬們,正坐在前排吃瓜。
通過(guò)這場(chǎng)爭(zhēng)論,開(kāi)發(fā)者M(jìn)att Mazur認(rèn)真地表示,所有人必須謹(jǐn)慎地對(duì)待任何關(guān)于AI發(fā)現(xiàn)新科學(xué)/數(shù)學(xué)成果的說(shuō)法」。
Hyperbolic創(chuàng)始人Yuchen Jin稱(chēng),「關(guān)于AI發(fā)現(xiàn)科學(xué)/數(shù)學(xué)的新發(fā)現(xiàn),需要更多的同行評(píng)審」。
不過(guò)也有人認(rèn)為,這對(duì)GPT-5來(lái)說(shuō)并不尷尬,畢竟它在文獻(xiàn)檢索方面表現(xiàn)還是很出色的。
幾天前,陶哲軒也曾發(fā)文表示,我越來(lái)越覺(jué)得,眼下AI要在數(shù)學(xué)領(lǐng)域真正發(fā)揮作用,關(guān)鍵可能不在用最牛的模型去攻克最難的題目——
當(dāng)然偶爾會(huì)有這種案例,特別是當(dāng)人們?cè)伊舜罅克懔蛯?zhuān)家精力進(jìn)去的時(shí)候。
但更靠譜的路線,反而是用中等水平的AI工具,去幫我們搞定那些研究里繞不開(kāi)的瑣碎活、體力活。
無(wú)論何時(shí),對(duì)AI原創(chuàng)發(fā)現(xiàn)保持審慎都是第一位的,但這并不妨礙AI輔助科研成為未來(lái)的必經(jīng)之路。
參考資料:
https://x.com/SebastienBubeck/status/1979539604522127746
https://x.com/thomasfbloom/status/1979254235075059732
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.