網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

陶哲軒用GPT-5解決數(shù)學(xué)難題：僅29行Python代碼

2025-10-04 12:12:22　來(lái)源: 量子位

陜西舉報(bào)

分享至

AI又又又幫陶哲軒解決了一個(gè)難題！

消息來(lái)自陶本人最新發(fā)帖，他直言不諱地表示：

如果沒(méi)有AI幫忙，完成同樣任務(wù)就需要花費(fèi)數(shù)小時(shí)（主要是手動(dòng)編寫(xiě)代碼和調(diào)試）。

甚至，如果沒(méi)有AI，他也不會(huì)決定采用目前已經(jīng)取得成功的關(guān)鍵策略。

事實(shí)上，如果沒(méi)有AI幫忙，我?guī)缀醪豢赡車(chē)L試進(jìn)行這種數(shù)值搜索（可能會(huì)尋求理論漸近分析）。

由于用的是GPT-5，OpenAI研究員Sebastien Bubeck（微軟前AI副總裁&杰出科學(xué)家）也火速轉(zhuǎn)發(fā)了一波，由此在社區(qū)引發(fā)熱烈討論。

除了紛紛回憶和陶神本人類(lèi)似的經(jīng)歷，網(wǎng)友們無(wú)不感慨：

這標(biāo)志著我們正在進(jìn)入一個(gè)人類(lèi)與機(jī)器共同探索的新時(shí)代。

所以，陶哲軒這次用AI解決了什么問(wèn)題？AI又在其中起了多大作用？

咱接著康康——

僅用29行Python代碼幫助驗(yàn)證結(jié)果

陶哲軒這次要解決的是MathOverflow（專(zhuān)業(yè)數(shù)學(xué)問(wèn)答社區(qū)）上的一個(gè)問(wèn)題：

序列l(wèi)cm(1,2,…,n)是否是高度豐數(shù)的一個(gè)子集？

簡(jiǎn)單來(lái)說(shuō)，這個(gè)問(wèn)題其實(shí)就是在比對(duì)兩個(gè)特殊的數(shù)列。

一個(gè)是最小公倍數(shù)數(shù)列，如：

n=2，lcm(1,2）=2
n=3，lcm(1,2,3）=6
n=4，lcm(1,2,3,4）=12
n=5，lcm(1,2,3,4,5）=60

另一個(gè)是高度豐數(shù)數(shù)列Highly Abundant Numbers (HA)。這類(lèi)數(shù)有個(gè)特殊性質(zhì)：其“所有約數(shù)加起來(lái)的和”，比任何比它小的數(shù)都大。

例如1的約數(shù)和是1，2的約數(shù)和是3（大于1），4的約數(shù)和是7（比3、1都大），所以它們是高度豐數(shù)。

由于發(fā)現(xiàn)前面算出來(lái)的最小公倍數(shù)們，居然剛好也是高度豐數(shù)，所以問(wèn)題來(lái)了——會(huì)不會(huì)所有的最小公倍數(shù)，永遠(yuǎn)都在高度豐數(shù)的行列里？（即子集）

對(duì)于這個(gè)問(wèn)題，陶哲軒之前已經(jīng)通過(guò)理論分析，得出答案是否定的。

不過(guò)要想完全證明這一點(diǎn)，還需要找到具體的數(shù)值參數(shù)，以便確鑿地構(gòu)建一個(gè)反例。

雖然方向很明確，但陶哲軒清楚，由于過(guò)程中需要繁瑣的計(jì)算和參數(shù)搜索，所以這也算是一項(xiàng)“大工程”，人工就得吭哧吭哧干幾小時(shí)。

而交給GPT-5后，一切都變得輕松了……僅通過(guò)自然語(yǔ)言對(duì)話(huà)，幾輪溝通下來(lái)AI就幫忙解決了問(wèn)題。

具體過(guò)程如下：

起初，陶哲軒嘗試讓GPT-5直接生成Python程序，來(lái)搜索這些反例的參數(shù)。

這樣陶就可以自己跑代碼、調(diào)整參數(shù)。

GPT-5在思考了大約1分鐘19秒后，也確實(shí)給出了一段很長(zhǎng)的代碼。

但實(shí)際運(yùn)行后發(fā)現(xiàn)，生成的代碼運(yùn)行時(shí)間過(guò)長(zhǎng)，且初始參數(shù)選擇不當(dāng)，最終會(huì)導(dǎo)致搜索的失敗。

于是他選擇轉(zhuǎn)變策略，通過(guò)與GPT-5展開(kāi)分步對(duì)話(huà)，來(lái)讓它通過(guò)啟發(fā)式計(jì)算來(lái)尋找可行的參數(shù)選項(xiàng)。

換句話(huà)說(shuō)，他選擇將一個(gè)大問(wèn)題拆成多個(gè)小問(wèn)題，然后在其本人的指導(dǎo)下，讓GPT-5來(lái)逐個(gè)攻破。

幾輪溝通下來(lái)，GPT-5終于成功生成了符合要求的參數(shù)。

并且，為了確保結(jié)果可靠，陶還使用了由GPT-5生成的擁有29行代碼的Python腳本進(jìn)行獨(dú)立驗(yàn)證。

在陶看來(lái)，這個(gè)腳本簡(jiǎn)潔明了，易于人工檢查，且驗(yàn)證的數(shù)值結(jié)果與之前的啟發(fā)式預(yù)測(cè)完全吻合。

綜上，通過(guò)使用GPT-5，陶哲軒最終完成了上述問(wèn)題的否定證明。

而且他還特意提到，面對(duì)數(shù)學(xué)這類(lèi)嚴(yán)肅課題，AI這次竟然也沒(méi)有犯幻覺(jué)這個(gè)“老毛病”。

我沒(méi)有遇到幻覺(jué)或其他AI生成的胡言亂語(yǔ)的問(wèn)題。

這不是陶神第一次用AI解決數(shù)學(xué)問(wèn)題

事實(shí)上，作為頂尖數(shù)學(xué)大佬，這不是陶哲軒第一次用AI解決數(shù)學(xué)問(wèn)題。

光是今年，量子位此前就有多篇介紹：

9月初，他將GPT-5用于半自動(dòng)化文獻(xiàn)檢索，使Erdos問(wèn)題/OEIS關(guān)聯(lián)項(xiàng)目首次得到概念驗(yàn)證；
5月下旬，新人博主陶哲軒在油管手把手演示如何只用GitHub Copilot證明函數(shù)極限問(wèn)題；
5月中旬，油管首秀用AI 33分鐘“盲證”Magma方程E1689蘊(yùn)含E2；
3月中旬，o3-mini一眼識(shí)破并糾正了他的一個(gè)錯(cuò)誤，然后在它的幫助下快速完成了一道數(shù)學(xué)題的解答；

在陶哲軒看來(lái)，“人工智能或許短期內(nèi)不會(huì)獲得菲爾茲獎(jiǎng)（數(shù)學(xué)界的諾貝爾獎(jiǎng)），但它或許可以充當(dāng)數(shù)學(xué)家進(jìn)行證明的中介”。

當(dāng)然，跳出數(shù)學(xué)領(lǐng)域，陶哲軒的打樣無(wú)疑也在告訴我們：如何用AI相當(dāng)關(guān)鍵。

One More Thing

關(guān)于GPT-5，OpenAI CEO奧特曼的最新表態(tài)正在引起熱議。

GPT-5被誤解了！

一改往日高調(diào)姿態(tài)，他這次直接告訴大家，GPT-5代表的是迭代改進(jìn)，而非突然的范式轉(zhuǎn)變。

也就是說(shuō)，人們對(duì)GPT-5的預(yù)期過(guò)高了（也借此回應(yīng)GPT-5直播出故障以及人們關(guān)于模型能力未達(dá)預(yù)期的抱怨）。

而且面對(duì)“何時(shí)實(shí)現(xiàn)AGI”這一問(wèn)題，其態(tài)度同樣來(lái)了個(gè)大轉(zhuǎn)彎——

相比以前直接說(shuō)AGI 2030年前會(huì)實(shí)現(xiàn)，他這次變得更加謹(jǐn)慎，開(kāi)始強(qiáng)調(diào)自己更關(guān)注安全和漸進(jìn)式進(jìn)步。

好好好，你小汁主打一個(gè)隨機(jī)應(yīng)變是吧（doge）。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.