新智元報(bào)道
編輯:桃子
【新智元導(dǎo)讀】陶哲軒聯(lián)手ChatGPT,多輪交互一個(gè)小時(shí),最終破解了MathOverflow復(fù)雜數(shù)學(xué)題。讓他驚喜的是,AI不僅省去了數(shù)小時(shí)編碼,還優(yōu)化了工作流。
兩年前,陶哲軒曾預(yù)言,「2026年的AI,將成為數(shù)學(xué)研究和其他很多領(lǐng)域的可靠的合作者」。
現(xiàn)在,不用等到2026年,AI已經(jīng)做到了!
在Mathstodon上,陶哲軒稱,自己聯(lián)手ChatGPT攻克了一個(gè)MathOverflow難題,節(jié)省了數(shù)小時(shí)的編碼時(shí)間。
在此期間,對(duì)話持續(xù)長(zhǎng)達(dá)一小時(shí)。
OpenAI副總Kevin Weil激動(dòng)表示,「陶哲軒+AI解決了復(fù)雜數(shù)學(xué)難題」。
OpenAI科學(xué)家Sebastien Bubeck自豪地表示,「這次,是陶哲軒本人的」。
幾天前,GPT-5成功破解三大猜想,通過了「哥德爾測(cè)試」,以往需要耗費(fèi)人類博士生數(shù)日時(shí)間才能完成。
如今,越來越多的證據(jù)表明,AI正為數(shù)學(xué)發(fā)現(xiàn)做出實(shí)質(zhì)性的貢獻(xiàn)。
這一次,陶哲軒攜手ChatGPT,攻克了怎樣的難題?
陶哲軒+GPT-5,破解數(shù)學(xué)難題
這個(gè)MathOverflow的問題,探討了「最小公倍數(shù)序列是否為某一特定集合的子集」——
序列l(wèi)cm(1,2,…,n)是否是高度豐數(shù)的一個(gè)子集?
陶哲軒本人通過理論分析,已經(jīng)得出結(jié)論:答案是否定的。
然而,要完全證明這一點(diǎn),他需要找到具體的數(shù)值參數(shù),以便確鑿地構(gòu)建一個(gè)反例。
這一過程看似簡(jiǎn)單,實(shí)則需要繁瑣的計(jì)算和參數(shù)搜索,稍有不慎便可能陷入低效的泥潭。
初試ChatGPT,多輪交互
起初,陶哲軒嘗試讓ChatGPT直接生成Python代碼,以搜索滿足條件的不等式參數(shù)。
這樣一來,就可以自己運(yùn)行和調(diào)整。
不過,這一方法很快暴露了局限性——
生成的代碼運(yùn)行時(shí)間過長(zhǎng),且初始參數(shù)選擇不當(dāng),最終會(huì)導(dǎo)致搜索的失敗。
于是接下來,他改變了策略,轉(zhuǎn)而與AI展開分步對(duì)話,讓它通過啟發(fā)式計(jì)算來尋找可行的參數(shù)選項(xiàng)。
這種方法的核心在于:將復(fù)雜問題拆解為小步驟,每一步都由AI提供計(jì)算支持,并在陶哲軒的指導(dǎo)下不斷優(yōu)化。
最終,AI成功生成了符合要求的參數(shù)。
為了確保結(jié)果的可靠性,陶哲軒使用了一個(gè)由AI生成的29行Python腳本進(jìn)行獨(dú)立驗(yàn)證。
這個(gè)腳本簡(jiǎn)潔明了,易于人工檢查,且驗(yàn)證的數(shù)值結(jié)果與之前的啟發(fā)式預(yù)測(cè)完全吻合。
不用手動(dòng)編碼,優(yōu)化工作流
陶哲軒坦言,AI在這一過程中的作用不可忽視。
AI不僅幫助他發(fā)現(xiàn)了初始嘗試中的多處數(shù)學(xué)錯(cuò)誤,還將原本可能耗費(fèi)數(shù)小時(shí)的編程與調(diào)試工作,壓縮為一個(gè)高效的流程。
如果沒有AI的協(xié)助,他根本不會(huì)嘗試這種數(shù)值搜索,而是轉(zhuǎn)而尋求更傳統(tǒng)的理論分析方法。
更重要的是,陶哲軒強(qiáng)調(diào),他沒有遇到AI常見的「幻覺」問題。
這得益于他清晰的任務(wù)規(guī)劃,以及分步引導(dǎo)的對(duì)話方式。
每一步計(jì)算,都在自己的監(jiān)督下完成,AI僅在最后階段提供了數(shù)值結(jié)果和驗(yàn)證代碼,確保了整個(gè)過程的嚴(yán)謹(jǐn)性。
我認(rèn)為,這是因?yàn)閷?duì)需要執(zhí)行的那些繁瑣的計(jì)算任務(wù),我心里已經(jīng)有了比較清晰的規(guī)劃,并且能夠以分步的方式向AI詳細(xì)解釋,每一步都在對(duì)話中得到確認(rèn)后,再繼續(xù)下一步。
在切換到對(duì)話式策略后,我只在最后階段才用Python進(jìn)行外部驗(yàn)證,也就是當(dāng)AI生成了它聲稱滿足約束條件的數(shù)值輸出時(shí)。
順便提一句,陶哲軒本人用的就是,所有人接觸到的GPT-5。
陶哲軒的這次嘗試,為我們揭示了AI在數(shù)學(xué)研究中的巨大潛力。
它不僅能執(zhí)行繁瑣的計(jì)算任務(wù),還能在數(shù)學(xué)家的引導(dǎo)下,參與復(fù)雜的探索過程。
AI的價(jià)值在于解放研究者的時(shí)間與精力,讓他們能夠?qū)W⒂诟邔哟蔚乃伎寂c創(chuàng)新。
正如陶哲軒所言,「如果沒有 AI 的幫助,我很可能不會(huì)去嘗試這種數(shù)值搜索」。
從AI拿下IMO金牌,到成為天才數(shù)學(xué)家的得力助手,或許未來,類似的故事將更多領(lǐng)域不斷上演。
參考資料:
https://x.com/kevinweil/status/1974161952260624459
https://x.com/minilek/status/1974118573569421650
https://x.com/slow_developer/status/1974238028743811544
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.