AI又又又幫陶哲軒解決了一個(gè)難題!
消息來(lái)自陶本人最新發(fā)帖,他直言不諱地表示:
- 如果沒(méi)有AI幫忙,完成同樣任務(wù)就需要花費(fèi)數(shù)小時(shí)(主要是手動(dòng)編寫(xiě)代碼和調(diào)試)。
甚至,如果沒(méi)有AI,他也不會(huì)決定采用目前已經(jīng)取得成功的關(guān)鍵策略。
- 事實(shí)上,如果沒(méi)有AI幫忙,我?guī)缀醪豢赡車(chē)L試進(jìn)行這種數(shù)值搜索(可能會(huì)尋求理論漸近分析)。
由于用的是GPT-5,OpenAI研究員Sebastien Bubeck(微軟前AI副總裁&杰出科學(xué)家)也火速轉(zhuǎn)發(fā)了一波,由此在社區(qū)引發(fā)熱烈討論。
除了紛紛回憶和陶神本人類(lèi)似的經(jīng)歷,網(wǎng)友們無(wú)不感慨:
- 這標(biāo)志著我們正在進(jìn)入一個(gè)人類(lèi)與機(jī)器共同探索的新時(shí)代。
所以,陶哲軒這次用AI解決了什么問(wèn)題?AI又在其中起了多大作用?
咱接著康康——
僅用29行Python代碼幫助驗(yàn)證結(jié)果
陶哲軒這次要解決的是MathOverflow(專(zhuān)業(yè)數(shù)學(xué)問(wèn)答社區(qū))上的一個(gè)問(wèn)題:
- 序列l(wèi)cm(1,2,…,n)是否是高度豐數(shù)的一個(gè)子集?
簡(jiǎn)單來(lái)說(shuō),這個(gè)問(wèn)題其實(shí)就是在比對(duì)兩個(gè)特殊的數(shù)列。
一個(gè)是最小公倍數(shù)數(shù)列,如:
- n=2,lcm(1,2)=2
- n=3,lcm(1,2,3)=6
- n=4,lcm(1,2,3,4)=12
- n=5,lcm(1,2,3,4,5)=60
另一個(gè)是高度豐數(shù)數(shù)列Highly Abundant Numbers (HA)。這類(lèi)數(shù)有個(gè)特殊性質(zhì):其“所有約數(shù)加起來(lái)的和”,比任何比它小的數(shù)都大。
例如1的約數(shù)和是1,2的約數(shù)和是3(大于1),4的約數(shù)和是7(比3、1都大),所以它們是高度豐數(shù)。
由于發(fā)現(xiàn)前面算出來(lái)的最小公倍數(shù)們,居然剛好也是高度豐數(shù),所以問(wèn)題來(lái)了——會(huì)不會(huì)所有的最小公倍數(shù),永遠(yuǎn)都在高度豐數(shù)的行列里?(即子集)
對(duì)于這個(gè)問(wèn)題,陶哲軒之前已經(jīng)通過(guò)理論分析,得出答案是否定的。
不過(guò)要想完全證明這一點(diǎn),還需要找到具體的數(shù)值參數(shù),以便確鑿地構(gòu)建一個(gè)反例。
雖然方向很明確,但陶哲軒清楚,由于過(guò)程中需要繁瑣的計(jì)算和參數(shù)搜索,所以這也算是一項(xiàng)“大工程”,人工就得吭哧吭哧干幾小時(shí)。
而交給GPT-5后,一切都變得輕松了……僅通過(guò)自然語(yǔ)言對(duì)話(huà),幾輪溝通下來(lái)AI就幫忙解決了問(wèn)題。
具體過(guò)程如下:
起初,陶哲軒嘗試讓GPT-5直接生成Python程序,來(lái)搜索這些反例的參數(shù)。
這樣陶就可以自己跑代碼、調(diào)整參數(shù)。
GPT-5在思考了大約1分鐘19秒后,也確實(shí)給出了一段很長(zhǎng)的代碼。
但實(shí)際運(yùn)行后發(fā)現(xiàn),生成的代碼運(yùn)行時(shí)間過(guò)長(zhǎng),且初始參數(shù)選擇不當(dāng),最終會(huì)導(dǎo)致搜索的失敗。
于是他選擇轉(zhuǎn)變策略,通過(guò)與GPT-5展開(kāi)分步對(duì)話(huà),來(lái)讓它通過(guò)啟發(fā)式計(jì)算來(lái)尋找可行的參數(shù)選項(xiàng)。
換句話(huà)說(shuō),他選擇將一個(gè)大問(wèn)題拆成多個(gè)小問(wèn)題,然后在其本人的指導(dǎo)下,讓GPT-5來(lái)逐個(gè)攻破。
幾輪溝通下來(lái),GPT-5終于成功生成了符合要求的參數(shù)。
并且,為了確保結(jié)果可靠,陶還使用了由GPT-5生成的擁有29行代碼的Python腳本進(jìn)行獨(dú)立驗(yàn)證。
在陶看來(lái),這個(gè)腳本簡(jiǎn)潔明了,易于人工檢查,且驗(yàn)證的數(shù)值結(jié)果與之前的啟發(fā)式預(yù)測(cè)完全吻合。
綜上,通過(guò)使用GPT-5,陶哲軒最終完成了上述問(wèn)題的否定證明。
而且他還特意提到,面對(duì)數(shù)學(xué)這類(lèi)嚴(yán)肅課題,AI這次竟然也沒(méi)有犯幻覺(jué)這個(gè)“老毛病”。
- 我沒(méi)有遇到幻覺(jué)或其他AI生成的胡言亂語(yǔ)的問(wèn)題。
這不是陶神第一次用AI解決數(shù)學(xué)問(wèn)題
事實(shí)上,作為頂尖數(shù)學(xué)大佬,這不是陶哲軒第一次用AI解決數(shù)學(xué)問(wèn)題。
光是今年,量子位此前就有多篇介紹:
- 9月初,他將GPT-5用于半自動(dòng)化文獻(xiàn)檢索,使Erdos問(wèn)題/OEIS關(guān)聯(lián)項(xiàng)目首次得到概念驗(yàn)證;
- 5月下旬,新人博主陶哲軒在油管手把手演示如何只用GitHub Copilot證明函數(shù)極限問(wèn)題;
- 5月中旬,油管首秀用AI 33分鐘“盲證”Magma方程E1689蘊(yùn)含E2;
- 3月中旬,o3-mini一眼識(shí)破并糾正了他的一個(gè)錯(cuò)誤,然后在它的幫助下快速完成了一道數(shù)學(xué)題的解答;
在陶哲軒看來(lái),“人工智能或許短期內(nèi)不會(huì)獲得菲爾茲獎(jiǎng)(數(shù)學(xué)界的諾貝爾獎(jiǎng)) ,但它或許可以充當(dāng)數(shù)學(xué)家進(jìn)行證明的中介”。
當(dāng)然,跳出數(shù)學(xué)領(lǐng)域,陶哲軒的打樣無(wú)疑也在告訴我們:如何用AI相當(dāng)關(guān)鍵。
One More Thing
關(guān)于GPT-5,OpenAI CEO奧特曼的最新表態(tài)正在引起熱議。
- GPT-5被誤解了!
一改往日高調(diào)姿態(tài),他這次直接告訴大家,GPT-5代表的是迭代改進(jìn),而非突然的范式轉(zhuǎn)變。
也就是說(shuō),人們對(duì)GPT-5的預(yù)期過(guò)高了(也借此回應(yīng)GPT-5直播出故障以及人們關(guān)于模型能力未達(dá)預(yù)期的抱怨)。
而且面對(duì)“何時(shí)實(shí)現(xiàn)AGI”這一問(wèn)題,其態(tài)度同樣來(lái)了個(gè)大轉(zhuǎn)彎——
相比以前直接說(shuō)AGI 2030年前會(huì)實(shí)現(xiàn),他這次變得更加謹(jǐn)慎,開(kāi)始強(qiáng)調(diào)自己更關(guān)注安全和漸進(jìn)式進(jìn)步。
好好好,你小汁主打一個(gè)隨機(jī)應(yīng)變是吧(doge)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.