機器之心報道
編輯:Panda
前些天,OpenAI 研究員宣稱 GPT-5 「發(fā)現(xiàn)」了 10 個懸賞數(shù)學難題的解決方法,輿論誤以為是 GPT-5 給出了解題方法,結果被發(fā)現(xiàn)只是檢索到了早已存在的文獻,引發(fā)了學界大佬的群嘲以及對于 AI 領域夸大宣傳和 AI 檢索能力的激烈討論。參閱報道《OpenAI「解決」10 道數(shù)學難題?哈薩比斯直呼「尷尬」,LeCun 辛辣點評》。
然而,諷刺的是,當人們還在辯論 AI 是不是一個合格的「文獻檢索員」時,真正的數(shù)學發(fā)現(xiàn)已經(jīng)悄然發(fā)生。
AI 取得研究突破
加州大學洛杉磯分校(UCLA)數(shù)學教授 Ernest Ryu 發(fā)推稱:「我使用 ChatGPT 解決了凸優(yōu)化中的一個未曾被解決的問題。」
隨后,他通過一系列推文介紹了自己與 ChatGPT 的聯(lián)合成果。
首先來看一下他所研究的問題本身:
呃,看不懂,但我們可以讓 AI 來幫助我們理解(AI 再立大功?。?/p>
這個數(shù)學問題探討的是一個在最優(yōu)化理論中非常著名的動態(tài)系統(tǒng),我們可以用一個生動的物理比喻來理解它:一個球在碗里的滾動過程。在這個比喻中,被稱為「凸函數(shù)」的 f 就代表一個形狀完美的碗,它內部光滑,從碗邊到碗底的坡度是逐漸下降的,沒有任何凹陷或小山丘。這個碗的碗底可能是一個尖銳的點,也可能是一片寬廣的平坦區(qū)域,這片最低的區(qū)域在數(shù)學上被稱為 argmin f。而 X (t) 則描述了在時間 t 時,一個球在這個碗中所處的位置。截圖中的那個核心微分方程,?(t) + (3/t)?(t) + ?f (X (t)) = 0,就是控制這個球如何滾動的「物理定律」。其中,?f (X (t)) 扮演了「重力」的角色,時刻將球往坡度最陡峭的下方拉扯;而 (3/t)?(t) 則是一個非常特殊的「摩擦力」,它的奇特之處在于會隨著時間的流逝而逐漸減弱。一開始摩擦力很強,能有效減速,但隨著時間 t 變得越來越大,這個摩擦效應會變得越來越微弱。整個問題就是從碗壁的某個初始位置 X? 將球從靜止狀態(tài)釋放,然后觀察它在這套獨特的物理規(guī)則下將如何運動。
這個問題的真正核心與挑戰(zhàn),在于需要嚴格證明:這個滾動的球最終不僅會到達碗底,而且會完全靜止在碗底的某一個確切的點上。表面上看,這似乎是理所當然的,但在數(shù)學上卻是一個深刻的難題。數(shù)學家們早已證明,球的「高度」 f (X (t)) 隨著時間的推移,必然會無限趨近于碗底的最低高度。換言之,我們 100% 確定這個球最終會進入碗底的最低區(qū)域,而不會停在半山腰。但這僅僅是「函數(shù)值收斂」。真正的「懸而未決的難題」在于球的「位置」 X (t) 是否也會收斂。如果碗底是一個寬廣的平坦區(qū)域,球在到達這個區(qū)域后,會不會因為慣性而永無止境地滑行、振蕩或者兜圈子,就像一個陀螺在光滑的地面上不停旋轉一樣?這個問題要求證明,恰恰是由于那個 3/t 的特殊時變摩擦力,它能以一種恰到好處的方式耗盡球的所有動能,最終引導它停泊在一個固定的位置上,而不是在最低能量狀態(tài)下進行永恒的漂移。這在很長一段時間里都是一個吸引了眾多研究的公開問題,因為它觸及了優(yōu)化算法收斂性理論的基石。
下面則是 ChatGPT 的證明,但也經(jīng)過了 Ernest Ryu 教授的整理:
他也分享了原始的交互記錄:https://chatgpt.com/share/68f805f2-b8fc-8010-8df6-20a46bc1df44
從這份記錄可以看到,他使用的模型是 GPT-5 Pro,而該模型為該問題執(zhí)行了 22 分鐘的推理。
同樣,AI 基于此給出的分析是:Nesterov ODE (常微分方程) 的解 X (t) 最終會收斂到函數(shù) f 的某一個最小值點 X∞。
我們也能在證明中看到 z? 和 z? 距離為 0,意味著這兩者必須是同一個點。這與最初「假設存在兩個不同的點」相矛盾。因此,最初的假設是錯誤的,所以這個球只能停在一個點上。
Ernest Ryu 還介紹了自己的歷程和想法:「我的反應:ChatGPT 確實有效地加速了我的進度。這項工作花了大約 12 個小時,分 3 天進行?,F(xiàn)在回想起來,證明過程其實很簡單?!?/p>
他繼續(xù)介紹說:「但我嘗試了許多其他策略,但都沒有成功,而 ChatGPT 至關重要地幫助我快速探索并消除了這些死胡同。此外,關鍵的成功步驟也是由 ChatGPT 提出的。
不過他也指出,ChatGPT 的成功并不是一蹴而就的:「ChatGPT 并非一次性給出證明。整個過程高度互動。它提出了許多論點,其中大約 80% 都是錯誤的。但有些想法對我來說確實很新穎。每當我意識到一個新奇的想法,無論正確與否,我都會提煉出其中的關鍵洞見,并促使 ChatGPT 對其進行進一步的開發(fā)?!?/p>
Ryu 還總結了自己與 ChatGPT 各自的貢獻:
最后,他指出:「在我看來,這個結果已經(jīng)可以在權威的優(yōu)化理論期刊上發(fā)表。不過,我還想進一步完善它。」未來他還計劃將該證明泛化到 r>0 的 ODE 以及嘗試「將這個論證轉化為證明離散時間對應方法(即 Nesterov 加速梯度法)的收斂性」。
他總結說:「ChatGPT 現(xiàn)在已經(jīng)處于能解決一些數(shù)學研究問題的水平,但確實需要一位專家來指導它。
有意思的是,他提到自己研究過程中最大的障礙是「用完 ChatGPT Pro 查詢」,而他使用的已經(jīng)是「昂貴的 Pro 計劃」,只能等下個月刷新了。
當然,這是個相當不錯的宣傳機會,已經(jīng)有 OpenAI 工作人員聯(lián)系他,并提供了更多積分。
AI 成為論文第一作者
無獨有偶,加州大學歐文分校(UCI)數(shù)學教授 Paata Ivanisvili 前些時日也宣稱 GPT-5 Pro 助其發(fā)現(xiàn)了一個命題的反例。
更有趣的是,他剛剛還宣布要將 ChatGPT 列為他這篇論文的合著者,并且還是第一作者
當然,這早已不是 AI 首次以作者身份登上嚴肅的學術論文,早在 2023 年 ChatGPT 就已經(jīng)當作論文第三作者,參閱報道《一位論文作者火了,ChatGPT 等大型語言模型何時能成為論文合著者?》不過,值得注意的是,該論文的最新版本的作者名單中已經(jīng)沒有 ChatGPT 的身影。
2023 年的截圖,現(xiàn)如今該論文的作者名單中已經(jīng)沒有 ChatGPT
AI 輔助證明,成為第二作者
而在前些天的所謂「OpenAI『解決〗10 道數(shù)學難題?」事件之后,有兩位人類研究者遭遇了類似的尷尬。他們在宣布成功解決了 #707 Erdos 問題之后發(fā)現(xiàn)這個問題其實 30 年前就已經(jīng)被解決了!
不過他們也并未止步于此,而是繼續(xù)讓 GPT-5 編寫了一個 Lean 形式化證明,并成功進行了驗證。當然,他們也強調了專家指導和反饋的重要性。
總之,我們看到,在其論文的作者列表中,ChatGPT 與 Lean 都躋身其中。
當然,將 AI 列為論文作者的做法依然存在巨大爭議。
結語
順帶一提,在前述相關推文的評論區(qū),我們也能看到其它一些使用 AI 取得研究進展的信息:
Ernest Ryu 教授的故事,連同其他研究者的經(jīng)歷,共同揭示了一個正在到來的新時代:AI 或許不再僅僅是工具,它正在成為研究伙伴
這意味著,未來頂尖的科研,或許將不再是單打獨斗的英雄主義,而是人類專家與強大 AI 之間的深度對話與協(xié)作。
那么,屏幕前的你呢?你有在自己的研究工作中使用 AI 嗎?體驗如何?歡迎分享你的故事。
https://x.com/ErnestRyu/status/1980759528984686715
https://x.com/PI010101/status/1981014478969033156
https://x.com/goldstein_aa/status/1981034927266083203
https://x.com/SebastienBubeck/status/1980804267524116569
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.