夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

所有大模型,都學物理學:北大物理系一篇研究,震撼了AI圈

0
分享至



編輯|+0、澤南、Panda

LLM 智能體很贊,正在成為一種解決復雜難題的強大范式。

不過,這種成功目前更多還停留在「經(jīng)驗主義」的工程實踐層面 —— 我們知道它好用,但往往不知道它在宏觀上為何如此運作。那么,我們是否能找到一個理論框架,像物理學描述自然界那樣,去理解和統(tǒng)一智能體的宏觀動力學(macroscopic dynamics)?

為了解開這個黑盒,近日,北京大學物理學院、高能物理研究中心以及北京計算科學研究中心聯(lián)合發(fā)力,跨界借用了物理學中經(jīng)典的最小作用量原理(least action principle)。他們提出了一種新穎的方法,成功估計了嵌入在智能體中的 LLM 隱秘的生成方向性(directionality),揭示了 AI 生成過程背后可能存在的「物理定律」。



  1. 論文標題:Detailed balance in large language model-driven agents
  2. 論文地址:https://arxiv.org/pdf/2512.10047

簡單來說,他們通過實驗測量了 LLM 生成狀態(tài)之間的轉(zhuǎn)移概率。基于此,他們在統(tǒng)計上發(fā)現(xiàn)了 LLM 生成轉(zhuǎn)移中的細致平衡 (detailed balance) 現(xiàn)象。

這表明:LLM 的生成可能不是通過一般性地學習規(guī)則集和策略來實現(xiàn)的,而是通過隱式地學習一類潛在的勢函數(shù) (potential functions),這些勢函數(shù)可能超越了不同的 LLM 架構和提示詞模板。

該團隊表示:「據(jù)我們所知,這是首次在不依賴特定模型細節(jié)的情況下,發(fā)現(xiàn) LLM 生成動力學中的宏觀物理定律?!?/p>

什么意思呢?通俗來說,該團隊發(fā)現(xiàn) AI 的思考并不是「死記硬背」,而是像水往低處流一樣遵循「物理本能」。

是的,LLM 智能體在解決問題時,其行為模式并不像很多人以為的那樣僅僅是在匹配規(guī)則或隨機嘗試,而是隱約看到了一張無形的地形圖(勢函數(shù))。在這個地形圖中,錯誤的答案就像是高地,而正確的答案則是谷底。智能體的每一次推理和生成,實際上都是在最小作用量原理的驅(qū)動下,自然而然地向著勢能更低、質(zhì)量更好的狀態(tài)流動。

這意味著,AI 能夠解決復雜問題,是因為它在海量參數(shù)中內(nèi)化出了一種全局的「直覺」,這也是科學家首次在 AI 生成過程中發(fā)現(xiàn)了不依賴于特定模型的宏觀物理定律。

這一發(fā)現(xiàn)將 AI 研究從「煉丹術」提升到了可量化的「物理科學」高度。通過驗證物理學中的「細致平衡」現(xiàn)象,該團隊證實了 AI 的思維跳躍并非無跡可尋,而是像熱力學平衡系統(tǒng)一樣有著嚴格的數(shù)學比例。

這讓我們可以用物理指標來給不同的大模型畫像;比如,研究發(fā)現(xiàn):

  1. Claude-4 像個急于交卷的優(yōu)等生,傾向于快速收斂到某個答案(勢井),但也容易固執(zhí)己見;
  2. GPT-5 Nano 則像個探險家,雖然收斂慢,但更愿意在狀態(tài)空間中多走走,探索未知的可能性。

這一理論框架讓我們可以用科學測量的手段去預測和控制 AI 的行為,而不再僅僅依賴盲目的工程試錯??雌饋?,也正如谷歌前些天的一篇論文展現(xiàn)的那樣(參閱報道《谷歌發(fā)布智能體 Scaling Law:180 組實驗打破傳統(tǒng)煉金術》),AI 智能體的研究不再只是簡單的工程實踐,而是正在提升為建立在有效測量基礎上的、可預測且可量化的科學。

下面具體來看看這個北大團隊究竟發(fā)現(xiàn)了什么。

理論

為了嚴謹?shù)乇硎鲞@一問題,該團隊研究的是一個核心由一個或多個 LLM 組成的智能體。

該智能體將其當前狀態(tài) f 作為輸入,通過一系列確定性的步驟對狀態(tài)進行組織和評估,從而生成一個相關的提示詞。隨后,該提示詞被輸入到一個或多個 LLM 中,其結(jié)構化的輸出經(jīng)解析后得到一個新的狀態(tài) g。該狀態(tài)是研究 LLM 動力學的最小單位。

這種生成過程可以被視為狀態(tài)空間 中的一個馬爾可夫轉(zhuǎn)移過程,其轉(zhuǎn)移核為 P (g|f),保留了 LLM 生成的多樣性和適應性。狀態(tài)由智能體在每個時間步保留的完整信息定義,這應當包含智能體執(zhí)行連續(xù)推理或類比過程所需的所有信息。在本文中,智能體僅包含 LLM 的單個生成步驟,記 (g←f)=P (g|f) 為智能體通過 LLM 生成從包含狀態(tài) f 的模板轉(zhuǎn)移到包含狀態(tài) g 的輸出的概率。

圖 1 為示意圖。



基于 LLM 的智能體的特征在于,其狀態(tài)轉(zhuǎn)移并非完全隨機,而是表現(xiàn)出某種結(jié)構化的偏好。

具體而言,智能體傾向于從當前狀態(tài) f 轉(zhuǎn)移到從智能體視角來看「更好」的狀態(tài) g。

為了捕捉這一現(xiàn)象,假設存在一個潛在的勢函數(shù) V_:→?,它為每個狀態(tài)分配一個標量值,以反映其「質(zhì)量」。由于特定的勢函數(shù)通常難以直接計算,研究者提出了一種有效估計該勢函數(shù)的方法。

給定一個全局勢函數(shù) V,研究者將智能體的給定轉(zhuǎn)移 (g←f) 對勢函數(shù)的違背定義為 K (V (f)?V (g)),其中 K (x) 是一個凸函數(shù),用于描述從狀態(tài) f 到狀態(tài) g 的轉(zhuǎn)移在多大程度上違背了勢函數(shù) V 的排序。為了量化智能體行為與勢函數(shù)之間的整體不匹配度,研究者以轉(zhuǎn)移核 (g←f) 為權重,將作用量 定義為全局平均違背:



其中 Df,Dg 是狀態(tài)空間上的測度。在本文中,研究者選擇 K (x)=exp (-βx/2) 作為描述給定狀態(tài)轉(zhuǎn)移 f 到 g 違背標量函數(shù) V 排序程度的凸函數(shù)。作用量 S 或 βV (f) 的分布形狀可以代表該狀態(tài)空間 C 內(nèi)智能體的全局認知能力。

研究者提出,若要利用勢函數(shù)量化 LLM 的行為,可以尋找一個使智能體轉(zhuǎn)移與勢函數(shù)之間的整體不匹配度最小化的勢函數(shù)。因此,描述給定狀態(tài)空間中基于 LLM 的智能體 最合適的勢函數(shù) V_ ,是那個能使作用量 S 最小化的函數(shù)。

這意味著作用量滿足關于勢函數(shù) V_ 的變分原理:



該變分條件等價于 V_ 滿足以下平衡條件:



這對所有 f∈C 成立,其中 K'(x)=dK/dx。

具體而言,如果對于所有轉(zhuǎn)移 (g←f)>0,,均有 V (f)≥V (g) 成立,則表明智能體的狀態(tài)轉(zhuǎn)移是完全有序的,在此情況下,V 充當李雅普諾夫函數(shù)。

值得注意的是,如果 描述的是一個平衡系統(tǒng)的轉(zhuǎn)移,其狀態(tài)轉(zhuǎn)移滿足細致平衡條件,即對于所有狀態(tài)對 (f,g),下式成立:



其中 π(f) 表示系統(tǒng)在狀態(tài) f 處的平衡分布,而 P (g|f) 表示轉(zhuǎn)移核。在這種情況下,存在一個勢函數(shù) V 可以明確地將細致平衡表示為:



代入 (3) 式,可以驗證該勢函數(shù) V=V_ 滿足最小作用量原理。這表明對于平衡系統(tǒng),如果存在細致平衡條件,則可以通過最小作用量原理估計其潛在的勢函數(shù)。在一般情況下,最小作用量僅僅是在尋求勢函數(shù)的最有序排列,從而最小化智能體狀態(tài)轉(zhuǎn)移對該排列的違背。

研究者指出,基于 LLM 的智能體在其 LLM 生成的狀態(tài)空間中,往往表現(xiàn)得像一個平衡系統(tǒng),該狀態(tài)空間相較于 LLM 完整的生成序列是粗?;?。這一現(xiàn)象的存在表明 LLM 生成動力學中存在一種不依賴于具體模型和任務細節(jié)的普遍宏觀規(guī)律。這表明,盡管看似無關,但在不同的 LLM 生成過程之間存在潛在的聯(lián)系,使我們能夠通過勢函數(shù) V_ 描述 LLM 生成中的全局有序性,從而為 LLM 的內(nèi)部動力學提供解釋。

結(jié)論與展望

在本文中,研究者提出了一種基于最小作用量原理的框架,旨在描述和分析基于 LLM 的智能體在其 LLM 生成的狀態(tài)空間中的生成動力學。

通過在多個不同模型和任務上的實驗驗證,研究者發(fā)現(xiàn)這些智能體的狀態(tài)轉(zhuǎn)移在很大程度上滿足細致平衡條件,這表明它們的生成動力學表現(xiàn)出類似于平衡系統(tǒng)的特征。研究者進一步通過最小作用量原理估計了底層的勢函數(shù),并揭示了其在捕捉 LLM 生成動力學內(nèi)在方向性方面的重要作用。

研究者對發(fā)現(xiàn) LLM 生成動力學中的宏觀規(guī)律進行了初步探索。

該團隊也展望了未來:「未來的工作可以進一步擴展這一框架,并探索利用更多來自平衡及近平衡系統(tǒng)的工具,以理解和優(yōu)化 LLM 的生成過程。例如,研究偏離平衡的程度可能有助于我們理解模型的過擬合水平,因為過擬合的模型可能會學習更多局部的策略集,而不是由勢函數(shù)支配的全局生成模式。此外,基于勢函數(shù)的優(yōu)化方法也可能為提高 LLM 任務相關生成的質(zhì)量和多樣性提供新思路,例如根據(jù)不同的安全性和探索需求調(diào)整不同幅度的作用量。」

更多技術細節(jié)請參閱原論文。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
97歲田華現(xiàn)狀曝光,和小孫子相依為命,住破舊老房子,日子清貧

97歲田華現(xiàn)狀曝光,和小孫子相依為命,住破舊老房子,日子清貧

以茶帶書
2025-12-02 18:11:43
1972年陳毅追悼會,江青故意無視宋慶齡,毛主席當場下一死命令,事后宋慶齡感慨:主席真聰明

1972年陳毅追悼會,江青故意無視宋慶齡,毛主席當場下一死命令,事后宋慶齡感慨:主席真聰明

寄史言志
2025-12-17 16:08:14
何炅也沒想到,《快本》停播僅4年,謝娜的主持界地位已高不可攀

何炅也沒想到,《快本》停播僅4年,謝娜的主持界地位已高不可攀

科學發(fā)掘
2025-12-22 01:45:34
杜江也沒想到,大他5歲的霍思燕會憑借一條狗,輕松實現(xiàn)口碑暴漲

杜江也沒想到,大他5歲的霍思燕會憑借一條狗,輕松實現(xiàn)口碑暴漲

凡知
2025-12-22 10:45:01
新加坡人評海南封關:比起海南的自貿(mào)港,我更怕中國幫泰國挖運河

新加坡人評海南封關:比起海南的自貿(mào)港,我更怕中國幫泰國挖運河

南宮一二
2025-12-23 18:37:37
老公駐派中東3年,我深夜給5歲女兒掖被角,她說:爸爸每天半夜來

老公駐派中東3年,我深夜給5歲女兒掖被角,她說:爸爸每天半夜來

朝暮書屋
2025-12-17 18:26:03
受權發(fā)布|中共中央辦公廳 國務院辦公廳印發(fā)《關于做好2026年元旦春節(jié)期間有關工作的通知》

受權發(fā)布|中共中央辦公廳 國務院辦公廳印發(fā)《關于做好2026年元旦春節(jié)期間有關工作的通知》

新華社
2025-12-22 17:18:17
一年拆52個村!廣州舊改發(fā)狠,雖遲但到!

一年拆52個村!廣州舊改發(fā)狠,雖遲但到!

廣州樓市發(fā)布
2025-12-23 20:06:54
遼寧推妻墜海案中,死者兒子案發(fā)后的舉動,才叫人頭皮發(fā)麻…

遼寧推妻墜海案中,死者兒子案發(fā)后的舉動,才叫人頭皮發(fā)麻…

媒體人溪婉
2024-11-29 13:57:59
一位在巴西開超市十年的老鄉(xiāng)說:當?shù)厝撕尬覀?,不是因為東西便宜

一位在巴西開超市十年的老鄉(xiāng)說:當?shù)厝撕尬覀?,不是因為東西便宜

南權先生
2025-12-13 16:51:47
回顧:河北一家慘遭滅門,4名女子體內(nèi)有同一人DNA,牽出兩代恩仇

回顧:河北一家慘遭滅門,4名女子體內(nèi)有同一人DNA,牽出兩代恩仇

歷來都很現(xiàn)實
2024-10-08 00:12:04
力壓BBA!成為獨一檔豪華車

力壓BBA!成為獨一檔豪華車

放毒
2025-12-23 16:45:34
羅永浩“錄音風波”未了,華與華兄弟實控的讀客文化要賣了,股東今年已套現(xiàn)超1億元

羅永浩“錄音風波”未了,華與華兄弟實控的讀客文化要賣了,股東今年已套現(xiàn)超1億元

紅星新聞
2025-12-23 14:23:12
“阿詩瑪”楊麗坤:精神失常后生下兩個兒子,丈夫用一生懷念她

“阿詩瑪”楊麗坤:精神失常后生下兩個兒子,丈夫用一生懷念她

小熊侃史
2025-12-19 11:04:19
張學良三個兒子瘋的瘋,死的死,都以為張家就要絕后,結(jié)局如何?

張學良三個兒子瘋的瘋,死的死,都以為張家就要絕后,結(jié)局如何?

古書記史
2025-12-12 11:32:56
機關事業(yè)單位退休人員,職業(yè)年金領完139個月后,還發(fā)嗎?

機關事業(yè)單位退休人員,職業(yè)年金領完139個月后,還發(fā)嗎?

小彬說事
2025-12-01 15:36:15
1948 年毛主席在五臺山遭遇行程中的小波折,與方丈交流時,對方以 “吉人自有天相” 送上順遂的祝愿

1948 年毛主席在五臺山遭遇行程中的小波折,與方丈交流時,對方以 “吉人自有天相” 送上順遂的祝愿

老杉說歷史
2025-12-23 19:30:41
小洛熙父母哭謝法醫(yī)劉良:你讓黑暗散去,我的天空星星都亮了!

小洛熙父母哭謝法醫(yī)劉良:你讓黑暗散去,我的天空星星都亮了!

苗苗情感說
2025-12-22 12:28:30
40多歲辭職創(chuàng)業(yè),成為深圳第二有錢的女人,又要IPO了?

40多歲辭職創(chuàng)業(yè),成為深圳第二有錢的女人,又要IPO了?

毒sir財經(jīng)
2025-12-22 21:24:05
“牡丹花下死,做鬼也風流”!如今,誰也救不了44歲的宋小寶

“牡丹花下死,做鬼也風流”!如今,誰也救不了44歲的宋小寶

墨印齋
2025-07-08 05:24:55
2025-12-23 23:12:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11980文章數(shù) 142518關注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強黑產(chǎn)攻擊

頭條要聞

特朗普稱出于國家安全"必須拿下格陵蘭島" 又扯上中俄

頭條要聞

特朗普稱出于國家安全"必須拿下格陵蘭島" 又扯上中俄

體育要聞

楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

娛樂要聞

朱孝天回應阿信感謝,自曝沒再收到邀約

財經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車要聞

四款新車集中發(fā)布 星途正式走進3.0時代

態(tài)度原創(chuàng)

健康
親子
房產(chǎn)
本地
家居

這些新療法,讓化療不再那么痛苦

親子要聞

年銷10億的兒童止咳藥,說明書增加:會導致“自殺傾向”

房產(chǎn)要聞

獨家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

本地新聞

云游安徽|宣城何以動人心,百年塔影一城徽韻

家居要聞

通透明亮 大氣輕奢風

無障礙瀏覽 進入關懷版 波多野结衣30分钟| 亚洲少妇精品视频一区二区三区| 国产极品无码在线看| 久久精品中文字幕有码| 欧美黑人欧美精品刺激| 无码久久av喷水av| 欧美成人电影二区| 人人莫人人操| 韩国不卡av| 妺妺窝人体色777777仙踪林| 亚洲成色www,久久网站| 手机看片日本在线观看视频| 国内精品乱码卡一卡2卡三卡| 精品亚洲国产成人| 久久久嗯啊爽| 日韩深夜福利视频在线观看 | 日韩精品久久一区二区三| 被喂春药蹂躏的欲仙欲死视频| 99久久精品国产免费| 国内免费av| 精品一卡2卡三卡4卡乱码精品视频| 精品国产精品国产偷麻豆| 看黄A大片爽爽影院免费无码| 成人内射国产免费观看| 国产噜噜噜| 男人天堂免费视频| qimi在线| 无码人妻丝袜在线视频| 国产精品视频亚洲无码良| 成人午夜激情视频| 国产熟女一区二区三区四区五区| 久草国产视频| 久久久久久91香蕉国产夜本色| 在线中文字幕日韩| 人妻色综合网| 日日夜夜天天| 欧美日韩中文在线字幕视频| 国产又粗又大又黄| www.国产无码.con| 久久理论片午夜琪琪电影网| 黄页网站在线观看免费视频|