夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

中美澳15位科學家定義AI新時代學科,揭示大模型存在根本性不對稱

0
分享至

還記得安德烈·卡帕西(Andrej Karpathy)在上個月帶火的上下文工程嗎?他曾盛贊上下文工程“是一門精心設計、科學填充上下文窗口的精密藝術?!?/p>


(來源:X)

時隔不到一個月,上下文工程更是被一眾科學家正式定義為一門學科。日前,來自中美澳累計 6 家高??蒲袡C構的 15 名研究人員,通過分析 1400 多篇研究論文,首次將上下文工程作為一門正式學科加以全面探討,并指出它能夠系統(tǒng)性地設計、優(yōu)化和管理大模型的信息有效載荷。


(來源:https://arxiv.org/pdf/2507.13334)

論文作者們分別來自中國科學院計算技術研究所、美國加利福尼亞大學默塞德分校、澳大利亞昆士蘭大學、北京大學、清華大學和中國科學院大學。論文中,研究人員將上下文工程確立為開發(fā)復雜 AI 系統(tǒng)的關鍵基礎,并指出這類復雜 AI 系統(tǒng)的特征在于能夠有效整合外部知識、維持持久記憶,以及能與復雜環(huán)境進行動態(tài)交互。

本次研究的主要貢獻在于提出了一個統(tǒng)一的分類框架,該框架將上下文工程技術分為基礎組件和系統(tǒng)實現(xiàn)方法兩大塊。通過這一系統(tǒng)性的研究,他們得出了以下關鍵見解。

  • 第一,盡管大模型在理解復雜語境上有著出色表現(xiàn),但是在生成同樣復雜的輸出時卻存在局限性,而這兩者之間存在根本性的不對稱,這種理解與生成之間的差距是大模型領域面臨的最關鍵挑戰(zhàn)之一。
  • 第二,本次研究表明多種技術正在以日益復雜的方式進行協(xié)同融合,這種集成模式所產生的綜合能力已經超越各獨立組件的簡單疊加。研究人員所觀察到一個明顯趨勢是:模塊化和組合性不斷增強,使得架構能夠靈活適應各種應用,同時還能保持系統(tǒng)的一致性。

總的來說,通過系統(tǒng)地分析 1400 多篇論文,本次綜述論文不僅為該領域確立了技術路線圖,還揭示了一個關鍵的研究空白:即模型能力之間存在根本性的不對稱。盡管當前模型通過先進的上下文工程得到了增強,在理解復雜上下文方面也有著出色表現(xiàn),但在生成同樣復雜的長篇輸出時卻存在明顯的局限性,而填補這一空白是未來領域內的首要任務。


(來源:https://arxiv.org/pdf/2507.13334)



將上下文工程進行概念化

很多人都知道,大模型的性能和效能從根本上取決于它們所接收的上下文。這種上下文——從簡單的指令提示到復雜的外部知識庫,是引導其行為、擴充其知識和釋放其能力的主要機制。隨著大模型從基本的“指令遵循系統(tǒng)”演變?yōu)閺碗s應用的“核心推理引擎”,設計和管理其信息載荷的方法也相應地演變?yōu)樯舷挛墓こ踢@樣一門正式學科。

當前,上下文工程領域正以爆炸性的速度擴展,催生了眾多專業(yè)且分散的研究方向。如前所述,研究人員將這一領域進行了概念化,進而指出上下文工程由以下兩個部分組成:基礎組件和系統(tǒng)實現(xiàn)方法。

基礎組件通過三個關鍵階段構成了上下文工程的系統(tǒng)性流程:

1.第一個階段是上下文檢索與生成,包括基于提示的生成和外部知識獲?。?/p>

2.第二個階段是上下文處理,這涉及到長序列處理、自我完善機制和結構化信息整合;

3.第三個階段是上下文管理,這涉及到內存層次結構、壓縮技術和優(yōu)化策略。

這些基礎組件催生了更復雜的面向應用的實現(xiàn)方式,進一步地這些實現(xiàn)方式能夠將大模型與外部現(xiàn)實聯(lián)系起來。

系統(tǒng)實現(xiàn)方法主要包括:

1.第一種是高級檢索增強生成,該技術目前已經發(fā)展為模塊化、智能體驅動的架構,能被用于動態(tài)知識注入;

2.第二種是模擬人類認知能力以便實現(xiàn)持久信息保留的顯性內存系統(tǒng);

3.第三種工具集成推理,它能將模型從被動的文本生成器轉變?yōu)槟軌騽討B(tài)利用工具和操縱環(huán)境的主動世界交互者。這種實現(xiàn)方式使模型能夠通過函數調用機制、集成推理框架和復雜的環(huán)境交互能力,突破其固有的局限性。

4.第四種是基于智能體系統(tǒng)的完整生態(tài)系統(tǒng),這種技術代表著目前上下文工程的巔峰技術,它能讓智能體利用函數調用和工具集成推理來與世界進行交互,并能夠通過依賴于復雜的智能體通信協(xié)議和上下文編排,進而在多智能體配置中實現(xiàn)復雜目標。


(來源:https://arxiv.org/pdf/2507.13334)



上下文工程的基礎組件、系統(tǒng)實現(xiàn)和評估

研究人員指出,當前大模型領域的碎片化發(fā)展掩蓋了技術之間的根本聯(lián)系,也給業(yè)內人士帶來了研究障礙和使用障礙。因此,該領域迫切需要一個統(tǒng)一的框架來系統(tǒng)性地整合這些技術,進而闡明其基本原理,以及揭示它們之間的相互依賴關系。

隨著大模型從簡單的指令遵循系統(tǒng)演變?yōu)閺碗s、多應用的核心推理引擎,與之交互的方法也必須隨之發(fā)展。

研究人員認為,提示工程固然很重要,但是已經無法全面涵蓋現(xiàn)代 AI 系統(tǒng)所需的信息載荷的設計、管理和優(yōu)化。關于此,在本文開頭的 X 貼文截圖中卡帕西也表達了類似觀點。原因在于,這些 AI 系統(tǒng)并非基于單一、靜態(tài)的文本字符串進行操作,它們利用的是動態(tài)、結構化且多方面的信息流。為了彌補這一關鍵空白,本次綜述論文首次針對大模型的上下文工程進行了全面且系統(tǒng)的回顧,同時引入并規(guī)范了上下文工程這一學科。

如前所述,上下文工程建立在三個基本組件之上,這些組件能夠共同應對大模型中信息管理的核心挑戰(zhàn):

  • 上下文檢索與生成,它通過提示工程、外部知識檢索和動態(tài)上下文組裝來獲取適當的上下文信息;
  • 上下文處理,它通過長序列處理、自我優(yōu)化機制和結構化數據整合,來針對獲取的信息進行轉換和優(yōu)化;
  • 上下文管理,它通過解決基本約束、實施復雜的內存層次結構以及開發(fā)壓縮技術,來處理上下文信息的有效組織和利用。

這些基礎組件為所有上下文工程的實施奠定了理論和實踐基礎,并能形成一個全面的框架。其中,每個組件都能處理上下文工程流程的不同方面,同時各組件之間保持協(xié)同關系,從而實現(xiàn)全面的上下文優(yōu)化和有效的上下文工程策略。

基于上下文工程的基礎組件,研究人員探討了復雜的系統(tǒng)實現(xiàn)方式,這些實現(xiàn)方式可以將上述組件整合到實用的智能架構中,同時這些實現(xiàn)代表了從理論框架到可部署系統(tǒng)的演進。

如前所述,研究人員提出了四類系統(tǒng)實現(xiàn)方式:

  • 第一類實現(xiàn)方式是檢索增強生成系統(tǒng),它通過模塊化架構和圖增強方法實現(xiàn)外部知識的整合。
  • 第二類實現(xiàn)方式是內存系統(tǒng),它通過復雜的內存架構展示了持續(xù)的上下文管理,從而能夠支持長期學習。
  • 第三類實現(xiàn)方式是工具集成推理,它通過函數調用和環(huán)境交互,將語言模型轉化為能夠與世界交互的實體。
  • 第四類實現(xiàn)方式是多智能體系統(tǒng),它通過通信協(xié)議和編排機制呈現(xiàn)出協(xié)調一致的方法。

以上四類實現(xiàn)方式中的每一個都基于基礎組件構建,同時解決了上下文利用中的特定挑戰(zhàn),展示了理論原則轉化為實際系統(tǒng)的背后原理。


(來源:https://arxiv.org/pdf/2507.13334)



“AI 模型的性能本質上取決于上下文信息”

研究人員指出,當前上下文工程正處于一個關鍵的轉折點,當前這種基礎進展與新興應用需求相融合的階段,既創(chuàng)造了前所未有的創(chuàng)新機遇,也暴露出了一些必須在多個維度開展持續(xù)研究才能解決的根本性挑戰(zhàn)。

隨著該領域逐漸從孤立的組件開發(fā)向集成系統(tǒng)架構過渡,一些研究難題的復雜性也會呈現(xiàn)指數級的增長,因此需要采用跨學科的方法,將理論計算機科學、實用系統(tǒng)工程和特定領域專業(yè)知識結合起來。

基于此,研究人員通過本次論文為 AI 從業(yè)者提供了一個統(tǒng)一的框架。與此同時,研究人員通過本次研究所發(fā)現(xiàn)的大模型評估挑戰(zhàn),凸顯了該領域對于全面評估框架的需求,這類全面評估框架需要能夠捕捉上下文工程系統(tǒng)所展現(xiàn)出的復雜、動態(tài)的行為。因此,傳統(tǒng)評估方法對于多組件集成、具有自適應行為且長期持續(xù)運行的大模型來說已經顯得力不從心。但在這之中也蘊含著一些重大機遇,比如未來人們可以開發(fā)用于高效長上下文處理的下一代架構、構建智能上下文組裝系統(tǒng),以及打造多智能體的協(xié)調機制等。

總的來說,本次綜述論文不僅呈現(xiàn)了該領域的一些現(xiàn)狀,也為未來研究提供了路線圖,并將上下文工程確立為一門獨立學科,它的獨立性體現(xiàn)在它擁有獨屬于自身的原則、方法和挑戰(zhàn),能夠推動并支持具有上下文感知能力的AI 模型實現(xiàn)“負責任”的發(fā)展。

而隨著大模型的不斷發(fā)展,“AI 模型的性能本質上取決于上下文信息”的這一關于上下文工程的核心洞見,仍將在 AI 模型的發(fā)展中占據關鍵地位。未來,隨著 AI 模型逐漸朝著復雜的多組件系統(tǒng)發(fā)展,上下文工程有望在 AI 發(fā)展中扮演日益核心的角色。而上下文工程的跨學科性質,即其涵蓋計算機科學、認知科學、語言學以及特定領域專業(yè)知識的特點,也要求人們必須采取跨領域合作的方法來將 AI 之路走寬走遠。

參考資料:

https://arxiv.org/pdf/2507.13334

https://x.com/karpathy

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
逆停堵路女子“社死”:車牌被扒更多黑料曝光小作文賣慘無人買賬

逆停堵路女子“社死”:車牌被扒更多黑料曝光小作文賣慘無人買賬

紀中百大事
2025-08-11 16:16:44
男籃亞洲杯淘汰賽對陣出爐!中國隊避開3大苦主:郭士強賺翻了?

男籃亞洲杯淘汰賽對陣出爐!中國隊避開3大苦主:郭士強賺翻了?

籃球快餐車
2025-08-11 15:08:42
誣陷撞人反轉!新證據曝光,律師分析,女子不止交通違規(guī)那么簡單

誣陷撞人反轉!新證據曝光,律師分析,女子不止交通違規(guī)那么簡單

云景侃記
2025-08-11 11:27:55
北大醫(yī)學專家胡大一:睡覺,一個讓你延長生命的革命性新秘方

北大醫(yī)學專家胡大一:睡覺,一個讓你延長生命的革命性新秘方

深度報
2025-08-10 22:19:26
魏建軍談理想i8對撞大卡車:我們那車不敢去

魏建軍談理想i8對撞大卡車:我們那車不敢去

超角度
2025-08-11 20:35:11
湖南衛(wèi)視首播左宗棠紀錄片,“禁區(qū)”解凍背后有何深意?

湖南衛(wèi)視首播左宗棠紀錄片,“禁區(qū)”解凍背后有何深意?

老吳教育課堂
2025-08-12 02:58:20
洗衣機長蘑菇,冰箱塞襪子?管樂的家太亂,卻靠演技殺成頂流

洗衣機長蘑菇,冰箱塞襪子?管樂的家太亂,卻靠演技殺成頂流

娛樂白名單
2025-08-12 09:45:19
這位50歲阿姨火了!健身跑步20年,這顏值和身材吊打少女!

這位50歲阿姨火了!健身跑步20年,這顏值和身材吊打少女!

馬拉松跑步健身
2025-08-11 06:30:09
王晶揭秘趙文卓、梅艷芳分手真正原因:朋友叫他卓卓,暗指小狼狗

王晶揭秘趙文卓、梅艷芳分手真正原因:朋友叫他卓卓,暗指小狼狗

喜歡歷史的阿繁
2025-08-12 01:47:55
CCTV5直播,中國男籃亞洲杯八進四VS韓國男籃,郭士強沖擊四強!

CCTV5直播,中國男籃亞洲杯八進四VS韓國男籃,郭士強沖擊四強!

體壇小快靈
2025-08-11 11:38:32
世界首次五百強斷崖差距:日本149家,美國151家,中國3家,現(xiàn)在呢

世界首次五百強斷崖差距:日本149家,美國151家,中國3家,現(xiàn)在呢

壹知眠羊
2025-08-11 19:22:17
方媛在家待產,穿衣服要消毒、腳脖子腫一圈,郭富城給她買按摩椅

方媛在家待產,穿衣服要消毒、腳脖子腫一圈,郭富城給她買按摩椅

瘋說時尚
2025-08-12 10:00:08
一位日本老兵的自述:南京城淪陷后,城內婦女都有著怎么樣的遭遇

一位日本老兵的自述:南京城淪陷后,城內婦女都有著怎么樣的遭遇

小莜讀史
2025-08-11 23:59:49
9月15日社保新規(guī),這6類人不用交社保,公司老板記得提前了解

9月15日社保新規(guī),這6類人不用交社保,公司老板記得提前了解

小談食刻美食
2025-08-11 17:52:38
文章開大G被偶遇 姚笛疑坐副駕

文章開大G被偶遇 姚笛疑坐副駕

大象新聞
2025-08-11 10:30:04
900億的“糊涂賬”,終于開始清算了,已經有人被抓

900億的“糊涂賬”,終于開始清算了,已經有人被抓

毒sir財經
2025-08-11 22:37:49
不裝了!央視主持人龍洋新身份曝光,36歲的她早已走上另一條道路

不裝了!央視主持人龍洋新身份曝光,36歲的她早已走上另一條道路

可樂談情感
2025-08-12 06:53:35
斯諾克沙特大師賽32強全部誕生,中國球員8人,1/16比賽對陣出爐

斯諾克沙特大師賽32強全部誕生,中國球員8人,1/16比賽對陣出爐

郝小小看體育
2025-08-12 04:30:25
有一種“反噬”叫傅首爾和老劉,離婚一年半,兩人的境遇天翻地覆

有一種“反噬”叫傅首爾和老劉,離婚一年半,兩人的境遇天翻地覆

小丸子的娛樂圈
2025-08-10 09:45:03
居然給烏克蘭現(xiàn)政府定義成“偽政府”?估計全世界也只有高志凱…

居然給烏克蘭現(xiàn)政府定義成“偽政府”?估計全世界也只有高志凱…

翻開歷史和現(xiàn)實
2025-08-11 11:29:12
2025-08-12 11:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15512文章數 513973關注度
往期回顧 全部

科技要聞

特朗普考慮允許英偉達向中國出售Blackwell

頭條要聞

牛彈琴:特朗普釋放的最新信號 讓歐洲人倒吸一口涼氣

頭條要聞

牛彈琴:特朗普釋放的最新信號 讓歐洲人倒吸一口涼氣

體育要聞

戰(zhàn)勝王楚欽 張本智賽后脫衣瘋狂慶祝

娛樂要聞

文章大G車副駕疑姚笛 舊人重逢引猜測

財經要聞

重磅!中美再次暫停實施24%的關稅90天

汽車要聞

8月13日預售/8月底上市 全新嵐圖知音開啟發(fā)運

態(tài)度原創(chuàng)

手機
家居
數碼
藝術
公開課

手機要聞

小米 REDMI Note 15 Pro 系列官宣本月發(fā)布,現(xiàn)已開啟預約

家居要聞

現(xiàn)代溫馨 灰咖營造現(xiàn)代感

數碼要聞

英偉達補充兩款雙槽半高 RTX PRO 專業(yè)顯卡,為 4000 SFF 和 2000

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 亚洲一区二区三区啪啪| 尤物黄页在线观看| 国产AV无区亚洲AV麻豆| 国精产品一区二区在线| 五月天俺也去婷婷| 大屁股熟女系列| 大奶一区二区| 久久精品—区二区三区无码伊人色| 在健身房被C到高潮视频| 偷拍视频HD| 亚洲欧美日韩国产综合一区二区 | 疯狂做受XXXX高潮久久| 少妇高潮a视频| 人妻videos人妻| 暴操人妻av| 重口sm一区二区三区视频| 欧美日屄视频| 视一乱一交一做一爱 | 丁香六月久久婷婷开心| 全免费又大粗又黄又爽少妇片| 免费无码专区AV| 人人狠狠综合久久亚洲| 桃色精品视频在线| 亚洲国产精品久久久天堂麻豆宅男| 少妇影院111| 四川熟女白浆| ,丰满少妇A级毛片| 内射尤物国产| 免费毛片在线| 性色av无码一区二区三区人妻| 一本之道久久久| 法国极品成人H版| 日韩一区二区不卡黄色伦理电影| 亚洲中文字幕精品久久久久久动漫| 久久人人爽人人爽人人片av超碰| 暴操人妻av| 2023国产精品自拍视频| 激情欧美成人久久综合| 无码电影中文字幕| 欧区一区二区三高清在线观看| 国产裸体舞一区二区三区|