嘿,大家好!這里是一個專注于前沿AI和智能體的頻道~
今天給家人們分享一下,2025 AI Agents的六大趨勢、Multi-Agents的協(xié)作架構(gòu)、Agent的自主L1 ~ L5等級 ~
趨勢一:DeepResearch Agent —— 任務(wù)從執(zhí)行到拆解與監(jiān)督
我們最熟悉的Agent模式是接收一個任務(wù),然后自己從頭干到尾。
DeepResearch的玩法變了,它引入了一個Manager的角色。
Manager 不親自干活,核心任務(wù)是兩件事:
拆解任務(wù): 把一個復(fù)雜問題(比如“分析Q3季度AI Agent行業(yè)報告”)拆解成一堆更小的、可以獨(dú)立執(zhí)行的子任務(wù)(文獻(xiàn)檢索、數(shù)據(jù)驗(yàn)證、圖表生成、摘要撰寫等)。
監(jiān)督與整合: 把這些子任務(wù)派發(fā)給不同的“專家Agent”,然后監(jiān)督它們的工作,最后將結(jié)果整合成一份完整的報告。

Anthropic 的 Deep Research,就是用的這種 Orchestrator-Workers 模式。
主Agent(Opus 4)負(fù)責(zé)策略制定和任務(wù)分配,子Agent(Sonnet 4)負(fù)責(zé)并行執(zhí)行,性能直接提升了90%以上。
趨勢二:Coding Agents —— 從單人開發(fā)到AI軟件團(tuán)隊(duì)
編程可能是Agent最快落地的領(lǐng)域。單個Coding Agent也許能寫一個函數(shù)或修復(fù)一個bug,但面對整個軟件生命周期(需求、設(shè)計(jì)、編碼、測試、部署)就有一點(diǎn)扛不住了。
所以大家都在說,未來的AI編程,會是一個AI Team:
產(chǎn)品經(jīng)理Agent: 負(fù)責(zé)理解需求,編寫PRD。
架構(gòu)師Agent: 設(shè)計(jì)系統(tǒng)架構(gòu)和技術(shù)選型。
程序員Agent: 編寫具體的代碼。
測試工程師Agent: 編寫單元測試和集成測試。
運(yùn)維工程師Agent: 負(fù)責(zé)部署和監(jiān)控。

這種協(xié)同工作的模式,讓AI真正有能力端到端地交付一個完整的軟件項(xiàng)目,而不再只是個高級的代碼補(bǔ)全工具。
趨勢三:CUA (Computer Using Agents) —— 桌面不再是界面,而是可編程環(huán)境
讓Agent操作我們的電腦,一直是行業(yè)的終極目標(biāo)之一。但單一Agent學(xué)習(xí)操作無數(shù)軟件的成本極高,而且非常脆弱。
一個新思路是:為不同的任務(wù)和軟件訓(xùn)練專門的Agent。
一個 Excel Agent ,精通所有表格操作和數(shù)據(jù)透視。
一個 Photoshop Agent ,擅長圖像處理和設(shè)計(jì)。
一個 瀏覽器Agent ,負(fù)責(zé)信息檢索和在線操作。
當(dāng)一個復(fù)雜任務(wù)(比如“從網(wǎng)頁下載數(shù)據(jù),整理到Excel,然后做成PPT”)下達(dá)時,一個“總管Agent”會依次調(diào)用這些“專家Agent”來接力完成。
趨勢四:Agentic RAG —— RAG已死,可反思、可規(guī)劃的檢索當(dāng)立
傳統(tǒng)的RAG就是個“問-查-答”的單向過程,AI無法判斷檢索到的內(nèi)容是否準(zhǔn)確或充分。
Agentic RAG則是一個動態(tài)的、可反思的多Agent流程:
查詢Agent: 負(fù)責(zé)理解用戶問題,并將其轉(zhuǎn)化為多個檢索查詢。
檢索Agent: 并行執(zhí)行查詢,從多個數(shù)據(jù)源獲取信息。
評估Agent: 評估檢索結(jié)果的質(zhì)量和相關(guān)性,如果信息不足,會要求“查詢Agent”重新生成查詢。
總結(jié)Agent: 基于篩選后的高質(zhì)量信息,生成最終答案。
這個過程引入了規(guī)劃、執(zhí)行、反思的閉環(huán),讓信息檢索的可靠性發(fā)生了質(zhì)的飛躍。
趨勢五:Agent Protocols —— 讓AI們說同一種語言
當(dāng)成千上萬的Agent需要協(xié)作時,必須有一套統(tǒng)一的“溝通協(xié)議”,就像互聯(lián)網(wǎng)的TCP/IP一樣。這就是Agent Protocols要解決的問題。
無論是OpenAI的MCP,還是Google的A2A,它們都在嘗試定義一套標(biāo)準(zhǔn),讓不同的Agent能夠:
互相發(fā)現(xiàn) (Discovery): 知道彼此的存在和能力。
任務(wù)分配 (Task Assignment): 清晰地傳遞任務(wù)和上下文。
數(shù)據(jù)交換 (Data Exchange): 安全、高效地共享信息和狀態(tài)。
未來的語音交互,不會是一個孤立的AI在回答你。當(dāng)你開車時,一個多Agent語音系統(tǒng)可能正在協(xié)作:
感知Agent: 負(fù)責(zé)將你的語音轉(zhuǎn)化為文本,并理解意圖。
導(dǎo)航Agent: 實(shí)時規(guī)劃路線。
通訊Agent: 幫你撥打電話或回復(fù)消息。
娛樂Agent: 控制音樂播放。
它們在一個共享的上下文中無縫協(xié)作,提供的是一種情景感知、主動服務(wù)的環(huán)境智能,這與Siri、小愛同學(xué)這類被動響應(yīng)的“語音助手”有本質(zhì)區(qū)別。
Multi-Agent的協(xié)作架構(gòu)
那么,這些Agent們到底是如何協(xié)同工作的呢?微軟Azure和Anthropic給出了幾乎一致的答案,我們可以將其歸納為五種核心編排模式。
1. Sequential Orchestration: 像工廠流水線,每個Agent處理上一個Agent的輸出。適用于“起草-審查-潤色”這類線性工作流。
2. Concurrent Orchestration: 多個Agent同時處理同一個任務(wù),從不同角度提供見解(比如技術(shù)、商業(yè)、創(chuàng)意),然后匯總。
3.Group Chat Orchestration: 所有Agent在一個共享的對話中協(xié)作,由一個“聊天管理器”協(xié)調(diào)流程,適合頭腦風(fēng)暴或復(fù)雜問題決策。
4. Handoff Orchestration: 任務(wù)在一個Agent網(wǎng)絡(luò)中動態(tài)傳遞,每個Agent評估任務(wù)后,決定是自己處理還是移交給更合適的Agent,非常適合復(fù)雜的客戶服務(wù)場景。
5. Magentic Orchestration: 專為開放式、無預(yù)定解決方案的復(fù)雜問題設(shè)計(jì)。一個“經(jīng)理Agent”會動態(tài)構(gòu)建和完善任務(wù)列表,并與“專家Agent”協(xié)作來制定和執(zhí)行計(jì)劃。
Agent的治理與風(fēng)險
當(dāng)Agent可以自主行動時,一個終極問題浮出水面:我們?nèi)绾慰刂扑鼈儯?/p>
華盛頓大學(xué)在2025年的一篇論文中,提出了一個“AI自治五級”框架,它不關(guān)注Agent的能力,只關(guān)注用戶在交互中的角色。
Levels of Autonomy
L1 操作員 (Operator): 人類完全控制,AI僅提供建議或執(zhí)行單步操作。
L2 協(xié)作者 (Collaborator): 人機(jī)協(xié)同,多輪溝通,動態(tài)分配任務(wù)。
L3 顧問 (Consultant): AI主動規(guī)劃和執(zhí)行,人類提供反饋和方向。
L4 審批者 (Approver): AI幾乎完全獨(dú)立,僅在關(guān)鍵節(jié)點(diǎn)尋求人類批準(zhǔn)。
L5 觀察者 (Observer): AI完全自主,人類僅監(jiān)督和擁有“緊急停止按鈕”。
2025年,AI Agent領(lǐng)域最激動人心的故事,不再是關(guān)于某個模型跑分又提升了多少,而是關(guān)于智能體之間如何形成高效、可靠的協(xié)作。
從DeepResearch的任務(wù)拆解,到Coding Agent的軟件團(tuán)隊(duì)...
我們正在見證智能體時代的到來。
好了,這就是我今天想分享的內(nèi)容。如果你對構(gòu)建AI智能體感興趣,別忘了點(diǎn)贊、關(guān)注噢~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.