文章轉(zhuǎn)載自「INDIGO 科技加速站」
Anthropic 工程師 Barry Zhang 在 AI Engineer 工作坊上的一個(gè)分享 “如何構(gòu)建有效的 Agent”,其中印象最深的一個(gè)觀點(diǎn):Don't build agents for everything,反過(guò)來(lái)理解就是別做什么都能干的 Agent,那是我們大模型要干的事情
構(gòu)建有效 Agent 的三大要點(diǎn):
明智選擇應(yīng)用場(chǎng)景,并非所有任務(wù)都需要 Agent
找到合適的用例后,盡可能長(zhǎng)時(shí)間地保持系統(tǒng)簡(jiǎn)單
在迭代過(guò)程中,嘗試從 Agent 的視角思考,理解其局限并提供幫助
Barry 主要負(fù)責(zé) Agentic System,演講內(nèi)容基于他和 Eric 合著的一篇博文,下面詳細(xì)總結(jié)他們的核心觀點(diǎn),以及對(duì) Agent 系統(tǒng)的演進(jìn)和未來(lái)的思考。
Agent 系統(tǒng)的演進(jìn)
簡(jiǎn)單功能(Simple Features):起初是簡(jiǎn)單的任務(wù),如摘要、分類、提取,這些在幾年前看似神奇,現(xiàn)在已成為基礎(chǔ)。
工作流(Workflows):隨著模型和產(chǎn)品成熟,開(kāi)始編排多個(gè)模型調(diào)用,形成預(yù)定義的控制流,以犧牲成本和延遲換取更好性能。這被認(rèn)為是 Agent 系統(tǒng)的前身。
Agent:當(dāng)前階段,模型能力更強(qiáng),領(lǐng)域特定的 Agent 開(kāi)始出現(xiàn)。與工作流不同,Agent 可以根據(jù)環(huán)境反饋?zhàn)灾鳑Q定行動(dòng)路徑,幾乎獨(dú)立運(yùn)作。
未來(lái)(猜測(cè)):可能是更通用的單一 Agent,或多 Agent 協(xié)作。趨勢(shì)是賦予系統(tǒng)更多自主權(quán),使其更強(qiáng)大有用,但也伴隨著更高的成本、延遲和錯(cuò)誤后果。
Founder Park 正在搭建開(kāi)發(fā)者社群,邀請(qǐng)積極嘗試、測(cè)試新模型、新技術(shù)的開(kāi)發(fā)者、創(chuàng)業(yè)者們加入,請(qǐng)掃碼詳細(xì)填寫你的產(chǎn)品/項(xiàng)目信息,通過(guò)審核后工作人員會(huì)拉你入群~
進(jìn)群之后,你有機(jī)會(huì)得到:
高濃度的主流模型(如 DeepSeek 等)開(kāi)發(fā)交流;
資源對(duì)接,與 API、云廠商、模型廠商直接交流反饋的機(jī)會(huì);
好用、有趣的產(chǎn)品/案例,F(xiàn)ounder Park 會(huì)主動(dòng)做宣傳。
01并非所有場(chǎng)景都適合構(gòu)建 Agent(Don't build agents for everything)
Agent 主要用于擴(kuò)展復(fù)雜且有價(jià)值的任務(wù),它們成本高、延遲高,不應(yīng)作為所有用例的直接升級(jí)。對(duì)于可以清晰映射決策樹(shù)的任務(wù),顯式構(gòu)建工作流(Workflow)更具成本效益和可控性。
何時(shí)構(gòu)建 Agent 的檢查清單:
任務(wù)復(fù)雜度 (Complexity):Agent 擅長(zhǎng)處理模糊的問(wèn)題空間。如果決策路徑清晰,應(yīng)優(yōu)先選擇工作流。
任務(wù)價(jià)值 (Value):Agent 的探索性行為會(huì)消耗大量 token,任務(wù)的價(jià)值必須能證明其成本。對(duì)于預(yù)算有限(如每任務(wù) 10 美分)或高容量(如客服)場(chǎng)景,工作流可能更合適。
關(guān)鍵能力的可行性 (Derisk Critical Capabilities):需確保 Agent 在關(guān)鍵環(huán)節(jié)(如編碼 Agent 的編寫、調(diào)試、錯(cuò)誤恢復(fù)能力)不存在嚴(yán)重瓶頸,否則會(huì)顯著增加成本和延遲。如有瓶頸,應(yīng)簡(jiǎn)化任務(wù)范圍。
錯(cuò)誤成本與發(fā)現(xiàn)難度 (Cost of Error & Error Discovery):如果錯(cuò)誤代價(jià)高昂且難以發(fā)現(xiàn),就很難信任 Agent 自主行動(dòng)。可以通過(guò)限制范圍(如只讀權(quán)限、增加人工干預(yù))來(lái)緩解,但這也會(huì)限制其擴(kuò)展性。
編碼(Coding)是一個(gè)很好的 Agent 用例,因?yàn)樗蝿?wù)復(fù)雜(從設(shè)計(jì)文檔到 PR)、價(jià)值高、現(xiàn)有模型(如 Claude)在許多環(huán)節(jié)表現(xiàn)良好,且結(jié)果易于驗(yàn)證(單元測(cè)試、CI)。
02保持簡(jiǎn)單 (Keep it simple)
Agent 的核心結(jié)構(gòu):
模型(Model)+ 工具(Tools)+ 循環(huán)(Loop)在一個(gè)環(huán)境(Environment)中運(yùn)作。
三個(gè)關(guān)鍵組成部分:
1.環(huán)境 (Environment):Agent 操作所在的系統(tǒng)。
2.工具集 (Tools):Agent 采取行動(dòng)和獲取反饋的接口。
3.系統(tǒng)提示 (System Prompt):定義 Agent 的目標(biāo)、約束和理想行為。
迭代方法:
優(yōu)先構(gòu)建和迭代這三個(gè)基本組件,能獲得最高的投資回報(bào)率。避免一開(kāi)始就過(guò)度復(fù)雜化,這會(huì)扼殺迭代速度。優(yōu)化(如緩存軌跡、并行化工具調(diào)用、改進(jìn)用戶界面以增強(qiáng)信任)應(yīng)在基本行為確定后再進(jìn)行。
一致性:
盡管不同 Agent 應(yīng)用(編碼、搜索、計(jì)算機(jī)使用)在產(chǎn)品層面、范圍和能力上看起來(lái)不同,但它們共享幾乎相同的簡(jiǎn)單后端架構(gòu)。
03像 Agent 一樣思考(Think like your agents)
問(wèn)題:
開(kāi)發(fā)者常從自身角度出發(fā),難以理解 Agent 為何會(huì)犯看似反常的錯(cuò)誤。
解決方法:
將自己置于 Agent 的“上下文窗口”中。Agent 在每一步的決策都基于有限的上下文信息(如 10k-20k token)。
換位思考練習(xí):
嘗試從 Agent 的視角完成任務(wù),體驗(yàn)其局限性(例如,只能看到靜態(tài)截圖,在推理和工具執(zhí)行期間如同“閉眼”操作)。這有助于發(fā)現(xiàn) Agent 真正需要哪些信息(如屏幕分辨率、推薦操作、限制條件)以避免不必要的探索。
利用模型自身:
可以直接詢問(wèn)模型(如 Claude):指令是否模糊?是否理解工具描述?為什么做出某個(gè)決策?如何幫助它做出更好的決策?這有助于彌合開(kāi)發(fā)者與 Agent 之間的理解差距。
04個(gè)人思考與未來(lái)展望
1. 預(yù)算感知 Agent (Budget-aware Agents):
需要更好地控制 Agent 的成本和延遲,定義和強(qiáng)制執(zhí)行時(shí)間、金錢、token 預(yù)算,以便在生產(chǎn)環(huán)境中更廣泛地部署。
2. 自進(jìn)化工具 (Self-evolving Tools):
Agent 或許能設(shè)計(jì)和改進(jìn)自己的工具(元工具),使其更具通用性,能適應(yīng)不同用例的需求。
3. 多 Agent 協(xié)作 (Multi-agent Collaboration):
預(yù)計(jì)今年年底將在生產(chǎn)中看到更多多 Agent 系統(tǒng)。其優(yōu)勢(shì)包括并行化、關(guān)注點(diǎn)分離、保護(hù)主 Agent 上下文窗口等。關(guān)鍵挑戰(zhàn)在于 Agent 間的通信方式,如何實(shí)現(xiàn)異步通信,超越當(dāng)前的用戶-助手輪流模式。
引用鏈接:
[1]
How We Built Effective Agents: Barry Zhang, Anthropic: https://youtu.be/D7_ipDqhtwk?si=atqYQAuvl0xWwrcH
轉(zhuǎn)載原創(chuàng)文章請(qǐng)?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.