智東西
作者 陳駿達(dá)
編輯 漠影
“我的數(shù)據(jù)庫……沒了?”
今年7月,一位名為“Jason”的網(wǎng)友在X平臺上分享了一場Vibe Coding災(zāi)難。他在開發(fā)平臺Replit上使用其內(nèi)置的Agent輔助編程,在一次操作中,Agent在沒有明確用戶指令的情況下,竟錯誤地執(zhí)行了一個致命的數(shù)據(jù)庫命令。
頃刻之間,他長達(dá)80小時的工作成果被清空。這無異于一位本應(yīng)協(xié)助你的“數(shù)字員工”,在未經(jīng)允許的情況下,走進(jìn)你的辦公室,將你寫了數(shù)周的項(xiàng)目資料全部扔進(jìn)了碎紙機(jī)。
Jason的遭遇絕非孤例,這揭示了Agent從原型演示到投入生產(chǎn)環(huán)境之間尚未跨越的鴻溝,即底層基礎(chǔ)設(shè)施(Infra)的缺失。
當(dāng)前,AI模型正在從被動的問答工具,轉(zhuǎn)變?yōu)槟軌蜃灾饕?guī)劃、執(zhí)行任務(wù)的Agent數(shù)字員工。然而,如何為這些員工提供足夠強(qiáng)大的算力和工具,并賦予長期記憶,又如何為它們設(shè)定權(quán)限紅線,確保它們不會“誤觸紅色按鈕”,已成為Agent規(guī)模化普及前的巨大挑戰(zhàn)。
沒有堅(jiān)實(shí)可靠的Agent Infra,再聰明的Agent也無法成為可信賴的生產(chǎn)力。Replit的這次事故,正是這種風(fēng)險最生動的注腳。
而這也正是阿里云、AWS、谷歌云、微軟Azure等云廠商爭相發(fā)力Agent Infra的核心原因。他們試圖打造的并非一個簡單的工具集,而是一座現(xiàn)代化的 “智能車間”。
在這里,每個AI Agent都將在安全的環(huán)境中工作,擁有清晰的權(quán)限、穩(wěn)定的工具和足夠的數(shù)據(jù),從而真正從實(shí)驗(yàn)室的原型,轉(zhuǎn)變?yōu)檎鎸?shí)生產(chǎn)環(huán)境中可靠數(shù)字員工。
一、Agent規(guī)?;涞靥魬?zhàn)大,配套Infra已成必選項(xiàng)
企業(yè)為何需要這樣一座Agent智能車間呢?
要讓Agent在生產(chǎn)場景中發(fā)揮作用,我們需要為其提供足夠的算力和數(shù)據(jù)(記憶),幫助Agent解決水土不服的問題。
例如,當(dāng)Agent分析海量數(shù)據(jù)時,本地設(shè)備既無法承載龐大的數(shù)據(jù)洪流,也無法完成復(fù)雜的推理運(yùn)算。這時,云端算力的支持就成了理所當(dāng)然的選擇。
此外,要讓Agent做出正確的決策,就需要為其提供全面、準(zhǔn)確且實(shí)時的信息,否則,其決策將基于不完整或過時的數(shù)據(jù),導(dǎo)致輸出結(jié)果不可靠,甚至產(chǎn)生錯誤。
但這僅僅是第一關(guān),更大的隱患在于安全與權(quán)限控制的缺失。今年,知名AI搜索獨(dú)角獸Perplexity旗下的Comet AI瀏覽器就曾爆出安全丑聞。
這款A(yù)I瀏覽器本質(zhì)上就是一個能直接操縱用戶設(shè)備的Agent,然而,由于缺乏安全機(jī)制,它在閱讀到網(wǎng)頁上植入的惡意指令后,能直接打開用戶郵箱、收取驗(yàn)證碼,還把驗(yàn)證碼分享給外部黑客,一條龍完成盜號。
這一事件暴露了將擁有高權(quán)限的Agent直接部署在開放環(huán)境中的巨大風(fēng)險,企業(yè)必須為Agent打造配套的基礎(chǔ)設(shè)施。
然而,Agent Infra極為復(fù)雜,涉及底層算力調(diào)度、安全沙箱、模型集成、記憶數(shù)據(jù)庫、工具調(diào)用鏈路等一系列核心技術(shù)模塊,企業(yè)自建成本高昂且技術(shù)門檻難以逾越,后續(xù)維護(hù)也需要持續(xù)投入頂尖的研發(fā)團(tuán)隊(duì),并時刻應(yīng)對層出不窮的新型安全威脅,堪稱一個填不滿的技術(shù)深坑。
采用云廠商們開發(fā)的現(xiàn)成Agent Infra套件,對大多數(shù)企業(yè)而言是更為現(xiàn)實(shí)的選擇。例如,知名Agent產(chǎn)品Manus便是通過Agent Infra創(chuàng)企E2B打造的沙盒環(huán)境,讓Manus的Agent獲得了完整的終端訪問權(quán)限,也提供了持久化的工作空間,這對于Manus廣為人知的長鏈路任務(wù)而言,十分重要。
除了E2B外,AWS、谷歌云、微軟Azure等云廠商也都已打造了相關(guān)套件。
AWS的AgentCore提供記憶管理、身份驗(yàn)證、代碼執(zhí)行和瀏覽器工具等,強(qiáng)調(diào)安全、可擴(kuò)展和多Agent協(xié)作;
谷歌云的Vertex AI Agents聚焦構(gòu)建和管理多Agent系統(tǒng),支持任務(wù)調(diào)度、跨Agent協(xié)作以及與企業(yè)數(shù)據(jù)和云服務(wù)的集成;
微軟Azure的Agent Factory強(qiáng)調(diào)身份認(rèn)證、治理、內(nèi)容安全和可觀測性,同時結(jié)合Azure云服務(wù)和Copilot工具鏈,支持企業(yè)快速落地智能體應(yīng)用。
總體來看,主流云廠商的思路均是:構(gòu)建安全、可擴(kuò)展、可組合的Agent Infra,讓企業(yè)開發(fā)者能在已有基礎(chǔ)設(shè)施和生態(tài)下快速部署、管理和監(jiān)控多Agents系統(tǒng),形成差異化服務(wù)能力,同時降低企業(yè)上手門檻。
二、國產(chǎn)Agent Infra突圍,讓Agent學(xué)會自我進(jìn)化
在Agent Infra的布局上,國內(nèi)廠商也絲毫不落后。今年4月,阿里云開啟Agent Infra開發(fā)套件——無影AgentBay的公測,迅速吸引了大量開發(fā)者和企業(yè)關(guān)注。
AgentBay的核心定位是為AI Agent打造的“超級大腦”或“云上操作系統(tǒng)”。它能夠動態(tài)調(diào)用云端算力、存儲和工具鏈資源,將復(fù)雜任務(wù)接入高性能云電腦,突破了Agent在本地設(shè)備上的算力限制。
AgentBay不僅集成了云上沙箱環(huán)境、算力調(diào)度、持久化數(shù)據(jù)存儲和企業(yè)級安全等核心功能,還內(nèi)置了視覺理解、自然語言控制和任務(wù)解析等多項(xiàng)AI技術(shù)。尤其是云上沙箱環(huán)境,保障了Agent對本地環(huán)境的零侵入,給Agent執(zhí)行加了一道保險。
同時,它支持原子化工具API、AI Agent API以及ASP遠(yuǎn)程串流協(xié)議等多種交互方式,極大地提升了自動化執(zhí)行效率,使開發(fā)者能夠在高性能、安全的云端環(huán)境中快速部署和管理AI Agent。
而在今年的云棲大會期間,AgentBay迎來重大升級,推出了自進(jìn)化引擎、內(nèi)存狀態(tài)管理、安全圍欄等全新能力。其中最引人關(guān)注的,是基于環(huán)境反饋的自進(jìn)化引擎——Self-Evolving。
阿里云無影關(guān)注到了企業(yè)在利用第三方AI Infra部署AI Agent時的一大關(guān)鍵挑戰(zhàn)。Agent并不能在執(zhí)行任務(wù)過程中實(shí)現(xiàn)“自我提升”,最終其效果還需要人工調(diào)整,才能逐漸優(yōu)化。這就好比你招募了一位員工,但他并不能主動從工作中總結(jié)經(jīng)驗(yàn)和教訓(xùn),始終未能進(jìn)步。
對于AgentBay自進(jìn)化引擎的工作原理,AgentBay產(chǎn)品經(jīng)理屈立威向智東西解釋道,自進(jìn)化引擎可以理解為廣義的強(qiáng)化學(xué)習(xí),但并不直接訓(xùn)練模型。自進(jìn)化引擎會針對提示詞、工作流、Agent架構(gòu)、工具等多個方向進(jìn)行能力優(yōu)化,每個方向使用的方法或算法各不相同。
例如在提示詞優(yōu)化方面,對于短序列任務(wù),可以直接根據(jù)目標(biāo)和實(shí)際結(jié)果進(jìn)行修正;而對于長序列任務(wù),由于難以直接獲得最終結(jié)果,則會采用多種算法來優(yōu)化執(zhí)行效果,比如基于文本梯度(text grad)或微調(diào)推理(mipro)的方法。
通過這種模塊化、服務(wù)化的設(shè)計(jì),企業(yè)無需組建龐大AI團(tuán)隊(duì),也能讓Agent在執(zhí)行過程中不斷自我優(yōu)化,提升與業(yè)務(wù)目標(biāo)的匹配度。
AgentBay自進(jìn)化引擎能夠在任務(wù)執(zhí)行中自動分析Agent的失敗案例,并嘗試生成和測試更優(yōu)的提示詞。它還能根據(jù)任務(wù)需求自主創(chuàng)建或封裝新工具,不斷拓展Agent能力邊界。
這一機(jī)制不僅關(guān)注單個Agent的流程優(yōu)化,也可在多Agent協(xié)作網(wǎng)絡(luò)中智能部署最優(yōu)工作流,提高整體效率。
此外,平臺的記憶策略使Agent具備“過目不忘”和“選擇性遺忘”的能力,可以對長期任務(wù)進(jìn)行智能管理,適應(yīng)復(fù)雜、長周期的應(yīng)用場景。
三、Agent Infra加速發(fā)展,會成為下一代應(yīng)用的躍升點(diǎn)嗎?
AgentBay并非憑空出現(xiàn),屈立威在采訪中介紹道,在云電腦時代,阿里積累了多項(xiàng)核心技術(shù)能力,而AgentBay的許多技術(shù)依賴,與云電腦是“一脈相承”的。
例如,云電腦需要高流暢性和清晰的操作體驗(yàn),而阿里云此前已自研了ASP端云實(shí)時通信協(xié)議,確保遠(yuǎn)程云環(huán)境操作體驗(yàn)接近本地,這也能讓幫助Agent實(shí)現(xiàn)與云端執(zhí)行環(huán)境之間的高效、實(shí)時交互。
大規(guī)模的資源調(diào)度能力和性能保障,也是阿里云此前打造云電腦時重點(diǎn)解決的問題。目前,AgentBay便依托阿里云的全球資源池進(jìn)行部署,用戶可以就近接入,保證了低延遲和高可用性。
然而,Agent也提出了新的技術(shù)挑戰(zhàn)和升級需求。屈立威稱,首先,Agent需要更強(qiáng)的感知與控制能力,不僅要像人一樣“看懂畫面”,判斷鼠標(biāo)點(diǎn)擊、輸入是否生效,還要支持文件系統(tǒng)操作、命令行以及撰寫RPA腳本等多種工具操作。
其次,其風(fēng)控與安全要求也更高,需要阻斷敏感指令、過濾不安全內(nèi)容、約束上網(wǎng)行為,保障企業(yè)私域安全。
此外,Agent任務(wù)的執(zhí)行方式呈樹狀、多分支,每個節(jié)點(diǎn)都需打快照(checkpoint)、支持快速回滾,并復(fù)制克隆環(huán)境以實(shí)現(xiàn)并行執(zhí)行,這對狀態(tài)管理和多維度調(diào)度提出了更高要求,而這些都是云電腦時代所未涉及的關(guān)鍵能力,需要重點(diǎn)突破。
為此,阿里云自研了持久化文件系統(tǒng),讓AgentBay能夠動態(tài)地按需保留用戶狀態(tài)和文件,確保了任務(wù)執(zhí)行的連續(xù)性和狀態(tài)的一致性,這對于需要執(zhí)行長鏈條、多步驟任務(wù)的復(fù)雜Agent至關(guān)重要。
安全方面,AgentBay則構(gòu)建了端到端安全體系,包括沙箱隔離、數(shù)據(jù)加密與RBAC訪問控制、AI內(nèi)容風(fēng)險檢測以及日志審計(jì),保障任務(wù)安全、合規(guī)與可追溯。
除了給企業(yè)打造Agent Infra之外,阿里云還在云棲大會上,給個人用戶也提供了一款跨終端、跨模態(tài)的智能計(jì)算平臺——無影Agentic Computer。
Agentic Computer是一個擁有長期記憶的個人助手,具備云端彈性算力與多任務(wù)并行能力。它內(nèi)置垂直場景Agent,實(shí)現(xiàn)辦公、設(shè)計(jì)、研究等專業(yè)化支持。它將個人計(jì)算與云端智能協(xié)同起來,有望讓更多用戶體驗(yàn)到Agent帶來的賦能作用。
從產(chǎn)業(yè)視角來看,Agent Infra的發(fā)展與移動互聯(lián)網(wǎng)時代App生態(tài)的興起有一大共性:基礎(chǔ)設(shè)施成熟,為新形態(tài)產(chǎn)品快速落地提供了支撐。
移動互聯(lián)網(wǎng)時代,智能終端、網(wǎng)絡(luò)和云計(jì)算能力的完善,使海量App得以高效運(yùn)行和廣泛普及,催生了豐富的應(yīng)用生態(tài);如今,AI Infra依托全球化云資源、彈性算力調(diào)度和全棧安全體系,為AI Agent提供高性能、低延遲、可控的運(yùn)行環(huán)境。
穩(wěn)固的基礎(chǔ)設(shè)施降低了創(chuàng)新門檻,推動Agent在企業(yè)自動化、內(nèi)容生成等多樣化場景中迅速落地,有望形成新一輪產(chǎn)業(yè)生態(tài)和創(chuàng)新循環(huán)。
結(jié)語:給Agent打好Infra地基,Agent離廣泛落地又近一步
Agent Infra正逐步成為新一代數(shù)字化、智能化基礎(chǔ)設(shè)施的組成部分,類似于移動互聯(lián)網(wǎng)時代的云和網(wǎng)絡(luò),為AI Agent生態(tài)提供底層支撐。
同時,Agent Infra的發(fā)展正在改變產(chǎn)業(yè)創(chuàng)新節(jié)奏和生態(tài)構(gòu)建方式。企業(yè)不再需要自行搭建復(fù)雜底層架構(gòu),而是可以在統(tǒng)一、安全、可擴(kuò)展的平臺上試驗(yàn)多樣化Agent應(yīng)用。
隨著工具鏈標(biāo)準(zhǔn)化和安全機(jī)制完善,或許會有越來越多企業(yè)和開發(fā)者能夠快速部署Agent,推動生產(chǎn)、服務(wù)和研發(fā)環(huán)節(jié)的自動化與智能化,從而催生新型業(yè)務(wù)模式和產(chǎn)業(yè)應(yīng)用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.