你不會再「上網」,而是說出一個目標,然后由一群 AI 自動完成。
——未來互聯(lián)網使用場景設想
過去三十年,互聯(lián)網經歷了從靜態(tài)網頁到智能推薦的深刻演變。如今,我們正站在互聯(lián)網的另一個重大轉折點上。
這一轉折,來自一種全新的范式設想 ——Agentic Web,一個由 AI 智能體組成的、目標導向型的互聯(lián)網系統(tǒng)。在這個新框架中,用戶不再手動瀏覽網頁、點擊按鈕,而是通過自然語言向智能體發(fā)出一個目標,AI 會自主規(guī)劃、搜索、調用服務、協(xié)調其他智能體,最終完成復雜任務。
這不是幻想,而是由UC Berkeley、UCL、上海交通大學、上海創(chuàng)智學院等機構的研究者聯(lián)合提出,并在論文中系統(tǒng)論述的 Web 重構方案。
- 論文標題:Agentic Web: Weaving the Next Web with AI Agents
- 作者:Yingxuan Yang, Mulei Ma, Yuxuan Huang, Huacan Chai, Chenyu Gong, Haoran Geng, Yuanjian Zhou, Ying Wen, Meng Fang, Muhao Chen, Shangding Gu, Ming Jin, Costas Spanos, Yang Yang, Pieter Abbeel, Dawn Song, Weinan Zhang, Jun Wang
- 單位:上海交通大學,University of California, Berkeley,University College London,上海創(chuàng)智學院等
- 鏈接
- https://arxiv.org/abs/2507.21206
- Github
- https://github.com/SafeRL-Lab/agentic-web
這是一次對互聯(lián)網底層邏輯的全面「改寫提案」:人類不再是唯一的網絡使用者,智能體將成為 Web 的主要操作者。任務由人類發(fā)起,但由 AI 執(zhí)行。在這個新架構中,網頁、服務、平臺不再是面向人的交互界面,而是為智能體而生的協(xié)作接口。
本文將從技術架構、理論模型、系統(tǒng)協(xié)議、典型應用與挑戰(zhàn)五個方面,深度解析這場關于「智能體驅動互聯(lián)網」的范式革命。
一、三次范式躍遷:Web 正在走向「自動化」
互聯(lián)網的演化是一部「人–信息」關系的技術史。過去三十年,Web 主要經歷了三次范式轉變:
PC Web:關鍵詞驅動的「目錄網絡」
在 PC Web 時代,網頁以靜態(tài)內容為主,信息由機構集中生成,并通過人工分類和超鏈接構成一個「數(shù)字黃頁」。用戶必須主動發(fā)起搜索、點擊瀏覽,任務執(zhí)行線性、明確但效率不高。
商業(yè)模式以關鍵詞搜索廣告為主,代表性系統(tǒng)如Google AdWords,依賴點擊率 (CTR) 和每次點擊成本 (CPC) 來衡量效果,形成了基于「人類意圖」的搜索營銷生態(tài)。
Mobile Web:推薦驅動的「內容爆炸」
伴隨社交平臺、短視頻、電商 UGC 的激增,信息量呈指數(shù)增長。傳統(tǒng)搜索引擎難以應對如此龐大的內容分發(fā)壓力,取而代之的是推薦系統(tǒng)主導的信息分發(fā)范式。
用戶逐漸從「搜索者」變?yōu)椤赶M者」,算法根據(jù)行為數(shù)據(jù)動態(tài)推薦內容,平臺從內容聚合器變?yōu)樗惴ㄖ薪?。商業(yè)模型轉向精準推薦與信息流廣告,強調停留時間、轉化率和千次展示成本 (eCPM)。
Agentic Web:智能體驅動的「行動網絡」
如今,我們正步入第三次變革浪潮:AI 智能體成為主角,Web 從「人讀內容」轉向「智能體執(zhí)行任務」。信息不再靜態(tài)儲存在網頁中,而是被嵌入 LLM 參數(shù)中,被智能體調用、組合與再加工。
Web 的角色不再是信息倉庫,而是一個充滿「可行動資源」的生態(tài)系統(tǒng),供智能體發(fā)現(xiàn)、協(xié)調、調用。任務不再依賴用戶逐步操作,而是由 AI 智能體全流程完成,從發(fā)現(xiàn)信息到調用服務再到反饋結果。
這一趨勢預示著:未來的 Web,將由 AI 智能體構建、運營與使用。我們需要重新理解什么是「網頁」、什么是「流量」、甚至什么是「用戶」。
互聯(lián)網不再只是人類的空間,它正逐步變成一個由智能體共同參與、協(xié)作、創(chuàng)造價值的生態(tài)系統(tǒng)。
二、什么是 Agentic Web?
論文中的定義指出:
- Agentic Web 是一個分布式、交互式的互聯(lián)網生態(tài)系統(tǒng),其中由大語言模型 (LLMs) 驅動的自主軟件智能體,能夠持續(xù)規(guī)劃、協(xié)調、執(zhí)行目標導向的任務。在這個范式中,網絡資源和服務不僅可供人類使用,還可以供智能體訪問,使得智能體與智能體之間 (Agent-to-Agent) 的互動成為常態(tài)。
簡言之,它是一個由 AI 來「上網」、執(zhí)行任務、人類只是「發(fā)出指令」的網絡形態(tài)。
Agentic Web 的核心在于「委托 + 執(zhí)行」
在 Agentic Web 中,用戶不再需要手動搜索、點擊、復制或粘貼內容,而是可以通過與智能體的對話來委托任務。比如用戶只需說:
「幫我規(guī)劃一個周末東京行程,預算 3 千元,要避開臺風?!?br/>
之后,剩下的所有工作都由智能體自動完成—— 從查詢天氣、搜尋航班、比對價格,到預定酒店、整合日程,整個過程完全自動化。而且,這些智能體可以與其他智能體 (如航司 API、酒店 API、旅游數(shù)據(jù)智能體等) 協(xié)作與談判,實現(xiàn)任務目標。這不僅僅是像 ChatGPT 那樣的單輪問答,而是通過多個步驟和多智能體協(xié)作來完成的,代表著 AI 真正參與到了Web 的操作層面。
Agent 在系統(tǒng)中的身份是「雙重」的:
- Agent-as-User (作為用戶)
如同人類訪問網頁一樣,智能體可以模擬點擊、填寫表單、讀取接口,進行市場分析、數(shù)據(jù)抓取、自動交易等任務。
- Agent-as-Interface (作為接口)
智能體也可以作為「超級助手」,接收用戶的自然語言指令,自動解析、調用多個服務、整合結果,執(zhí)行多步流程。
一個完備的智能體,常常同時具備這兩個角色:既能代表人類與系統(tǒng)交互,也能作為系統(tǒng)對人類的接口,真正實現(xiàn)「意圖—執(zhí)行」的閉環(huán)。
三、理解 Agentic Web 的「三個核心維度」
論文從三個核心維度全面理解 Agentic Web 的結構:
- 智能維度 (Intelligence)AI 智能體需要具備真正的「認知能力」,包括:
- 上下文理解:能讀懂網頁、結構化數(shù)據(jù)、自然語言
- 長程規(guī)劃:能分解復雜任務,生成執(zhí)行計劃
- 適應性學習:通過經驗不斷優(yōu)化策略
- 多模態(tài)整合:同時處理文本、圖像、API、數(shù)據(jù)表格等
這些能力意味著智能體不是被動的「響應工具」,而是具有持續(xù)學習和自主策略的「數(shù)字行動體」。
- 交互維度 (Interaction)Agentic Web 打破了「人類點擊網頁」的操作范式,轉向基于語義的智能交互:
- 使用 MCP (Model Context Protocol)、A2A (Agent-to-Agent) 協(xié)議,實現(xiàn)智能體之間的發(fā)現(xiàn)、能力描述、狀態(tài)共享
- 支持多步任務語境保持 (如購物流程、問診流程)
- 實現(xiàn) Agent-to-Agent 協(xié)作與任務拆解
智能體之間不是「調用」,而是協(xié)商、協(xié)同執(zhí)行,如一個旅游智能體主動向天氣智能體請求數(shù)據(jù),再聯(lián)動地圖與訂票工具,完成任務。
- 經濟維度 (Economy)
Agentic Web 中,最具突破性的設想是:Agent Attention Economy (智能體注意力經濟)
傳統(tǒng)廣告模型追求「人類點擊」;Agentic Web 中,資源方爭奪的對象變成「AI 智能體的調用」。
這意味著未來將出現(xiàn):
- 面向智能體的推薦系統(tǒng);
- 為智能體投放的廣告;
- 服務市場中按「智能體調用率」競價;
智能體的調用頻次、完成率、效率將成為新的「流量指標」,商業(yè)競爭的重心也將從爭奪用戶注意力,轉向爭奪智能體「注意力」。
四、應用場景:從搜索替代到智能事務系統(tǒng)
為了更好地理解它的實際價值,我們可以將 Agentic Web 的核心能力拆解為三大類:事務型 (Transactional)、信息型 (Informational) 和交流型 (Communicational)。它們共同構成了智能體參與數(shù)字世界的三種基本方式。
事務型:從「點擊下單」到「全自動完成任務」
傳統(tǒng) Web 中,用戶需要逐頁瀏覽、搜索信息、逐步操作才能完成一項任務,例如訂酒店、買機票、辦簽證。而在 Agentic Web 中,你只需告訴智能體一句話:
「幫我訂一個下周三從上海到東京的往返機票,經濟艙,避開臺風?!?br/>
剩下的 —— 查詢航司、比價、確認時間、填寫資料、支付確認 —— 都由智能體自主完成。它不僅調用航司 API,還能根據(jù)你過往偏好 (如信用卡積分、環(huán)保航線) 進行權衡,甚至在發(fā)生變更時自動重訂。
這種智能化的事務處理能力,正在由「Mobile Agents」「App Agents」進一步延展到設備層。例如,智能體可以在你的手機上同步日程、修改會議安排、甚至整合多個應用自動執(zhí)行跨平臺任務。
信息型:從「搜索引擎」到「持續(xù)知識發(fā)現(xiàn)」
今天的信息檢索依賴搜索引擎和社交推薦,但在數(shù)據(jù)過載的背景下,我們獲取的是信息洪流。
Agentic Web 支持的「信息型智能體」,則更像是一個長期陪伴式研究助理。以「Deepresearch Agent」為例:
- 它可以持續(xù)追蹤一個研究領域的新論文;
- 自動梳理引用網絡和方法論差異;
- 合理推斷趨勢、生成研究摘要;
- 甚至根據(jù)你的研究興趣,推薦潛在合作者。
這種智能體并不是一次性地「查一查」,而是具備長期「認知記憶」和動態(tài)「學習能力」的信息分析引擎。它們協(xié)作構成一個持續(xù)進化的知識網絡,大大提升了信息篩選和洞察能力。
交流型:智能體之間能溝通、協(xié)作、談判
相比以人為中心的傳統(tǒng) Web,Agentic Web 真正的變革在于讓智能體可以與其他智能體協(xié)作,形成類似「數(shù)字組織」的多體系統(tǒng)。
在科研領域,一個跨國研究項目中,不同學校的智能體可以:
- 自動同步實驗時間表;
- 共享數(shù)據(jù)集;
- 生成聯(lián)合成果;
- 自動分配署名與經費比例。
在制造業(yè)或供應鏈中,不同企業(yè)的智能體可實時對接需求、響應變化、自主協(xié)商條款。這種跨智能體協(xié)同工作流,依賴于一整套新型通信協(xié)議 (如 MCP、A2A),支持語義對齊、任務協(xié)同與多方自治。
簡而言之:Web 不再是人和機器之間的橋梁,而是智能體之間的操作舞臺。
五、挑戰(zhàn):Agentic Web 的復雜難題與未來瓶頸
雖然 Agentic Web 展現(xiàn)出令人興奮的前景,但要真正落地為現(xiàn)實中的下一代互聯(lián)網,它面臨的是一組系統(tǒng)性、相互交織、跨學科的復雜挑戰(zhàn)—— 遠不只是提升 AI 智能體的能力,更關乎整個網絡基礎設施、經濟體系與人機協(xié)作范式的重構。
這不僅是個技術性難題,更是一個需要全局觀的系統(tǒng)性工程。構建Agentic Web的難題,遠不僅僅是提高個體智能體的能力,而是如何在現(xiàn)有互聯(lián)網基礎上,架構出一個可靠、安全、可信的全新計算層。這些挑戰(zhàn)跨越了多個領域,彼此之間存在深刻的相互依賴與關聯(lián)。接下來,我們將逐一解析這些挑戰(zhàn)。
智能體基礎能力:推理、記憶與安全性
- 推理與規(guī)劃的脆弱性
多步驟推理是 Agentic Web 的核心能力之一,它能夠讓智能體分解復雜問題、評估多個解決方案、做出合適的決策。然而,目前的推理系統(tǒng)仍然脆弱,容易出錯,難以進行長遠規(guī)劃和持續(xù)反思。
- 記憶與上下文管理
記憶是智能體能否有效執(zhí)行長時任務的基礎。傳統(tǒng)的大語言模型 (LLM) 是無狀態(tài)的,智能體需要外部機制來保留上下文、歷史記錄和學習到的知識。然而,如何高效管理這些記憶,尤其是在復雜任務中有效銜接不同階段的內容,依然是亟待解決的難題。
- 工具使用的安全性
智能體依賴外部工具 (如 API、數(shù)據(jù)庫、搜索引擎) 來與現(xiàn)實世界互動。然而,這也帶來了極大的安全隱患:工具如果被黑客篡改或受到攻擊,智能體可能會受到影響,甚至引發(fā)連鎖反應。解決這個「工具使用悖論」,需要構建「零信任」架構,確保所有外部輸入都經過嚴格驗證。
學習與自我改進:從靜態(tài)模型到動態(tài)學習者
- 獎勵設計難題
強化學習 (RL) 是訓練智能體的核心方法之一,它通過與環(huán)境的交互來優(yōu)化決策過程。然而,設計一個既能引導智能體正確行為又不容易被濫用的獎勵機制,依然是目前的瓶頸。
- 持續(xù)學習與災難性遺忘
智能體需要具備持續(xù)學習的能力,以便隨著時間積累新技能。但在學習新任務時,智能體常常會忘記之前學到的知識,這就是所謂的「災難性遺忘」問題。如何讓智能體在不忘記舊知識的情況下學習新內容,是目前面臨的重大挑戰(zhàn)。
- 任務交互學習的困難
通過與環(huán)境的互動來學習復雜任務是智能體成長的關鍵。然而,如何避免智能體過度依賴某一特定環(huán)境,或者過度擬合特定的輸入,保持任務的靈活性和廣泛適應性,仍是一個懸而未解的問題。
多代理協(xié)作:協(xié)調與信任的挑戰(zhàn)
- 協(xié)作與溝通:結構設計難題
當多個智能體協(xié)同工作時,如何組織它們的結構成了關鍵問題:是采取平等對等的協(xié)作方式?還是分層領導?每種結構都有其利弊,如何找到最優(yōu)解,仍需深入研究。
- 通信協(xié)議的統(tǒng)一性
為了讓全球的智能體能夠有效溝通與協(xié)作,我們亟需統(tǒng)一的通信協(xié)議。這類似于互聯(lián)網早期對 HTTP 協(xié)議的依賴。當前,像IBM ACP、Google A2A、Anthropic MCP等協(xié)議正在試圖解決這一問題。如何建立一個既能滿足復雜交互需求,又具備開放性、易擴展性的標準,將是 Agentic Web 成功的關鍵。
- 去中心化的信任體系
在去中心化的智能體生態(tài)中,如何確保代理之間的信任?如何構建去中心化的信任體系,讓智能體在沒有人工干預的情況下高效合作,是另一個亟待解決的問題。
人機交互:確保智能體與用戶目標一致
- 用戶意圖模糊
人類語言本身就常常模糊不清,很多時候用戶的指令包含不明確的目標或信息。智能體必須能夠解讀這種模糊的意圖,并將其轉化為可執(zhí)行的目標和任務。
- 偏好發(fā)現(xiàn)與引導
用戶的偏好常常是變化的,甚至很多時候用戶自己都不完全了解自己真正的需求。智能體需要通過與用戶的互動,不斷引導用戶發(fā)現(xiàn)并明確自己的偏好。
- 人類監(jiān)督機制
盡管智能體在很多任務中表現(xiàn)出色,但對于關鍵任務或高風險決策,人類監(jiān)督 (HITL)依然是不可或缺的。如何設計有效的監(jiān)督機制,以確保智能體的決策能符合人類的最終目標,是一個至關重要的問題。
安全與魯棒性:確保智能體系統(tǒng)的安全性與穩(wěn)定性
- 風險激增,信任重構
代理型網絡引入跨平臺操作、交易執(zhí)行和多會話記憶等新能力,帶來目標漂移、服務污染、協(xié)調風暴等多維安全威脅。傳統(tǒng)基于人工驗證的信任模型已難以適應,需重構認知、交互、經濟層的防護機制。
- 紅隊測試機制:人工+自動并進
人工與自動紅隊測試成為識別漏洞的核心手段。尤其是自動紅隊利用 LLMs 構造復雜對抗場景,適應多設備與多代理協(xié)作,揭示隱藏威脅,已成為部署前安全評估的關鍵工具。
- 推理護欄與可控生成并舉
部署階段的防御策略包括「推理防護欄」、「安全解碼器」、訪問控制等機制,提升 LLMs 與代理系統(tǒng)的穩(wěn)健性與可控性。未來還需從架構、策略到系統(tǒng)范圍全面升級,以應對級聯(lián)攻擊與持續(xù)學習挑戰(zhàn)。
社會經濟影響:重構商業(yè)模型與社會結構
- 廣告經濟難以為繼
當前的廣告驅動型商業(yè)模式正在被Agentic Web持續(xù)沖擊。代理不再是「為人類眼睛設計」的工具,而是直接與服務提供方交易、執(zhí)行任務。因此,廣告模式已經難以適應這一新生態(tài)。
- 新型商業(yè)模式的誕生
交易型、訂閱制、按結果收費等新型商業(yè)模型正在崛起,這為未來互聯(lián)網的運營帶來了全新的思路。未來的商業(yè)模式,可能會更多地依賴智能體作為服務提供者。
- 勞動市場與不平等
隨著智能體的普及,很多職業(yè)可能被自動化替代,勞動市場將面臨巨大的沖擊。因此,如何平衡 AI 與人類就業(yè),如何確保經濟利益公平分配,成為全球關注的社會問題。
六、總結:Agentic Web 是 AI 真正連接現(xiàn)實的入口
我們正在見證互聯(lián)網從「信息空間」邁向「行動空間」的轉型。
Agentic Web并不是傳統(tǒng)意義上的一次技術升級,而是一場范式革新 —— 它讓網絡從被動展示信息,轉變?yōu)橹鲃油瓿扇蝿?;?AI 不再只是一個回答問題的工具,而是一個可以代表人類行動、協(xié)作、決策的「數(shù)字代理」。
這種變革所帶來的,不僅是效率的提升,更是人與機器關系的重構、網絡經濟模式的重塑,以及全新社會秩序的建立。
但與此同時,Agentic Web 的前路充滿挑戰(zhàn):技術仍需突破、標準尚未統(tǒng)一、安全風險不容忽視、經濟模型有待探索。這不僅是工程問題,更是倫理問題、社會問題、治理問題。
無論結果如何,Agentic Web 已不再是科幻構想,而是迫在眉睫的系統(tǒng)挑戰(zhàn)。
結語
Agentic Web,不只是「AI 代理能干更多事」,它是讓整個 Web 變成一個「活的協(xié)作系統(tǒng)」,是 AI 與人類共創(chuàng)未來互聯(lián)網的操作系統(tǒng)。
你未來不再「點網頁」,而是讓智能體幫你完成目標。網頁正在變成智能體,搜索正在變成協(xié)同,點擊正在變成意圖。
我們正站在互聯(lián)網的又一次巨大躍遷的門檻上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.