夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

企業(yè)級 AI Agent規(guī)?;涞氐谋芸又改?,就藏在這四大趨勢里

0
分享至


作者 | 凌敏

SaaS 用不好??ㄔ凇白詈笠还铩?。但 Al Agent 用不好,問題會出在“每一公里”。

2025 被普遍視為企業(yè)級 Al Agent 的落地拐點:企業(yè)從“試試看”走向“用起來”,技術敘事讓位于業(yè)務結果。美國著名通信 API 服務機構 Plivo 的調研顯示,超過六成企業(yè)將 Al Agent 列為未來 12 個月的關鍵布局,“價值導向型”采購興起,RaaS(結果計費)正壓過傳統(tǒng)SaaS(功能交付)。讀懂MCP / GraphRAG / AgentDevOps / RaaS四大趨勢,基本就抓住了“能干活的 Al Agent ”的工程化答案。

1 企業(yè)級 Al Agent 究竟缺什么?四大趨勢給出可復用的工程化解法

趨勢一:MCP 讓 Al Agent 可擴展

2024 年年末,Claude 母公司 Anthropic 首次在《Introducing the Model Context Protocol》一文中提出 MCP(Model Context Protocol,模型上下文協(xié)議)。這是一個能夠實現(xiàn)大語言模型與外部數(shù)據(jù)源和工具集成,并建立安全雙向連接的開源協(xié)議。為了更加具象化地向公眾解釋這個新詞匯,Anthropic 在 MCP 文檔中稱“可以把 MCP 想象成 AI 應用的 USB-C 接口”,開發(fā)者能夠以一致的方式將各種數(shù)據(jù)源、工具和功能連接到 AI 模型,極大地降低了企業(yè)在 Al Agent 項目中的集成與運維成本。

Claude 3.5 Sonnet 第一個“吃螃蟹”,支持快速搭建 MCP 服務器;早期實踐者 Block 和 Apollo 也在第一時間將 MCP 集成進自身系統(tǒng)。隨后的一年時間里,MCP 迅速成為 AI 原生應用的重要基礎設施,并得到了多家海內外科技巨頭們的關注:微軟、谷歌、亞馬遜云科技紛紛將 MCP 集成到自家的 AI 服務中,OpenAI 在 Al Agent SDK 中支持 MCP,BAT 也密集布局 MCP 協(xié)議。社區(qū)的廣泛支持則代表了 MCP 在開發(fā)者生態(tài)中已經(jīng)成為事實標準:GitHub、Hugging Face 上涌現(xiàn)了數(shù)千個由社區(qū)貢獻的 MCP Server,覆蓋數(shù)據(jù)庫、云服務以及各類 SaaS 應用。11 月 25 日官方發(fā)布的 MCP 周年博文中更是指出,MCP 注冊表中收錄的服務器數(shù)量已接近 2000 個,生態(tài)擴張速度可見一斑。

但生態(tài)上的繁榮掩蓋不了 MCP 在落地層面所面臨的現(xiàn)實挑戰(zhàn),尤其對于中國企業(yè)而言,標準碎片化、安全治理以及運維管理層面上的難題愈加突出。標準層面,國內不少企業(yè)都基于自身業(yè)務生態(tài)推出了差異化 MCP 方案,實際運行中協(xié)議不匹配問題頻發(fā),從而導致 Al Agent 協(xié)同能力受限。安全治理層面,MCP Server 認證生態(tài)混亂,權限邊界模糊,一旦被攻破,攻擊者可跨服務訪問敏感數(shù)據(jù)。此外,當前 MCP 協(xié)議在身份驗證、操作審計等關鍵安全模塊上尚不完善,難以滿足強監(jiān)管行業(yè)更高的合規(guī)要求。運維管理層面,MCP Server 往往需要單獨部署,這也帶來了資源隔離與彈性伸縮的現(xiàn)實難題。

企業(yè)級 Al Agent 要想跨越從“可用”到“好用”的鴻溝,就必須需要一套更體系化的 MCP 方法論,在開源協(xié)議之上,重建統(tǒng)一、可治理、輕運維的連接層,而非簡單的單次集成。在全球范圍內,已經(jīng)有多家企業(yè)驗證這一方向。最早采用 MCP 的公司之一 Block,將 MCP 用作多工具協(xié)調層,使得內部 Al Agent 可統(tǒng)一訪問支付、風控和客服系統(tǒng),降低接口維護成本。一些開發(fā)者工具公司,如 Replit、Zed,也在生產(chǎn)環(huán)境中增加對 MCP 的支持,通過統(tǒng)一連接層讓 AI Agent 能夠跨代碼倉庫、調試工具、構建系統(tǒng)進行組合式操作,從而提升了任務的成功率與可觀測性。在國內,類似的工程路徑也在逐漸成型。以百融云創(chuàng)為例,其推出的結果云 Results Cloud 與企業(yè)級智能體平臺百融百工以 MCP 作為連接底座,對多模型、多工具進行統(tǒng)一接入與治理,降低企業(yè)運維與擴展成本。這些案例都表明,基于 MCP 構建統(tǒng)一治理層,已經(jīng)成為企業(yè)級 Al Agent 發(fā)展的必然趨勢。

趨勢二:GraphRAG 讓回答不再亂

GraphRAG 是由微軟提出的結合了知識圖譜和 RAG 技術的新方法。傳統(tǒng) RAG 更像是檢索增強,依賴向量召回與文本匹配,擅長從外部知識庫中檢索相關信息,卻難以保證跨文檔、跨版本的口徑一致性。GraphRAG 在 RAG 的基礎上進一步引入了知識圖譜,將信息以節(jié)點和邊的形式存儲,構建實體關系網(wǎng)絡,使得大模型不僅能檢索文本片段,還能理解深層邏輯關系。進而,確保 Al Agent 的回答內容更加全面且一致。在適用場景上,GraphRAG 適用于所有“長文、多跳、強邏輯、需可解釋”的復雜業(yè)務文檔場景,能把回答準確率提升 20–50 個百分點,并將 token 成本降低 10–100 倍,尤其適用于金融、保險、醫(yī)療、法律等高價值領域。


圖片來源:Medium 博客

GraphRAG 同 MCP 一樣選擇了開源,這也加速了工程落地的腳步,社區(qū)基于此衍生出了多種更易用的模板。在 GitHub、Hugging Face 社區(qū)中,有多個項目基于微軟的官方實現(xiàn),創(chuàng)建更輕量、更易于使用和定制的版本。此外,包括 LangChain 在內的多個主流開源框架,也已支持 GraphRAG 流程,將圖結構檢索能力與 RAG 模型結合,以構建更強大的知識系統(tǒng)。

但在落地層面,GraphRAG 面臨的現(xiàn)實挑戰(zhàn)同樣復雜。其一,知識圖譜的構建復雜度較高,企業(yè)知識分散在 PDF、PPT、表格與圖片等多個源頭,提取和解析難度較高;其二,知識版本治理缺失,由于缺乏統(tǒng)一的版本控制機制,Al Agent 在回答時容易引用過期規(guī)則;其三,全局召回的工程復雜度高,GraphRAG 在 RAG 的向量召回基礎上引入了圖譜召回,使得 Al Agent能夠更深層地理解上下文,但全局召回需要企業(yè)對全量知識進行解析,此外,一些簡單的問題可能也會觸發(fā)復雜的全局檢索,引入無關信息,增加成本。

因此,一套更加工程化的 GraphRAG 方法論正在中國企業(yè)中形成共識,其核心目標不是構建“龐大的知識庫”,而是構建“可治理的知識資產(chǎn)鏈路”。在國內,不少技術團隊都在沿著這一大方向推進工程化實踐,只是在具體路徑和側重點上有所不同。以百融云創(chuàng)的實踐為例,其工程體系主要圍繞三大核心能力展開:第一,高精度文檔解析,只有在解析階段達到足夠高的準確率,才能更可靠地支撐后續(xù)的圖譜構建、全局檢索;第二,版本治理,以金融行業(yè)為例,規(guī)章制度每年迭代,各版本之間的關系復雜,必須依靠有效的知識庫版本管理機制,對其進行可控管理;第三,意圖澄清能力,在實際對話中,用戶的意圖往往比較模糊,需要基于結構化知識樹做可控的意圖澄清,才能精準地獲取用戶實際問題,最終輸出可靠的答案。

在這一體系中,關鍵的技術難點包括領域圖譜 RAG 的構建以及 RAG-U 型檢索(U-Retrieval)。以百融云創(chuàng)的 FinGraphRAG 為例,在構建金融圖譜 RAG 時,需要經(jīng)歷文檔分塊 (Doc Chunking)、實體抽?。‥ntities Extraction)、三重鏈接(Triple Linking)、關系構建 (Relationship Linking)、圖譜標簽化(Tag the Graphs)、通過 U-Retrieval 響應查詢 (Response via U-Retrieval)六大鏈路,整個鏈路的目標都是將非結構化知識轉化為結構化、可推理的圖譜體系,從而解決金融領域中長文本(年報、研報、會議紀要)、專業(yè)術語歧義和復雜因果推理的問題。


圖片來源:https://arxiv.org/pdf/2408.04187

為了兼顧精確性與全局視野,金融圖譜 RAG-U 型檢索還需實現(xiàn)自頂向下的精確檢索與自底向上的響應優(yōu)化。在自頂向下的精確檢索階段,需要先為查詢打標簽,并沿 tag 索引樹自頂向下路由,在目標圖譜中選取關鍵實體與鄰居,最終根據(jù)圖譜生成初始回答;在自底向上的響應優(yōu)化階段,需要從剛才選中的葉子節(jié)點往上走,依次訪問其父級標簽摘要,每向上一層,就向 L_R 提供 QUESTION: {Q}、LAST RESPONSE: {A_{i}}、SUMMARY: {T^{(i-1)}},并要求其“根據(jù)更上層的摘要信息,修正 / 補充上一輪回答”,最終在頂層得到一個既保留底層圖譜細節(jié),又融合更寬廣全局視角的回答。進一步而言,U 型檢索像是在金融知識圖譜中先鉆入某個最契合問題的“細顆粒業(yè)務簇”(例如“客戶 B 在過去一年內的境外大額轉賬模式”),基于局部圖輸出精準判斷,再一路向上,把“客戶整體資產(chǎn)負債情況”“他所在行業(yè)的宏觀景氣度”“同地區(qū)同客群的歷史違約率”等高層上下文逐步加回到回答中。

趨勢三:AgentDevOps 讓 Al Agent 真的可控

隨著企業(yè)將更多流程交給 Al Agent 執(zhí)行,業(yè)界開始形成一個清晰共識:Al Agent 的開發(fā)與運維無法繼續(xù)沿用傳統(tǒng) DevOps 模式,需要一套針對“推理型系統(tǒng)”的工程體系,即 AgentDevOps。不同于傳統(tǒng) DevOps 聚焦系統(tǒng)可用性與部署效率,AgentDevOps 的核心目標是確保 Al Agent 的行為質量、任務完成度與推理鏈路的穩(wěn)定性,讓 Al Agent 能夠持續(xù)輸出可靠結果。

從行業(yè)角度來看,AgentDevOps 與傳統(tǒng) DevOps 的根本差別體現(xiàn)在四個方面:

  • 第一,責任對象不同——從系統(tǒng)可用,轉向對業(yè)務結果負責。Al Agent 的價值不體現(xiàn)為“服務正常”,而體現(xiàn)為“任務是否完成”“判斷是否正確”。

  • 第二,觀測維度不同——從指標監(jiān)控,轉向推理鏈路可觀測。行業(yè)普遍認為 Al Agent必須具備 Reasoning trace(推理軌跡),包括意圖 →檢索 →推理 →工具調用→輸出的全鏈路可追溯性。

  • 第三,調試方式不同——從代碼調試,轉向行為調試。傳統(tǒng)日志無法解釋“為什么答錯”,AgentDevOps 需要能復現(xiàn)推理路徑、定位錯誤來源。

  • 第四,優(yōu)化機制不同——從人工調參,轉向基于數(shù)據(jù)的持續(xù)自我優(yōu)化。Al Agent需要按照真實反饋不斷提升判斷質量,而不是靜態(tài)上線。


圖片來源:https://arxiv.org/pdf/2508.02121v1

目前,業(yè)界對于 AgentDevOps 的系統(tǒng)性研究仍處于探索階段,但已有不少企業(yè)開始將其從工程理念推向生產(chǎn)級實踐。今年 3 月,LangSmith 為基于 LangChain 或 LangGraph 構建的應用程序提供完整的端到端 OpenTelemetry 支持,開發(fā)者可以記錄 Al Agent 的推理鏈路、工具調用、RAG 檢索 / 檢索調用歷史等。微軟 AutoGen 也通過與 OpenTelemetry 的集成,讓 Al Agent 的多輪對話、節(jié)點分支和工具執(zhí)行過程實現(xiàn)結構化記錄,并可將這些 trace 統(tǒng)一輸出到 LangSmith 或第三方可觀測平臺。

在企業(yè)級 Al Agent 體系中,要想做到工程化的治理與可觀測,需要具備回放、A / B 測試、審計、以及基于 SLO(服務質量目標)/ SLA(服務質量協(xié)議)的質量與結果保障這四種關鍵能力。但相比海外的體系化探索,中國企業(yè)在構建 AgentDevOps 能力體系時面臨的挑戰(zhàn)更加復雜。在回放能力方面,很多 Al Agent 可能運行在云端、本地部署等多套系統(tǒng)中,運行軌跡難以完整捕獲;在 A / B 測試方面,評估體系仍不不成熟,難以科學地對比不同 Al Agent 策略的優(yōu)劣;在審計方面,Al Agent 的每一個決策都可能需要接受審查,但現(xiàn)有工具鏈往往無法完整記錄 Al Agent 對知識版本、策略選擇和工具調用的依據(jù);在 SLO / SLA 方面,傳統(tǒng)的 SLA 主要承諾系統(tǒng)的可用性與響應延遲,但企業(yè)級 Al Agent 在業(yè)務場景中還缺乏明確的指標口徑。

厘清這些挑戰(zhàn),還需要一套務實的方法論。當前,中國企業(yè)的 AgentDevOps 方法論正在逐步成型。比如,百融云創(chuàng)就在行業(yè)共識的基礎上,對 AgentDevOps 能力體系做了進一步增強,并從四個方面推進 AgentDevOps 落地:

(1)全流程工程能力:覆蓋開發(fā) - 調試 - 部署 - 監(jiān)控 - 優(yōu)化的全鏈路,并形成標準化、可追蹤的工程體系;

(2)場景化評估器:在業(yè)務維度實時跟蹤“硅基員工”的實際表現(xiàn),讓企業(yè)能看到每一個節(jié)點、每一個業(yè)務指標的變化,從而真正做到價值可視化;

(3)半監(jiān)督自適應優(yōu)化:在開發(fā)階段自動搜索最優(yōu)參數(shù)與 Prompt 組合,使 Al Agent 快速達到可上線標準,減少冷啟動成本;

(4)強化學習增強的在線優(yōu)化:在運營階段基于回流數(shù)據(jù)持續(xù)迭代策略,讓 Al Agent 隨使用不斷更穩(wěn)、更佳。

在落地實踐中,這些系統(tǒng)性增強帶來顯著且可量化的效果,比如,人工調參與維護的成本顯著下降,Al Agent 的上線周期大幅縮短,并且超過 70% 的典型應用場景實現(xiàn)了自動優(yōu)化,穩(wěn)定性提升明顯,Al Agent的產(chǎn)出質量持續(xù)增強。

趨勢四:RaaS 讓 AI Agent 能用 KPI 說話

正如前文所言,RaaS 作為一種新興的服務交付模式,正在全球范圍內對 SaaS 發(fā)起挑戰(zhàn),甚至市面上出現(xiàn)了不少“RaaS 是 SaaS 的未來”“90% 的 SaaS 企業(yè)將面臨淘汰”等聲音。今年 5 月,全球頂尖 AI 創(chuàng)始人齊聚舊金山,在紅杉資本第三屆 AI 峰會(AI Ascent 2025)上達成重要共識:人工智能正迎來一場根本性變革,其核心不再是出售技術工具,而是直接交付可衡量的業(yè)務成果和收益。簡單來說,RaaS 的核心理念就是讓客戶為可衡量的業(yè)務成果付費,而不僅僅是為軟件訪問權限或流程付費。

在海外,很多創(chuàng)新型公司都已經(jīng)成功應用了 RaaS 模式。比如 Simple.ai 根據(jù)客戶滿意度評分的提高或問題解決時間的縮短向客戶收費,將定價與結果直接掛鉤;Freightify 根據(jù)運輸成本的節(jié)省或貨運管理時間的減少來收費;客服 SaaS Kustomer 徹底取消訂閱制,改為按問題解決量收費;Salesforce 推出 Agentforce,對話式 AI 按每次有效對話 2 美金計費……

但企業(yè)在推進 RaaS 模式之前,還需要回答一個最關鍵的問題:如何對齊結果計價與財務口徑?換句話說,怎樣的結果算是符合客戶預期?按結果驗收又該怎么驗收?最突出的矛盾是,不同崗位對于不同業(yè)務場景中的結果,評價標準本就存在明顯差異,比如,同樣是客服崗位,售前咨詢場景關注響應速度、轉化率,售后服務場景關注問題解決時效、滿意度,跨部門協(xié)作場景關注信息流轉的完整性與合規(guī)性。這種多維度、多口徑的評價標準,使得企業(yè)與客戶難以就清晰、客觀、可驗證的“結果”定義達成一致。此外,企業(yè)在從傳統(tǒng)的按賬號和席位收費的模式,轉向按結果計費時,也會面臨體系銜接等挑戰(zhàn),如何平穩(wěn)過渡又是一大難題。

根據(jù)國內第一批踐行 RaaS 模式的企業(yè)實踐路徑,一個可行的方向是將抽象的結果轉化為可度量、可兌現(xiàn)的 SLA 項。比如,客服 Al Agent 不是按席位或調用次數(shù)報價,而是圍繞接通率、有效對話輪次、邀約 / 轉化量、誤報率等 SLA 項與客戶對齊價值,每一項都有明確的數(shù)字和驗收標準,更具象化地體現(xiàn)了 Al Agent 的業(yè)務價值。百融云創(chuàng)推出的硅基員工也是基于這一模式,將 AI Agent 原生地嵌入企業(yè)級工作流和 SLA,讓硅基員工像人一樣接受 SLA / KPI 考核,與業(yè)務成果直接綁定,創(chuàng)造的價值再進行收益分享。

當 MCP、GraphRAG、AgentDevOps、RaaS 這四大趨勢逐漸清晰,并在產(chǎn)業(yè)側進入工程化成熟期時,企業(yè)級 Al Agent 的落地路徑也就有了更準確的答案。如果把這些能力真正放進企業(yè)的真實業(yè)務場景,會發(fā)生什么?最直觀的變化就是,Al Agent 不再是輔助工具,而是能夠承擔具體崗位職責,并且可以像人類員工一樣接受 KPI 考核。

2 什么樣的 AI Agent “能干活”?企業(yè)的一線標準都在這里

金融、汽車、公共服務、招聘 / HR等高觸達鏈路,Al Agent 落地已從試點走向規(guī)?;?,逐步形成了一批可檢驗、可復用的企業(yè)級樣本。

其中,最典型的一類是面向大規(guī)模觸達的營銷 / 運營場景。以金融為例,在觸達龐大規(guī)模的客戶群體時,傳統(tǒng)方式通常依賴人工外呼,AI 技術改造后,雖然效率提升了,但在意圖識別、交互體驗上還一言難盡。如今,借助大模型與多智能體,金融行業(yè)在進行存款產(chǎn)品的智能營銷時,能通過深度解析客戶通話,精準識別意圖,自動生成對話文本與服務小結,同時依據(jù)客戶關注的收益率與流動性偏好,智能匹配存款產(chǎn)品并形成個性化營銷策略。

這對底層大模型的能力要求就是,不能再是傳統(tǒng)的“一問一答”式,必須變被動為主動,能主動推進、主動談判、主動溝通。百融云創(chuàng)研發(fā)的 BR-LLM-Speech 就是結合了大語言模型、強化學習技術和多模態(tài)端到端主動大模型,能結合實際業(yè)務目標動態(tài)制定策略,主動引導對話,并且在交互層面,響應速度在 200ms 以內,多輪對話 ≥ 100 輪。

不要小看 200ms 這個數(shù)字,這背后實際上是對整條實時語音鏈路的極高要求——因為真正的實時語音 Al Agent,并不是“一個 RTC 就能搞定”的事情。RTC 只是實現(xiàn)實時性的基礎,真正決定用戶能否獲得“像真人一樣順暢溝通”的體驗,是整條端到端語音智能鏈路的協(xié)同優(yōu)化能力。

要想實現(xiàn)這項能力,需要突破四大瓶頸:

  • 第一,ASR → LLM → TTS 的多段式模型鏈路。在真實業(yè)務場景中,一條語音必須經(jīng)過“語音接入 → ASR 解碼 → LLM 多輪推理 → 工具調用 → 業(yè)務系統(tǒng)訪問 → 文本生成 → TTS 合成 → RTC 回傳”,這條鏈路遠比視頻會議復雜得多。ASR 可能需要累計幀,LLM 可能觸發(fā)多次子調用,TTS 可能需要韻律調制,這些都會形成 200–800ms 的模型計算延遲。因此即便 RTC 只有 30ms,端到端仍可能超過 2 秒。

  • 第二,端到端模型并行帶來的調度與資源管理。實時語音鏈路不是單模型推理,而是要結合多模態(tài)輸入的語義完整度、說話人識別、端到端的語音理解和生成。GPU / KV-cache 管理、音頻幀批處理、模型復用、上下游同步,是工程上挑戰(zhàn)極大的部分。

  • 第三,實時語音場景對穩(wěn)定性提出極端要求。一個輕微的 jitter、一次不完整幀、一次延遲積累,就可能造成體驗“頓一下”。這就要求從 RTC 到模型 pipeline 必須做到精細幀級調度、音頻包級容錯、模型級 backpressure、實時工具調用(超時與重試),以及推理鏈路的動態(tài)裁剪。這些已經(jīng)超出傳統(tǒng) RTC 能力的范疇,需要完整語音 pipeline 的系統(tǒng)性優(yōu)化。

  • 第四,多模態(tài)化帶來的算力壓力。當場景加入更多模態(tài)之后,模型中各 block 處理耗時不同,依靠百融自研的推理框架(Vortex),實現(xiàn)算力模塊的精細化調度,才能讓多模型真正“匯流”。

總的來說就是,RTC 是實時語音的基石,但決定用戶是否“感覺實時”的關鍵,是企業(yè)是否具備完整的模型 → 工具鏈路 → RTC 的端到端語音智能 pipeline 優(yōu)化能力。百融百工的差異化優(yōu)勢也來自于此。通過自研實時語音模型、語義 VAD、零樣本 TTS、RTC 深度整合、Vortex 多模型融合推理,再加上 AgentDevOps 的自動評估與調優(yōu),能在真實業(yè)務中實現(xiàn) 200ms 的自然對話體驗。

另一類典型場景來自招聘 / HR。招聘鏈路同樣面臨候選人規(guī)模大、溝通頻次高、人工成本高、反饋窗口短等現(xiàn)實壓力,因此,企業(yè)期望通過引入企業(yè)級 Al Agent,以更穩(wěn)定、可持續(xù)的智能能力重構流程:一是 AI 獨立的初篩與邀約能力,在高峰期對大量候選人完成意向澄清、時間協(xié)調與到訪安排,承擔重復性溝通;二是 AI 輔助招聘官能力,針對關鍵崗位做前置初篩與異議處理,輸出候選人畫像與風險點,提升邀約到訪率,降低“無效溝通”,實現(xiàn)降本增效。

在百融云創(chuàng)與某大型企業(yè)的人才招聘項目中,面向藍白領混合崗位,Al Agent 相比早期方案邀約到訪率更高、平均處理時長顯著縮短,且無效溝通占比下降;由于 AI 在前置環(huán)節(jié)進行了高效干預,線下面評資源被更有效地分配至高優(yōu)先級候選人,從而降低整體人力投入。招聘鏈路的另一關鍵在于知識治理:Al Agent 在回答崗位 JD、薪酬帶寬、福利政策、背景調查口徑等問題時,必須答得上且口徑一致,才能真正承擔招聘崗位的職責。在知識治理層面,Al Agent文檔解析準確率可達 95% 以上,為招聘鏈路的可控性提供保障。

雖然不同崗位對 Al Agent 的能力要求各有側重,但無論場景如何變化,準確性和穩(wěn)定性都是 Al Agent 能干好活的前提。在提升 Al Agent穩(wěn)定性,保障其能在線自主持續(xù)學習方面,百融云創(chuàng)提出了 Training Free 技術,不依賴模型微調,而是通過客戶反饋的 Bad Case 提煉經(jīng)驗,動態(tài)優(yōu)化提示詞。這些經(jīng)驗會與提示詞動態(tài)結合,持續(xù)修正 Al Agent 行為,讓 Al Agent 具備自適應優(yōu)化能力。

這些案例表明,企業(yè)級 Al Agent 正在越來越深入地嵌入業(yè)務鏈路,承擔著具體的崗位職責。而當企業(yè)級 Al Agent 從點狀創(chuàng)新走向組織級重構,將為業(yè)界帶來一套新的規(guī)則也未可知。

3 企業(yè)級 Al Agent 上崗前,先通過這份自檢清單

在迎接這一宏大敘事前,企業(yè)還需要一份實用的 Al Agent 落地實踐自檢清單。對應著前文提到的四大重要趨勢,這份 Checklist 已然清晰。

第一,看連接協(xié)議層,Al Agent 是否能絲滑融入現(xiàn)有業(yè)務?對內,Al Agent 能與企業(yè)核心系統(tǒng)安全、穩(wěn)定地對接,對外,Al Agent能與外部生態(tài)進行交互。其中,任何一個不明確的連接協(xié)議,都可能導致任務執(zhí)行中斷、數(shù)據(jù)丟失或響應延遲,直接影響 Al Agent 的業(yè)務產(chǎn)出和用戶體驗。

第二,看知識口徑層,Al Agent 是否答得上且口徑一致?知識口徑一致決定了Al Agent 是否能言而有據(jù),在各種不同場景下都能輸出與企業(yè)標準保持一致的信息,真正承擔崗位職責。在落地前,需要確保 Al Agent 的知識來源是否能夠覆蓋關鍵業(yè)務文檔和規(guī)則,是否具備有效的知識庫版本管理機制。

第三,看觀測與治理層,Al Agent 是否透明可控?Al Agent 在業(yè)務鏈路運行時,是否有一套完善的觀測體系監(jiān)控其執(zhí)行效果和行為軌跡,是否能及時檢測到異常情況,定位異常觸發(fā)點,分析原因并最終解決。

第四,看結算口徑層,Al Agent 價值是否能與財務對齊?RaaS 模式下,Al Agent 崗位職責是否可以拆分成多個可驗收的明確節(jié)點,定義能與業(yè)務流程對齊的、清晰的 SLA,從而公平準確地衡量 Al Agent 價值。

4 結語:下一站是哪里?

當前的企業(yè)級 Al Agent 已經(jīng)成功實現(xiàn)了從工具到崗位的躍遷,下一站,是從具備通用能力的 Al Agent 轉向崗位專家。

其一,通過構建全流程數(shù)據(jù)工程體系,實現(xiàn)能力的深化。比如,百融云創(chuàng)正通過 “自動化清洗 - 專家話術提純 - 合成數(shù)據(jù)擴充” 的工業(yè)化生產(chǎn)線,將金融營銷、貸后管理等場景的優(yōu)質語料轉化為高質量訓練數(shù)據(jù),結合強化學習(RL)優(yōu)化獎勵模型,使主動大模型的溝通策略、風險識別能力向 “金牌員工” 對齊。

其二,通過多樣化能力實現(xiàn)場景的細化。以金融行業(yè)為例,在客戶通話過程中,Al Agent 可以引導客戶查看或操作相關業(yè)務內容,同時根據(jù)客戶的實時反饋自動調整溝通流程、表達方式甚至使用不同的方言,從而滿足客戶更多的細分場景。

當企業(yè)級 Al Agent 成為崗位專家,能以模板化方式復用,并且這些能力能夠與企業(yè)的財務口徑對齊時,規(guī)模化部署的條件就真正具備了。屆時,或將同時激發(fā)供需兩端活力,實現(xiàn)真正的人機共存。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
宣告奇跡出現(xiàn)剛2個月,蔡磊再破天花板,讓整個科研界“沉默”了

宣告奇跡出現(xiàn)剛2個月,蔡磊再破天花板,讓整個科研界“沉默”了

大眼妹妹
2025-11-27 20:17:22
這才是史上最成功的洗腦:西方這一百年來,對我們都做了什么?

這才是史上最成功的洗腦:西方這一百年來,對我們都做了什么?

愚鑒
2025-12-12 21:36:14
中國汽車又一里程碑!吉利獲5項吉尼斯世界記錄!

中國汽車又一里程碑!吉利獲5項吉尼斯世界記錄!

電動知家
2025-12-13 08:55:27
火箭快船裁判報告:官方解釋爭議判罰 快船吃虧申京2分本該不算

火箭快船裁判報告:官方解釋爭議判罰 快船吃虧申京2分本該不算

追球者
2025-12-13 06:08:34
北京警方刑拘5人:女孩找大師施法“我想和前男友復合”

北京警方刑拘5人:女孩找大師施法“我想和前男友復合”

極目新聞
2025-12-12 17:34:56
中央編辦同意,湖北單獨設立一家副廳級單位

中央編辦同意,湖北單獨設立一家副廳級單位

上觀新聞
2025-12-12 11:22:07
大家發(fā)現(xiàn)沒有,這次中日沖突比歷次都嚴重,卻沒有人喊抵制日貨了

大家發(fā)現(xiàn)沒有,這次中日沖突比歷次都嚴重,卻沒有人喊抵制日貨了

扶蘇聊歷史
2025-11-24 15:15:15
爆了爆了!18+10+13!感謝快船的大交易

爆了爆了!18+10+13!感謝快船的大交易

籃球實戰(zhàn)寶典
2025-12-12 18:05:18
李明為何會突然辭去國安總經(jīng)理,背后原因引發(fā)熱議,球迷都沒想到

李明為何會突然辭去國安總經(jīng)理,背后原因引發(fā)熱議,球迷都沒想到

懂個球
2025-12-12 17:37:14
俄軍遇挫波城,死亡通關損失慘重,美烏“和平”博弈步入深水區(qū)

俄軍遇挫波城,死亡通關損失慘重,美烏“和平”博弈步入深水區(qū)

史政先鋒
2025-12-12 22:14:17
《時代》2025年度人物:授予AI構建者黃仁勛、馬斯克、奧特曼、李飛飛等,同坐高空重現(xiàn)“摩天樓頂上的午餐”

《時代》2025年度人物:授予AI構建者黃仁勛、馬斯克、奧特曼、李飛飛等,同坐高空重現(xiàn)“摩天樓頂上的午餐”

和訊網(wǎng)
2025-12-12 15:22:04
邁阿密國際2026年美冠杯16強戰(zhàn)對手:納什維爾或渥太華競技

邁阿密國際2026年美冠杯16強戰(zhàn)對手:納什維爾或渥太華競技

懂球帝
2025-12-13 04:53:05
2500億造了座“空城”?碧桂園海外超級項目,如今空得讓人發(fā)毛

2500億造了座“空城”?碧桂園海外超級項目,如今空得讓人發(fā)毛

GA環(huán)球建筑
2025-12-06 10:28:42
市場監(jiān)管總局:嚴厲打擊 直播帶貨和食品、藥品等 重點領域的虛假宣傳等違法行為

市場監(jiān)管總局:嚴厲打擊 直播帶貨和食品、藥品等 重點領域的虛假宣傳等違法行為

每日經(jīng)濟新聞
2025-12-12 18:50:16
沒通知特朗普,高市再出歪招,當著全球的面,讓美國“壓制”中國

沒通知特朗普,高市再出歪招,當著全球的面,讓美國“壓制”中國

通文知史
2025-12-12 00:00:04
剛剛,央行重磅:注入6000億資金!利好哪些板塊?下周,行情穩(wěn)了

剛剛,央行重磅:注入6000億資金!利好哪些板塊?下周,行情穩(wěn)了

虎哥閑聊
2025-12-13 08:18:59
不能將核心算力長期建立在美國芯片之上

不能將核心算力長期建立在美國芯片之上

觀察者網(wǎng)
2025-12-11 14:18:27
咪咕致歉信:很遺憾暫未獲CBA轉播權 下午談判三小時仍未談攏

咪咕致歉信:很遺憾暫未獲CBA轉播權 下午談判三小時仍未談攏

醉臥浮生
2025-12-12 14:37:46
再忙背下這100句古詩詞,立即讓你提升一個境界

再忙背下這100句古詩詞,立即讓你提升一個境界

每日一首古詩詞
2025-12-03 21:50:58
安志杰美國豪宅首曝光!48歲肌肉依舊,混血妻兒顏值驚人

安志杰美國豪宅首曝光!48歲肌肉依舊,混血妻兒顏值驚人

TVB的四小花
2025-12-12 12:33:44
2025-12-13 09:39:00
InfoQ incentive-icons
InfoQ
有內容的技術社區(qū)媒體
11817文章數(shù) 51624關注度
往期回顧 全部

科技要聞

比亞迪、小鵬、北汽,集體表態(tài)

頭條要聞

女子在二手平臺買到被偷走的新衣服 約定線下交易報警

頭條要聞

女子在二手平臺買到被偷走的新衣服 約定線下交易報警

體育要聞

有了風騷白人禿頭,忘掉談了10年的前任

娛樂要聞

上海這一夜,33歲陳麗君秒了32歲吉娜?

財經(jīng)要聞

鎂信健康闖關港交所:被指竊取商業(yè)秘密

汽車要聞

表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

態(tài)度原創(chuàng)

健康
家居
房產(chǎn)
公開課
軍事航空

甲狀腺結節(jié)到這個程度,該穿刺了!

家居要聞

溫潤質感 打造干凈空間

房產(chǎn)要聞

每日狂增1300+企業(yè)!封關在即,海南徹底爆發(fā)!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄烏“和平計劃”磋商頓巴斯成焦點

無障礙瀏覽 進入關懷版 www.一区二区三区| 麻豆精品国产精华精华液| 最近日本MV字幕免费高清| 无码人妻一级毛片免费网站最新| 亚洲成人xxxxxxxx| 亚洲精品suv精品一区二区| 日日骚一区二区三区| 三年片免费观看影视大全视频| 麻豆产精国品一二三产区区| 亚洲精品456在线播放第3页| 亚洲美女综合久久| 亚洲美女高清aⅴ视频免费| 日产亚洲一区二区三区| 亚洲欧美综合国产不卡| 98色婷婷在线| 久久人人爽人人爽人人片av麻烦| 亚洲综合自拍第一页| 日本免费一级字幕| ,/J 1人91| av香蕉大人| 99在线视频精品费观看视| 吞精69成人免费看片| 国产精品久久久久久影院老司| 乱人伦中文字幕在线不卡网站| 久久久久国产精品免费消防器| 亚洲AⅤ无码日韩AV中文AV伦| 日本成人不卡V| 国产成人av乱码免费观看| 无码字幕av一区二区三区| 亚洲人成网站在线观看播放| 国产精品美女视频| 国产精品视频 2| 深夜黄色成人影院| 国内最真实的xxxx人伦| 久久久久人妻精品区一三寸| 久久精品久久电影免费理论片| 日本熟女无修正| 亚洲av片在线免费观看| 久久精品国产亚洲欧美| 日产乱码一二三区别免费麻豆| 久久亚洲精品中文字幕无|