夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

90%被大模型吃掉,AI Agent的困局

0
分享至



文|魏琳華

編|王一粟

“90%的Agent會被大模型吃掉?!?/p>

7月15日,金沙江創(chuàng)投主管合伙人朱嘯虎一如既往地語出驚人,這次炮轟的是近一年AI圈最炙手可熱的Agent。



在“Agent之年”進程過半的時候,最近傳來的似乎卻多是悲觀的判斷和信息。就在上周,Manus總部遷移至新加坡、國內(nèi)裁員80人以及放棄國內(nèi)版本上線的一系列動態(tài),也讓大眾開始討論起,Manus到底怎么了?

背后有身為美元基金的BenchMark領(lǐng)投、底層模型包含Gemini、Claude等一系列海外模型,加之曾陷入缺算力資源的傳聞,Manus的出走,已經(jīng)印證為形勢所迫的轉(zhuǎn)移和調(diào)整,而非經(jīng)營失敗導(dǎo)致的撤退。

但圍繞以Manus為首的通用Agent,它們頭頂?shù)臑踉粕形瓷⑷ィ阂贿吺荕anus、Genspark們收入變現(xiàn)的下滑,另一邊是用戶活躍度的下跌。

這種局面,揭示了當(dāng)下通用Agent賽道的核心問題:在技術(shù)熱潮和資本狂歡過后,產(chǎn)品尚未找到能讓廣大C端用戶持續(xù)“忠誠”并為之付費的殺手級應(yīng)用場景,只能被偶爾拿來做個半成品PPT、找?guī)追輬蟾妗?/p>

通用Agent市場,正在被模型能力的溢出蠶食,也被垂類Agent搶走份額。

轉(zhuǎn)戰(zhàn)海外,Manus們怎么了?

通用Agent,陷入了一個尷尬的境地。

在幾個月的時間里,通用Agent誕生時的驚艷不復(fù)存在:放在企業(yè)里,它無法和垂類Agent的精準(zhǔn)比肩;拿到個人手上,它又沒有找到更戳中用戶需求的場景。

模型能力的提升,先對Agent們“砍了一刀”。

隨著大模型能力的飛速發(fā)展,模型本身正在變得越來越“Agent化”,隨著模型性能的溢出,用戶可以直接調(diào)用模型來完成任務(wù)。

以目前進展更快的AI代碼為例,Anthropic的Claude、谷歌的Gemini系列模型,模型本身的編碼能力就在隨著更新提升,其自研的編碼工具(如Claude Code)不僅能給實現(xiàn)自主編程,優(yōu)化種種產(chǎn)品體驗之外,它的Max會員模式還支持用戶隨意調(diào)用自家模型,即使是每百萬輸出tokens收費75美元的Opus 4,單月200美元同樣支持不限量使用。



對比Manus最貴的Pro會員每月199美元的付費模式,價格雖然接近,但Manus的最高檔會員依舊是以積分制消費,Pro會員單月能獲得每日贈送的積分+單月19900積分+限時19900積分,靠任務(wù)消耗積分制來服務(wù)。按照單個任務(wù)100積分估算,一天使用次數(shù)也就在10次左右。

制約Manus的成本問題,轉(zhuǎn)嫁到用戶身上,就是不可消除的高訂閱價。

當(dāng)模型本身就能提供接近Agent的體驗時,用戶會自然傾向于直接使用更便宜、更便捷的模型API或?qū)υ捊缑妫穷~外付費使用一個功能重疊的通用Agent產(chǎn)品。這導(dǎo)致一部分市場份額被能力日益強大的基礎(chǔ)模型直接“吃掉”。

面向用戶來說,對比垂類Agent,通用Agent在企業(yè)端的應(yīng)用效果不佳,從效率/成果衡量,都無法達到“數(shù)字員工”的高度。

朱嘯虎說“90%的Agent市場會被吃掉”,但他所在的金沙江創(chuàng)投也參與了AI Agent項目融資,只是相比于通用Agent,他更看好能真正跑出效率和實際落地的產(chǎn)品。

金沙江投資的Head AI(原Aha Lab),就是一家靠AI Agent做自動化營銷的公司,現(xiàn)在升級為AI營銷產(chǎn)品。用創(chuàng)始人的話來說,只需告訴 Head 你的預(yù)算和網(wǎng)站,它就能自動搞定達人營銷、聯(lián)盟營銷和 Cold Email——一個人解決一個市場部。

對于企業(yè)用戶而言,準(zhǔn)確度和成本是核心訴求。但通用Agent目前還無法與針對特定場景優(yōu)化的垂類Agent相提并論。

如果把一樣的任務(wù)交給通用Agent和企業(yè)內(nèi)部的垂類Agent去做,前者只能靠搜索引擎結(jié)合需求給出結(jié)果,而后者則會連接到企業(yè)內(nèi)部搭建好的知識庫,根據(jù)內(nèi)部信息貼合需求輸出,相當(dāng)于后者身上“綁”了個更充足的資料庫,結(jié)果不言而喻。

企業(yè)在引入新技術(shù)時,對成本和風(fēng)險的控制要求極高。通用Agent通?;邶嫶蠖鴱?fù)雜的“黑盒”模型,其決策過程不透明,且輸出結(jié)果存在一定的隨機性(即“幻覺”問題)。對準(zhǔn)確度要求更高的企業(yè),顯然無法接受通用Agent不穩(wěn)定的輸出質(zhì)量。

一位Agent開發(fā)者告訴光錐智能,企業(yè)通常需要將Agent與內(nèi)部知識庫、業(yè)務(wù)流程系統(tǒng)深度集成,部分簡單的工作則會通過工作流來確保任務(wù)準(zhǔn)確執(zhí)行。

夾在大模型和垂類Agent之間,通用Agent被兩者各自瓜分走了一大塊蛋糕。

沒場景、待進化,Agent才走了個開頭

在“用不起來”的情況下,用戶對通用Agent熱情也不復(fù)當(dāng)初。

這也導(dǎo)致,以Manus們?yōu)榇淼腃端通用Agent正在面臨增長放緩、甚至倒退的困境。

雖然從商業(yè)化上來說,通用Agent確實展現(xiàn)了足夠吸金的一面。以Manus、Genspark等通用Agent為代表,近幾個月的變現(xiàn)成績證明了這個賽道的潛力:非凡產(chǎn)研數(shù)據(jù)顯示,今年5月,Manus已經(jīng)達到936萬美元ARR(年化收入),Genspark更是在發(fā)布45天的情況下,達到3600萬美元ARR。



但在短期的流量上漲過后,通用Agent產(chǎn)品們或多或少地出現(xiàn)了訪問量和收入下降的情況。

6月,Manus訪問量為1781萬,和3月發(fā)布即登頂?shù)脑L問量2376萬相比,已經(jīng)下跌25%;Genspark的訪問量也處在來回浮動的狀態(tài),6月訪問量為842萬次,下降8%,昆侖萬維天工超級智能體下降3.7%。

同樣是在6月,兩個商業(yè)化表現(xiàn)突出的產(chǎn)品Manus和Genspark出現(xiàn)不同程度的收入下跌。據(jù)非凡產(chǎn)研數(shù)據(jù),Manus當(dāng)月MRR(月度收入)為254萬美金,環(huán)比下跌超過50%;Genspark當(dāng)月MRR為295萬美金,環(huán)比下跌13.58%。

上述數(shù)據(jù)說明,在一時的熱度過后 ,通用Agent類產(chǎn)品的使用體驗并沒有能讓用戶持續(xù)付費的吸引力。同時,用戶體驗的頻次也在減弱。

究其原因,還是因為Manus們沒有找到足夠讓用戶為之持續(xù)付費的Killer(殺手級)場景。

目前,市場上多數(shù)通用Agent都在卷幾個固定的方向:做PPT、多模態(tài)能力、寫報告(Deep Research),多聚焦于和辦公強相關(guān)的場景。但對于用戶來說,這些定位還難以讓用戶持續(xù)付費。

在沒有找到確切的應(yīng)用方向前,通用Agent賽道已經(jīng)有一批公司先靠產(chǎn)品下水測試,意圖先搶占市場。

變現(xiàn)和流量不穩(wěn)定的情況下,大廠對自研Agent的精力投入有限,一般還是采取“兩手抓”的模式,在開發(fā)自家Agent產(chǎn)品之外,目前更多地在推廣自家Agent開發(fā)平臺。比如阿里、字節(jié)和百度,推廣平臺的同時發(fā)福利、組織Agent開發(fā)比賽,聚焦開發(fā)者生態(tài)搭建。



市場似乎已經(jīng)默認,通用Agent是小廠玩不起的生意。

可以看到,在國內(nèi)市場,除去Manus和GensPark零星幾家創(chuàng)業(yè)公司,多數(shù)通用Agent的開發(fā)公司都是手握自研大模型的公司:

其中,大廠不僅有模型,背后還有自家云做支援。通用Agent既是產(chǎn)品,也是他們作為B端平臺,通過C端產(chǎn)品展示能力的一面鏡子,以此招徠更多開發(fā)者。

大模型創(chuàng)業(yè)公司則本著“模型即Agent”的思路,更多在模型層就針對Agent對RL(強化學(xué)習(xí))、長文本等需求鉆研模型,才有了通用Agent產(chǎn)品。

國內(nèi)通用Agent玩家的收費模式,也比出海的方式更卷。以百度、字節(jié)為代表的大廠有能力公開測試,免費提供服務(wù)。如MiniMax、天工智能體等則以限量使用或是購買積分使用的方式開放。和大廠免費不限量的手段相比,國內(nèi)通用Agent賽道注定會越來越卷,商業(yè)化變現(xiàn)是一條看不到收益的路。

從場景來看,DeepResearch式的深度研究功能是更多產(chǎn)品選擇主攻的方向,對于文檔類Agent來說,調(diào)用工具的復(fù)雜程度相對較低,且文本生成的成本更低,算是一個更有性價比的方向。

在開發(fā)深度研究功能的基礎(chǔ)上,各家Agent開始在多模態(tài)能力和應(yīng)用場景上發(fā)力。一方面,在生成的文檔中插入圖片、視頻等多模態(tài)能力,另一方面,把目前和Agent契合的場景植入到通用Agent中,比如做PPT,幾乎成了辦公Agent的標(biāo)配。



但無論是拿來做報告,再用圖文錦上添花,還是用Agent做PPT,背后都無法解決Agent輸出效果一般的問題。比如一份深度研究報告,Agent最容易出現(xiàn)的是對事實信息檢索的錯漏,比如無法厘清Agent概念從而推薦大模型產(chǎn)品。

進一步的問題是輸出的信息價值不高。一份報告,零星只有3-4個信源,更多內(nèi)容從網(wǎng)絡(luò)篩選得來,往往只能得到模棱兩可的“廢話”。比如要它介紹大模型公司的生存挑戰(zhàn),它把開公司可能存在的問題都列個遍,既沒有針對性,也不具備有價值的增量信息。

于是,企業(yè)開始探索更多Agent能匹配的場景,試圖吸引更多用戶參與。Agent也難免后續(xù)變成自家公司產(chǎn)品的“集合入口”,被公司用各種方式把自家產(chǎn)品能力整合進去,比如MiniMax融入了海螺生視頻的能力,百度心響在場景中接入了原有的智能體對話等。

除了找不到貼合場景,當(dāng)前Agent能力有限,效果不一,也難以讓用戶為之買單。

通用Agent執(zhí)行任務(wù)一般是拆解任務(wù),再按照步驟執(zhí)行。越復(fù)雜的任務(wù),就意味著Agent執(zhí)行的過程更多,其中只要有任何一個步驟跑出的結(jié)果有問題,就會導(dǎo)致整體輸出結(jié)果質(zhì)量不佳。所以,對于復(fù)雜任務(wù)來說,當(dāng)前Agent執(zhí)行的穩(wěn)定性不足。

比如,輸出對一家公司的分析,就要從財報信息抓取、公司網(wǎng)頁介紹到各大信源的分析點評,其中有任何一個環(huán)節(jié)結(jié)果出錯,整體報告的分析質(zhì)量就會大打折扣。

當(dāng)下,一些Agent開發(fā)者正試圖通過技術(shù)創(chuàng)新來突破這些瓶頸。

比如MiniMax把年初發(fā)布的新的線性注意力機制用到了新模型M1中,其智能體產(chǎn)品以M1模型為基座模型。這樣的好處是大幅擴展了智能體能夠承載的文本量,支持100萬的上下文輸入,針對法律文書這類需要大量文本分析的場景效果更好。



月之暗面則強調(diào)“模型即Agent”,其基座模型是月之暗面基于端到端自主強化學(xué)習(xí)技術(shù)訓(xùn)練的新一代 Agent 模型。其中,RL(強化學(xué)習(xí))成為這個深度研究Agent的亮點。

多數(shù)業(yè)內(nèi)人曾在和光錐智能交流中肯定RL之于Agent的重要性。相比傳統(tǒng)的監(jiān)督學(xué)習(xí)或預(yù)訓(xùn)練模型在特定任務(wù)上表現(xiàn)出色,但其泛化能力往往受限于訓(xùn)練數(shù)據(jù)的分布。當(dāng)Agent需要處理的任務(wù)場景多樣化、環(huán)境動態(tài)變化時,預(yù)設(shè)規(guī)則或僅依賴一次性推理的Agent難以適應(yīng)。

比如,在處理一些需要多個流程完成的任務(wù)中,傳統(tǒng)模式可能在任一個環(huán)節(jié)中出現(xiàn)推測問題,進而影響到最終結(jié)果,但RL則是靠大量試錯和獎勵機制來提升泛化能力,對于需要多個步驟處理的復(fù)雜任務(wù),表現(xiàn)效果更好。


Kimi-Researcher主動針對矛盾信息的處理

可以說,RL能夠大幅提升Agent的能力上限。

Kimi-Researcher研究員馮一塵分享,在Humanity's Last Exam(HLE,人類的最后一場考試,衡量AI在各學(xué)科難題上的測試)榜單上,=gent模型得分從最初的8.6%躍升至26.9%,相比OpenAI Deep Research團隊在相關(guān)工作上從20分左右(o3)提升到26.6分的成果,進一步證明了強化學(xué)習(xí)在Agent訓(xùn)練上的巨大價值。

在技術(shù)的天花板還夠高的情況下,后來者正在拔高Agent的能力標(biāo)準(zhǔn)。今日(7月18日),OpenAI發(fā)布的通用Agent產(chǎn)品ChatGPT Agent跑出了一個漂亮的效果,在HLE 測試表現(xiàn)上,取得了41.6%的新SOTA 成績。



通過強化學(xué)習(xí),Agent有望從簡單的“工具調(diào)用器”進化為真正具備“自主學(xué)習(xí)”和“環(huán)境適應(yīng)”能力的智能體。屆時,通用Agent或許才能真正找到殺手級場景,并讓用戶心甘情愿地為其買單。

Agent的路還很長,只有靠技術(shù)突破和場景深耕,才能成為真正幫得上忙的AI助手。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
毛主席的父親毛貽昌,被劃分為富農(nóng),毛主席:所有財產(chǎn)劃分給農(nóng)民

毛主席的父親毛貽昌,被劃分為富農(nóng),毛主席:所有財產(chǎn)劃分給農(nóng)民

談古論今歷史有道
2025-08-20 13:47:39
媒體建議火箭進行6換1大交易,梭哈字母組三巨頭!西部要沒懸念了

媒體建議火箭進行6換1大交易,梭哈字母組三巨頭!西部要沒懸念了

籃球掃地僧
2025-08-22 12:42:59
皮蛋再次成為關(guān)注對象!張文宏發(fā)現(xiàn):常吃皮蛋的人有6大變化

皮蛋再次成為關(guān)注對象!張文宏發(fā)現(xiàn):常吃皮蛋的人有6大變化

觀星賞月
2025-08-15 05:32:07
62歲千百惠疑驟逝原因曝光!身體原本超健康 經(jīng)紀(jì)人慟:幾個月就離開

62歲千百惠疑驟逝原因曝光!身體原本超健康 經(jīng)紀(jì)人慟:幾個月就離開

ETtoday星光云
2025-08-21 15:02:16
判了!姜洪濤沒生育能力,堂哥送老二百萬房產(chǎn),老大真實目的曝光

判了!姜洪濤沒生育能力,堂哥送老二百萬房產(chǎn),老大真實目的曝光

阿萊美食匯
2025-08-21 15:52:17
薪酬曝光!人均底薪超120萬!

薪酬曝光!人均底薪超120萬!

中國半導(dǎo)體論壇
2025-08-21 21:51:55
大滿貫爆大冷:日本男單全軍覆沒,張本智和被淘汰,雨果3:0晉級

大滿貫爆大冷:日本男單全軍覆沒,張本智和被淘汰,雨果3:0晉級

知軒體育
2025-08-21 22:24:54
世界蚊子日:曾罕見的基孔肯雅熱正以破紀(jì)錄速度全球傳播

世界蚊子日:曾罕見的基孔肯雅熱正以破紀(jì)錄速度全球傳播

知新了了
2025-08-21 17:21:42
歐洲動作片女演員,天賦極高!

歐洲動作片女演員,天賦極高!

貴圈真亂
2025-08-17 09:56:48
應(yīng)邀出席2025年上海合作組織峰會的外國領(lǐng)導(dǎo)人和國際組織負責(zé)人名單公布

應(yīng)邀出席2025年上海合作組織峰會的外國領(lǐng)導(dǎo)人和國際組織負責(zé)人名單公布

新京報
2025-08-22 12:01:04
45歲人事部長被調(diào)去掃廁所,深夜退工作群聊,次日老總找11家經(jīng)銷商

45歲人事部長被調(diào)去掃廁所,深夜退工作群聊,次日老總找11家經(jīng)銷商

蕭十一郎1993
2025-08-19 16:35:03
男子借債700萬買阿里原始股,妻子鬧自殺,22年后銀行卡余額驚人

男子借債700萬買阿里原始股,妻子鬧自殺,22年后銀行卡余額驚人

南派將軍
2025-08-20 17:01:03
穆勒:以前我更喜歡C羅,隨著年齡的增長我發(fā)現(xiàn)梅西更勝一籌

穆勒:以前我更喜歡C羅,隨著年齡的增長我發(fā)現(xiàn)梅西更勝一籌

雷速體育
2025-08-22 08:29:26
倆兒非親生后續(xù),兒子:我不在乎,但離婚前該給的財產(chǎn)一分不能少

倆兒非親生后續(xù),兒子:我不在乎,但離婚前該給的財產(chǎn)一分不能少

振華觀史
2025-08-21 16:53:06
110英寸!華為旗艦新機官宣:9月1日,正式亮相!

110英寸!華為旗艦新機官宣:9月1日,正式亮相!

科技堡壘
2025-08-20 13:00:25
一直窩憋在福建?鄒陽回復(fù)球迷:成年人了 事情那么容易達成嗎?

一直窩憋在福建?鄒陽回復(fù)球迷:成年人了 事情那么容易達成嗎?

直播吧
2025-08-22 08:51:45
Lisa在濟州島被偶遇之后,顏值和身材都現(xiàn)了原形,完全讓人認不出

Lisa在濟州島被偶遇之后,顏值和身材都現(xiàn)了原形,完全讓人認不出

芊手若
2025-08-22 08:15:27
俄軍突然撤出紅軍城北部,沒等烏軍想明白,溫壓燃燒彈已傾瀉而下

俄軍突然撤出紅軍城北部,沒等烏軍想明白,溫壓燃燒彈已傾瀉而下

影孖看世界
2025-08-20 17:20:22
朱自清長子被執(zhí)行死刑33年后,法院:判決純屬錯判,決定撤銷原判

朱自清長子被執(zhí)行死刑33年后,法院:判決純屬錯判,決定撤銷原判

顧史
2025-08-11 10:37:39
傳《復(fù)聯(lián)5》片場小唐尼和瑞安·雷諾茲吵了起來

傳《復(fù)聯(lián)5》片場小唐尼和瑞安·雷諾茲吵了起來

3DM游戲
2025-08-21 21:46:21
2025-08-22 13:16:49
光錐智能 incentive-icons
光錐智能
來這里,看千行百業(yè)的數(shù)字化、智能化。
765文章數(shù) 138關(guān)注度
往期回顧 全部

科技要聞

命運曲折!傳H20芯片停產(chǎn),英偉達這樣回應(yīng)

頭條要聞

牛彈琴:指責(zé)俄羅斯是"侵略國" 特朗普又變臉了

頭條要聞

牛彈琴:指責(zé)俄羅斯是"侵略國" 特朗普又變臉了

體育要聞

詹杜庫2K26能力值:三人均進Top10 詹庫都是94

娛樂要聞

許凱遭前女友爆料 疑出軌演員趙晴

財經(jīng)要聞

楊德龍:突破4000點只是時間問題

汽車要聞

新智界R7/S7首發(fā)車外語音泊車功能,華為黑科技上車

態(tài)度原創(chuàng)

教育
健康
本地
時尚
公開課

教育要聞

老師說這道題明顯超綱了,屬于小學(xué)的奧數(shù)題

精神科專家解答青少年焦慮六大問題

本地新聞

22℃的吉林夏天 | 江風(fēng)沁心涼,游艇畫中行!

今年秋天,穿得越放松越好看!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 欧美极品性饥渴少妇大战黑人| 国产精品人成在线观看免费| 天天搞美女视频| 欧美性爱福利网| www 在线观看免费色视频| 国产嗯嗯啊啊在线| 成年人看毛片| 欧美 成人 精品| 人人摸夜夜操狠狠操| 国模精品在线观看| 精品久久久久久无码| 久久农村少妇大全| 黑人扒开双腿国产精品| 伊人久久大香线蕉综合bd高清| 97久久超碰亚洲视觉盛宴| 日韩一区普通话| 你懂的视频在线播放| 精品久久久久久中文字幕人妻最新| 亚洲少妇精品视频一区二区三区| 国产1区不卡| 亚洲av午夜福利精品一区二区| 亚洲激情一区二区| 后入极品少妇| 国产区日韩欧美| jzzijzzij在线观看亚洲熟妇| 好吊视频一二三| 毛片段免费视频| 国产亚洲色视频在线| 亚洲AV午夜福利精品| 日韩人妻一区二区三区免费| 亚洲动漫精品无码AV天堂| 欧美在线看片a免费观看| 国产无码不卡免费视频不卡免费视频不卡| 无码伊人66久久大杳蕉网站谷歌| 在线视频 你懂得| 五月丁香六月婷婷在线| 久久久久国产亚洲AV麻豆| 午夜裸体性播放| 欧美另类videosbestsex| 国产乱码精品一区二区麻豆| 欧美成人性爱视频一区|