本篇內(nèi)容轉(zhuǎn)載自「特工宇宙」
基礎(chǔ)大模型不僅僅是生成式 AI 的核心引擎,它們正在塑造計算的未來。隨著其能力和成本控制的不斷演進(jìn),建立在其之上的系統(tǒng)、應(yīng)用乃至整個產(chǎn)業(yè)格局,也將隨之變革。
去年 11 月,Menlo Ventures 發(fā)布了《2024 企業(yè)生成式 AI 現(xiàn)狀報告》。彼時,關(guān)于這一基礎(chǔ)層仍有諸多關(guān)鍵問題懸而未決:
大語言模型的 API 需求是否能與消費級應(yīng)用的增長節(jié)奏保持一致?
模型將變得多智能?進(jìn)化速度又將如何?
開源模型是否會在性能上趕超閉源的前沿模型?如果會,這將如何影響企業(yè)的采用路徑?
最關(guān)鍵的是,長期價值究竟會沉淀在哪里?
六個月過去,從數(shù)據(jù)維度來看,這些問題目前已經(jīng)較為清晰:
在這段時期內(nèi),模型 API 支出增長了一倍多,從 35 億美元躍升至 84 億美元。企業(yè)的重心已從模型的訓(xùn)練微調(diào)轉(zhuǎn)向模型推理,這標(biāo)志著一個重要的階段性轉(zhuǎn)折。
“代碼生成”成為第一個大規(guī)模爆發(fā)的 AI 應(yīng)用場景。在預(yù)訓(xùn)練之外,基礎(chǔ)模型正在沿著另一條軸線升級能力——結(jié)合驗證器的強(qiáng)化學(xué)習(xí)(RLHF with verifiers)。
與此同時,盡管開源模型持續(xù)取得進(jìn)展,但西方實驗室在前沿模型突破上的放緩,也在一定程度上抑制了企業(yè)側(cè)的開源采用趨勢。過去大家看到模型天天突破,企業(yè)紛紛入場;現(xiàn)在模型進(jìn)展沒那么猛了,企業(yè)開始“更理性消費”,不再四處嘗試,而是抱緊那些成熟好用的閉源大模型。結(jié)果是,企業(yè)的投入正集中流向少數(shù)幾個高性能的閉源模型,而 Anthropic 也因此躍升為新的市場領(lǐng)跑者。
近期,Menlo Ventures 發(fā)布了一份2025年年中LLM市場情況觀察報告,為了全面捕捉當(dāng)前 LLM 市場的狀態(tài),Menlo Ventures 調(diào)研了 150 多位來自初創(chuàng)公司和大型企業(yè)的技術(shù)負(fù)責(zé)人,聚焦于當(dāng)下 AI 技術(shù)棧的基礎(chǔ)層:誰在贏得市場份額?哪些模型已投入生產(chǎn)?又是哪些選擇標(biāo)準(zhǔn)正在影響整個技術(shù)棧的構(gòu)建?
以下為報告原文內(nèi)容。
原文:
https://menlovc.com/perspective/2025-mid-year-llm-market-update/
超 10000 人的「AI 產(chǎn)品市集」社群!不錯過每一款有價值的 AI 應(yīng)用。
邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,飛書掃碼加群:
進(jìn)群后,你有機(jī)會得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準(zhǔn)的AI產(chǎn)品曝光渠道
01Anthropic 在企業(yè)使用率上超越 OpenAI到 2023 年底,OpenAI 曾占據(jù)企業(yè)級大模型市場50% 的份額,是當(dāng)之無愧的第一。但這一領(lǐng)先優(yōu)勢如今已經(jīng)明顯縮水?,F(xiàn)在,OpenAI 的企業(yè)使用率只剩25%,是兩年前的一半。 最新的市場頭號玩家是Anthropic,它在企業(yè) AI 市場的占比達(dá)32%,超過了 OpenAI 和最近增長迅猛的Google(20%)。Meta 的開源模型 Llama 占9%,而盡管DeepSeek在年初高調(diào)發(fā)布,目前的企業(yè)使用占比卻只有1%
Anthropic 登上大模型排行榜榜首的勢頭,真正開始于 2024 年 6 月 Claude Sonnet 3.5 的發(fā)布。到了 2025 年 2 月,Claude Sonnet 3.7 的推出進(jìn)一步加速了這股勢頭,它首次真正展示了“以 Agent 為核心”的大模型雛形。而在 2025 年 5 月,Claude Sonnet 4、Opus 4 與 Claude Code 的相繼發(fā)布,則徹底鞏固了 Anthropic 的領(lǐng)先地位。
推動 Anthropic 崛起的三大行業(yè)趨勢:
1. 代碼生成成為 AI 的第一個殺手級應(yīng)用。
Claude 很快就成為開發(fā)者進(jìn)行代碼生成時的首選,占據(jù)了42% 的市場份額,是 OpenAI(21%)的兩倍還多。僅僅一年時間,Claude 就將原本由 GitHub Copilot 主導(dǎo)的單一產(chǎn)品市場,拓展成了一個價值 19 億美元的生態(tài)系統(tǒng)。2024 年 6 月發(fā)布的 Claude Sonnet 3.5 展示了模型層的突破如何直接推動應(yīng)用層的演化,催生出一系列全新形態(tài)的產(chǎn)品:如 AI IDE(Cursor、Windsurf)、應(yīng)用構(gòu)建工具(Lovable、Bolt、Replit),以及企業(yè)級代碼智能體(Claude Code、All Hands)等。
2. 帶驗證器的強(qiáng)化學(xué)習(xí)成為智能擴(kuò)展的新路徑。
過去擴(kuò)展大模型智能的主路徑,是不斷加大模型規(guī)模、喂入更多數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。但到了 2024 年,互聯(lián)網(wǎng)數(shù)據(jù)的增長已接近瓶頸,單靠“加量”難以持續(xù)提升。帶可驗證獎勵的強(qiáng)化學(xué)習(xí)(RLVR)成為新的突破口,尤其適用于代碼這類結(jié)果明確、易于檢驗的任務(wù)領(lǐng)域。這一策略也正逐步成為模型后訓(xùn)練階段的關(guān)鍵路徑,用于提升可靠性與實際能力。
3. 訓(xùn)練模型成為“Agent”,讓它們真正有用起來。
最初的大語言模型被設(shè)計為“一問一答”的形式,目標(biāo)是在單輪對話中完成任務(wù)。而現(xiàn)在,更強(qiáng)的能力來自于賦予模型“多輪思考”的能力:一步步推理、持續(xù)交互、靈活調(diào)用工具——也就是所謂的 Agent。2025 年被稱為“Agent 之年”,正是因為這一范式的爆發(fā)。Anthropic 是其中的領(lǐng)先者,它率先訓(xùn)練模型進(jìn)行多輪自我優(yōu)化,并通過 MCP 協(xié)議接入包括搜索、計算器、編程環(huán)境等外部工具,大幅提升了模型的執(zhí)行力與用戶粘性。
02企業(yè)側(cè)的開源模型采用趨于平緩
當(dāng)前約有 13% 的 AI 任務(wù)運行在開源模型上,較六個月前的 19% 略有下降。市場領(lǐng)先者依然是 Meta 的 Llama 系列,但 2024 年 4 月發(fā)布的 Llama 4 在真實場景中的表現(xiàn)未達(dá)預(yù)期,略顯平庸。
過去半年內(nèi),開源領(lǐng)域仍相當(dāng)活躍,涌現(xiàn)出多個值得關(guān)注的模型發(fā)布,包括:DeepSeek(V3、R1)、字節(jié)跳動的 Seed(豆包)、MiniMax(Text 1)、阿里巴巴(Qwen 3)、Moonshot AI(Kimi K2)以及智譜 AI(GLM 4.5)。這些模型目前都可以通過 OpenRouter 的統(tǒng)一 API 進(jìn)行試用。
開源模型對企業(yè)的吸引力依舊顯著:可高度定制、更具成本優(yōu)勢,并支持私有云或本地化部署。然而,盡管模型能力在持續(xù)進(jìn)步,開源模型在整體性能上仍落后于前沿閉源模型 9~12 個月。
這一性能差距,加上開源模型部署上的技術(shù)復(fù)雜度,以及一些企業(yè)對來自中國公司的 API 持保留態(tài)度(而這些公司恰恰貢獻(xiàn)了近階段表現(xiàn)最亮眼的開源模型),共同導(dǎo)致了開源模型市場份額的停滯。
不僅僅是企業(yè)。出于這些原因,采用開源模式的初創(chuàng)企業(yè)也越來越少。正如一位受訪者所說:
目前,我們 100% 的生產(chǎn)工作負(fù)載都在閉源模型上運行。我們最初使用 Llama 和 DeepSeek 進(jìn)行 POC(概念驗證),但隨著時間的推移,它們的性能已經(jīng)無法與閉源模型相媲美。
03企業(yè)更換模型的動因是性能,而非價格
模型供應(yīng)商切換本身相對容易,但如今已不常見。大多數(shù)團(tuán)隊會留在原平臺上,僅在新模型發(fā)布時升級版本。一旦選定某個平臺,企業(yè)傾向于穩(wěn)定使用,并在第一時間追新?lián)Q代。
根據(jù)調(diào)研數(shù)據(jù):66% 的開發(fā)者選擇在原有供應(yīng)商體系內(nèi)升級模型;23% 一整年都沒有更換模型;只有 11% 實際切換了模型供應(yīng)商。
真正驅(qū)動決策的是性能,不是價格。開發(fā)者們始終將“前沿性能”作為首選標(biāo)準(zhǔn),而非更便宜或速度更快的替代品。他們愿意為性能買單。當(dāng)新模型發(fā)布時,切換行為往往在數(shù)周內(nèi)完成。例如,在 Claude 4 發(fā)布后僅一個月內(nèi),Claude 4 Sonnet 就拿下了 45% 的 Anthropic 用戶,而 Sonnet 3.5 的使用占比則從 83% 降至 16%。
性能優(yōu)先邏輯下的一個“反直覺現(xiàn)象”是:哪怕舊模型價格大幅下降(甚至降價十倍),開發(fā)者也不會為省錢而回頭使用它們——他們只會集體奔赴性能最強(qiáng)的那個新模型。
04AI 支出正從訓(xùn)練轉(zhuǎn)向推理
計算支出正穩(wěn)步從模型構(gòu)建和訓(xùn)練,轉(zhuǎn)向推理。這種轉(zhuǎn)變在初創(chuàng)企業(yè)中最為明顯:74%的模型開發(fā)者表示,他們的大部分工作任務(wù)都來自推理,高于一年前的48%,大型企業(yè)也緊隨其后。近一半(49%)的企業(yè)表示,他們的大部分或幾乎所有計算任務(wù)都由推理驅(qū)動,高于去年的29%。
轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.