作者|王一鵬
2025 年 9 月 19 日,亞馬遜云科技官宣:Qwen3 和 DeepSeek v3.1,首次上線 Amazon Bedrock ,正式對(duì)外提供服務(wù),再一次引起了全球生成式 AI 市場(chǎng)對(duì) Amazon Bedrock 這一產(chǎn)品的關(guān)注。
DeepSeek v3.1 部分測(cè)試成績(jī),圖片來(lái) DeepSeek 官方文檔
Qwen3-235B 系列測(cè)試成績(jī),圖片來(lái)自通義千問(wèn)微信公眾號(hào)
Amazon Bedrock 最早以“大模型貨架”的形態(tài)出現(xiàn)在亞馬遜云科技的客戶面前,其核心理念是“Choice Matters”(選擇大于一切),目標(biāo)是為不同業(yè)務(wù)提供最契合的基礎(chǔ)模型。所以,自產(chǎn)品發(fā)布起,主流模型會(huì)以最快的速度上架 Amazon Bedrock 供客戶選用,且整體“供貨”數(shù)量是市面競(jìng)品的兩倍以上,達(dá)到二百余款。
“Choice Matters”理念的提出,源于一個(gè)對(duì)基礎(chǔ)模型能力的判斷:行業(yè)內(nèi)不存在一個(gè)在所有場(chǎng)景中性能、性價(jià)比都為最優(yōu)的通用模型。而回顧 2025 基礎(chǔ)模型廠商不斷變化的競(jìng)爭(zhēng)態(tài)勢(shì),以及不同模型,針對(duì)不同地區(qū)服務(wù)政策的變化,讓這一理念變得更富實(shí)際意義。
從這一點(diǎn)來(lái)看,亞馬遜云科技一直以來(lái)堅(jiān)持的 “Choice Matters” ,已經(jīng)是個(gè)相對(duì)委婉的說(shuō)法——如果在模型選擇上不夠靈活多樣,企業(yè)正在推行的 AI 軟件策略可能會(huì)陷入被動(dòng)境地。
基礎(chǔ)模型的“行業(yè)波動(dòng)”,
仍在進(jìn)行中
2023 年,亞馬遜云科技首次提出“Choice Matters” 理念,但彼時(shí)的行業(yè)尚未就此達(dá)成共識(shí)。邏輯上或許認(rèn)可,但情感上多少有點(diǎn)將信將疑。因?yàn)橛袃蓚€(gè)技術(shù)推論,模糊了當(dāng)時(shí)的行業(yè)認(rèn)知。
其一來(lái)自資本側(cè),普遍觀點(diǎn)是:大模型訓(xùn)練成本高的嚇人,萬(wàn)卡集群是入場(chǎng)券,閉源模型占據(jù)主導(dǎo),開(kāi)源模型數(shù)量有限,“百模大戰(zhàn)”會(huì)收縮為幾家巨頭之間的競(jìng)爭(zhēng),選擇本來(lái)就不多。
其二來(lái)自技術(shù)側(cè),認(rèn)為從數(shù)據(jù)到架構(gòu),大語(yǔ)言模型的進(jìn)化空間都不大。在數(shù)據(jù)層面,高質(zhì)量的數(shù)據(jù)是有限的,沒(méi)有足夠的數(shù)據(jù)就無(wú)法制造新的“智能涌現(xiàn)”。在架構(gòu)層面,Transformer 仍是“唯一解”,短期內(nèi)看不到更優(yōu)的替代方案。因此,關(guān)于大模型的“技術(shù)摸高”將在短期結(jié)束,模型廠商的研發(fā)重點(diǎn),會(huì)從基礎(chǔ)模型性能提升,轉(zhuǎn)向服務(wù)垂直行業(yè)的解決方案。
這兩個(gè)推論的影響力有多大呢?行業(yè)某知名投資人和云計(jì)算公司,都是第一個(gè)推論的擁躉。而像百川智能及其他幾家知名公司,則對(duì)第二個(gè)推論深信不疑,過(guò)早放棄了對(duì)基礎(chǔ)模型的技術(shù)探索,也間接錯(cuò)過(guò)了 AI Agent 的紅利。
實(shí)際上,技術(shù)摸高,不是一個(gè)短期行為,大模型的技術(shù)發(fā)展曲線依舊足夠陡峭,市場(chǎng)選擇也足夠豐富。圍繞單一模型構(gòu)建的 AI 能力,很有可能在被新的基礎(chǔ)模型突破所折疊。這種情況常見(jiàn)于定制化的 To B AI 解決方案。
2025 年 1 月以前,基于開(kāi)源模型能力,完成交付驗(yàn)收的定制化 AI 解決方案,幾乎全部因?yàn)?DeepSeek 的發(fā)布,變得不合時(shí)宜。而后來(lái)交付的部分方案,在 Qwen3 、Kimi K2、DeepSeek v3.1 陸續(xù)發(fā)布后,又被再次丟進(jìn)技術(shù)的“垃圾桶”——半年刷新三次,生動(dòng)地解釋了“單一模型解決方案”的巨大短板。
此外,在 2025 年,音視頻模型的技術(shù)演進(jìn)速度也在加快,AI 短劇成了“藍(lán)海市場(chǎng)”,未來(lái)市場(chǎng)規(guī)??赡苓_(dá)到千億級(jí)。那么對(duì)于大量新成立的工作室而言,如何構(gòu)建何選擇工具,也是核心問(wèn)題。
毫無(wú)疑問(wèn),無(wú)論是對(duì)于企服行業(yè)、AI 短劇行業(yè),亦或是正在推動(dòng) AI 落地業(yè)務(wù)的公司而言,能夠應(yīng)對(duì)行業(yè)波動(dòng)的、靈活、多元化的 MaaS 基礎(chǔ)設(shè)施,都是必須的。
2025 大模型發(fā)展格局,圖片來(lái)自外灘大會(huì)專場(chǎng)分享
而在堅(jiān)持投入兩年后,Amazon Bedrock 也幾乎成了唯一答案。
拋開(kāi)令人驚詫的模型數(shù)量和上新速度不談,Amazon Bedrock 甚至已能為具體行業(yè)、具體場(chǎng)景提供差異化的模型選型建議。
比如,媒體廣告行業(yè)可以選擇 Marengo、Pagsus、Stable Diffusion;金融行業(yè)可以選擇 Palmyra x5;重推理場(chǎng)景可以選擇 DeepSeek - v3.1;文本摘要可以選擇 Mixtral……比起用 DeepSeek 解決一切問(wèn)題的技術(shù)方案,這讓人放心得多。以 Palmyra x5 為例,其上下文窗口為 100 萬(wàn) Token,比一般推理模型高出一個(gè)數(shù)量級(jí),因此更適應(yīng)財(cái)務(wù)報(bào)告和法律合同分析。
如果考慮到在 2025 年抵達(dá)高潮的中企出海趨勢(shì),“Choice Matters” 策略的重要性還在提升——畢竟在模型選型問(wèn)題上,國(guó)內(nèi)與海外完全是兩套選型模板、兩套采購(gòu)清單。但無(wú)論哪種模型,大概率能在 Amazon Bedrock 的貨架上找到。這也是近年來(lái),亞馬遜云科技實(shí)現(xiàn)營(yíng)收快速增長(zhǎng)的原因之一。
2024 年,亞馬遜云科技全球營(yíng)收突破千億美元大關(guān),“Choice Matters” 策略的成功實(shí)施功不可沒(méi)。
靈活,是模型選型的核心關(guān)鍵
Palmyra x5 的出現(xiàn),某種程度上也映射了大模型的整體發(fā)展趨勢(shì):從單一走向多元化,從具備通識(shí)能力,演變?yōu)榫邆鋵I(yè)能力。當(dāng) Agentic AI 借助 MCP、A2A 協(xié)議開(kāi)始調(diào)用不同智能體、模型完成精細(xì)化分工時(shí), “Choice Matters” 策略也注定成為未來(lái) Agent 平臺(tái)的內(nèi)生邏輯。
所謂專業(yè)能力與精細(xì)化分工,本質(zhì)源于不同模型的設(shè)計(jì)思路和訓(xùn)練數(shù)據(jù)不同。
還是以 Palmyra x5 為例。要支持百萬(wàn)級(jí) Token 上下文,是有代價(jià)的。首先上下文長(zhǎng)度增加,可能會(huì)導(dǎo)致計(jì)算復(fù)雜度、內(nèi)存占用出現(xiàn)平方級(jí)增長(zhǎng)。而單純?cè)黾由舷挛?,并不意味著模型能有效利用所有信息。事?shí)上,模型注意力會(huì)呈現(xiàn)“U 型分布”,即更容易關(guān)注到上下文開(kāi)頭和結(jié)尾的信息,而中間部分的信息容易被忽略,這被稱為“中間迷失”現(xiàn)象。
對(duì)于 Palmyra x5 而言,消解“中間迷失”現(xiàn)象,勢(shì)必成為技術(shù)團(tuán)隊(duì)的重點(diǎn)工作。
反過(guò)來(lái)看,本次新上線的 DeepSeek v3.1,并非刻意針對(duì)金融場(chǎng)景,而是更強(qiáng)調(diào) Agent 能力,強(qiáng)調(diào)推理效率。對(duì)于 DeepSeek 過(guò)去半年多在行業(yè)的落地情況來(lái)看,維持滿血版運(yùn)行已經(jīng)需要相當(dāng)?shù)乃懔Τ杀?,盲目增加上下文窗口?shí)無(wú)比要。
對(duì)訓(xùn)練數(shù)據(jù)的選擇也決定了模型在不同場(chǎng)景下的表現(xiàn)。
從已知情況來(lái)看,DeepSeek v3.1 新增的 840B Tokens,重點(diǎn)提升了代碼和數(shù)學(xué)類(lèi)的占比,以進(jìn)一步提升邏輯推理和數(shù)學(xué)能力。
DeepSeek 稱其為“邁向 Agentic AI 時(shí)代的第一步”,那么保守猜測(cè),DeepSeek v3.1 可能也新增了相當(dāng)比例的 Agentic 數(shù)據(jù)。
Agentic 數(shù)據(jù)是為訓(xùn)練 AI 智能體(AI Agent)而專門(mén)準(zhǔn)備的數(shù)據(jù),其核心在于包含行動(dòng)軌跡、決策過(guò)程和環(huán)境交互信息。它超越了傳統(tǒng)的純文本對(duì)話數(shù)據(jù),更注重智能體在完成任務(wù)時(shí)的多步動(dòng)作、工具使用、決策邏輯(包括錯(cuò)誤嘗試和糾正)以及與環(huán)境(如 API、數(shù)據(jù)庫(kù))的互動(dòng)。
Qwen 3 也很重視代碼、數(shù)學(xué)、Agentic 數(shù)據(jù),同時(shí)還特別強(qiáng)調(diào)了多語(yǔ)言能力——其中文訓(xùn)練數(shù)據(jù)僅占比 45%,在應(yīng)用場(chǎng)景上支持 119 種語(yǔ)言。在成本方面,Qwen 3 的部署成本大幅下降, 4 張 H20 即可部署 Qwen 3 滿血版,顯存占用僅為性能相近模型的三分之一。
綜合來(lái)看,如何才能保障 AI 成功落地業(yè)務(wù),使 AI 在每個(gè)設(shè)計(jì)場(chǎng)景下都能達(dá)成最佳效果?很顯然,要靈活選型,靈活調(diào)用。亞馬遜云科技數(shù)據(jù)和 AI GTM 副總裁 Rahul Pathak 在博客中很好地總結(jié)了這一問(wèn)題(基于原文翻譯,略有編輯):
在考慮模型選擇時(shí),需要考慮三個(gè)關(guān)鍵點(diǎn):
不同的用例需要不同的工具。不應(yīng)該期望一種模型能夠以最佳方式解決每個(gè)業(yè)務(wù)問(wèn)題。
在模型之間進(jìn)行實(shí)驗(yàn)和切換的能力不僅方便,而且是一種競(jìng)爭(zhēng)優(yōu)勢(shì)。能夠針對(duì)特定用例快速測(cè)試和部署不同模型的組織始終優(yōu)于那些鎖定在單一模型方法中的組織。
成本優(yōu)化來(lái)自于將正確的模型與每項(xiàng)任務(wù)相匹配,既要防止過(guò)度設(shè)計(jì),也要杜絕表現(xiàn)欠佳。
就第二點(diǎn)“競(jìng)爭(zhēng)優(yōu)勢(shì)”而言, Amazon Bedrock 已經(jīng)將其沉淀為了系統(tǒng)級(jí)能力。
Amazon Bedrock 為模型評(píng)估設(shè)置了兩條核心路徑:自動(dòng)評(píng)估和人工評(píng)估。自動(dòng)評(píng)估適用于客觀指標(biāo),而人工評(píng)估則針對(duì)主觀判斷。后者還可以借用亞馬遜云科技官方提供的人工評(píng)估團(tuán)隊(duì)。無(wú)論哪種方式,最終都會(huì)生成詳細(xì)的評(píng)估報(bào)告,供決策參考。
Amazon Bedrock 同時(shí)提供了精選的公開(kāi)數(shù)據(jù)集,涵蓋問(wèn)答、摘要等多種任務(wù),也允許企業(yè)上傳自己業(yè)務(wù)場(chǎng)景下的特定數(shù)據(jù)集,進(jìn)一步提升了模型測(cè)試和選型能力的實(shí)際價(jià)值。
如果說(shuō) AI 確實(shí)在對(duì)部分傳統(tǒng)工作進(jìn)行替代,那么傳統(tǒng)咨詢公司在 2023 年部分主營(yíng)業(yè)務(wù)——模型介紹、推薦與評(píng)估——已經(jīng)被 Amazon Bedrock 完全替代了。好在,這也符合現(xiàn)代企業(yè)發(fā)展的自然規(guī)律:將人員能力,逐步沉淀為系統(tǒng)能力,最終反哺業(yè)務(wù)發(fā)展
如此來(lái)看,以 Amazon Bedrock 為典型呈現(xiàn)的“Choice Matters” 策略,也正對(duì) AI 落地行業(yè)的整體進(jìn)程,產(chǎn)生深遠(yuǎn)影響。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.