文 | 大模型之家
“天下大勢(shì),分久必合,合久必分?!?/p>
2025年的人工智能賽道,正呈現(xiàn)出一種強(qiáng)烈的分裂感。如果說(shuō)前幾年是“百模大戰(zhàn)”的“戰(zhàn)國(guó)時(shí)代”,所有玩家都在同一條“Scaling Law”(規(guī)模法則)的跑道上野蠻沖鋒;那么2025年,市場(chǎng)則在劇烈的震蕩后,清晰地分化出了兩條截然相反、卻又彼此糾纏的敘事。
一個(gè)“向上”,一個(gè)“向下”。
“向上”的敘事由行業(yè)巨頭領(lǐng)銜。不久前,阿里通義Qwen3-Max在多個(gè)權(quán)威基準(zhǔn)測(cè)試中成功“登頂”,在被視為最能反映人類(lèi)綜合偏好的LMArena盲測(cè)競(jìng)技場(chǎng)上,躋身全球前三,一度超越了GPT-5-Chat的特定版本。這是國(guó)產(chǎn)大模型首次在性能的“珠峰”上,與OpenAI、Anthropic等全球頂級(jí)玩家實(shí)現(xiàn)了真正意義上的“同框競(jìng)技”。這是“規(guī)模敘事”的延續(xù),是“大力出奇跡”的階段性勝利。
“向下”的敘事則由技術(shù)新貴驅(qū)動(dòng)。幾乎在同一時(shí)間,DeepSeek發(fā)布了其最新的DeepSeek-V3.2-Exp模型,在性能與前代旗艦保持相當(dāng)?shù)那疤嵯?,API價(jià)格悍然“腰斬”,降幅超過(guò)50%。尤其在輸出端,價(jià)格從12元/百萬(wàn)Tokens驟降至3元/百萬(wàn)Tokens。這場(chǎng)價(jià)格戰(zhàn)的背后并非是“流血補(bǔ)貼”,而是一場(chǎng)由底層技術(shù)突破發(fā)起的“成本突破”。
這不是偶然的巧合,而是兩條路線(xiàn)的必然碰撞。一方在不計(jì)代價(jià)地推高智能的“天花板”,另一方在不遺余力地?fù)舸┏杀镜摹暗匕濉薄?/strong>
這場(chǎng)關(guān)乎“極限性能”與“極致普惠”的博弈,正在重塑AI的商業(yè)邏輯。它所激發(fā)的矛盾,比模型參數(shù)本身更值得深思:當(dāng)“規(guī)?!痹庥觥靶省?,當(dāng)“開(kāi)源”挑戰(zhàn)“閉源”,當(dāng)“中小企業(yè)的狂歡”遭遇“頭部巨頭的利潤(rùn)保衛(wèi)戰(zhàn)”,這場(chǎng)戰(zhàn)爭(zhēng)的“中場(chǎng)”,究竟在走向何方?
“登頂”的執(zhí)念:AI巨頭的“3A游戲”
對(duì)于巨頭而言,似乎都對(duì)于一路陪伴走來(lái)的“Scaling Law”抱有執(zhí)念,不斷探索著規(guī)模與能力的邊界。
例如,Qwen3-Max的出現(xiàn),即是對(duì)“參數(shù)競(jìng)賽”有效性的強(qiáng)力背書(shū)。在AI領(lǐng)域,“規(guī)模”一度是通往更高智能的唯一信仰。Qwen3-Max正是這一信仰的產(chǎn)物。
根據(jù)多方分析和披露,Qwen3-Max是一個(gè)參數(shù)量達(dá)到萬(wàn)億級(jí)別的“龐然大物”,而巨大的體量也著實(shí)為其帶來(lái)了相匹配的實(shí)力:在SWE-Bench Verified上獲得了69.6分的世界級(jí)成績(jī);在考驗(yàn)Agent能力的Tau2-Bench上,超越了Claude Opus 4;在AIME等高難度推理任務(wù)上,其“Thinking”變體甚至取得了驚人的滿(mǎn)分或接近滿(mǎn)分的表現(xiàn)。
阿里不惜投入巨量資源,將Qwen3-Max推向SOTA,其戰(zhàn)略意圖清晰而堅(jiān)定。這本質(zhì)上是一場(chǎng)只有巨頭才能玩得起的“3A游戲”。
正如在游戲行業(yè),3A大作意味著高昂的開(kāi)發(fā)成本、頂級(jí)的制作水準(zhǔn)和龐大的宣發(fā)資源,大模型領(lǐng)域的“規(guī)模競(jìng)賽”亦是如此。它是通過(guò)人力、財(cái)力、物力的極致堆砌,構(gòu)建起一道后來(lái)者難以逾越的性能壁壘和算力門(mén)檻。 目的很明確:在AGI的終極敘事中,必須手握一張能與OpenAI平起平坐的“王牌”,借以鞏固自身(尤其是云業(yè)務(wù))的優(yōu)勢(shì),最后再依靠規(guī)?;瘧?yīng)用實(shí)現(xiàn)盈利。在企業(yè)客戶(hù)選擇云服務(wù)商時(shí),一個(gè)“全球第三”的旗艦?zāi)P?,其象征意義和信任背書(shū)價(jià)值千金。
然而,這場(chǎng)“登頂”的盛宴之下,潛藏著“參數(shù)陷阱”的冰冷現(xiàn)實(shí)。
第一個(gè)沖突在于“規(guī)?!迸c“成本”的邊際效益。萬(wàn)億參數(shù)帶來(lái)了性能的提升,但也帶來(lái)了指數(shù)級(jí)增長(zhǎng)的訓(xùn)練成本和推理成本。根據(jù)阿里云官網(wǎng)公布的價(jià)格,Qwen3-Max(0-32K檔)的輸入價(jià)格約為8.64元/百萬(wàn)Tokens,輸出價(jià)格更是高達(dá)43.2元/百萬(wàn)Tokens。這種定價(jià),注定了它只能是少數(shù)頭部企業(yè)在核心、高價(jià)值場(chǎng)景中才能負(fù)擔(dān)的“奢侈品”。當(dāng)性能提升的邊際收益,開(kāi)始難以覆蓋其高昂的推理成本時(shí),“規(guī)模競(jìng)賽”就觸碰到了商業(yè)落地的“玻璃天花板”。
第二個(gè),則是開(kāi)源策略與商業(yè)變現(xiàn)的矛盾。在國(guó)內(nèi)AI賽道中,“開(kāi)源”正在成為行業(yè)的大勢(shì)所趨,然而矛盾在于,當(dāng)一個(gè)性能“足夠好”的開(kāi)源模型可以免費(fèi)、私有化部署時(shí),有多少開(kāi)發(fā)者還愿意為其閉源的、價(jià)格高昂的模型支付溢價(jià)?開(kāi)源模型雖然“教育”了市場(chǎng),卻也親手“稀釋”了其旗艦API的商業(yè)價(jià)值。
“破價(jià)”的利刃:創(chuàng)業(yè)公司“另辟蹊徑”的效率革命
一方面是巨頭的“3A游戲”,那么另一方面,以DeepSeek的“破價(jià)”則是資源相對(duì)薄弱的創(chuàng)業(yè)公司被迫選擇的“另辟蹊徑”。
財(cái)力雄厚的巨頭可以豪賭Scaling Law,但對(duì)于創(chuàng)業(yè)公司而言,除非擁有OpenAI那樣能撬動(dòng)千億美元的戰(zhàn)略合作,否則在“參數(shù)陷阱”面前幾乎沒(méi)有試錯(cuò)空間。 它們唯一的活路,就是通過(guò)極致的技術(shù)優(yōu)化——從架構(gòu)到算法再到工程——在有限的算力里“擠”出更多的能力,為自己,也為客戶(hù)“擠”出寶貴的利潤(rùn)空間。
而對(duì)于DeepSeek而言,從其聲名鵲起,便是因?yàn)樗摹捌苾r(jià)”之所以在行業(yè)內(nèi)引發(fā)地震,因?yàn)樗皇恰把a(bǔ)貼換市場(chǎng)”的互聯(lián)網(wǎng)舊劇本,而是由硬核技術(shù)驅(qū)動(dòng)的“效率革命”。
據(jù)了解,DeepSeek能夠有降價(jià)50%以上的底氣,來(lái)自于一個(gè)關(guān)鍵的技術(shù)突破:DSA(DeepSeek Sparse Attention)。
在傳統(tǒng)Transformer架構(gòu)中,注意力機(jī)制的計(jì)算復(fù)雜度是O(n^2)(n為序列長(zhǎng)度),即每個(gè)Token都要和上下文中的所有其他Token進(jìn)行計(jì)算。在處理長(zhǎng)文本時(shí),這種“全局關(guān)注”會(huì)帶來(lái)災(zāi)難性的算力消耗。
DeepSeek V3.2-Exp(總參數(shù)量671B,激活參數(shù)37B的MoE模型)則徹底重寫(xiě)了這一規(guī)則。DSA機(jī)制通過(guò)引入“Lightning Indexer”(閃電索引器)和“fine-grained selector”(細(xì)粒度選擇器),實(shí)現(xiàn)了兩階段的智能篩選。它不再“蠻力”地關(guān)注所有內(nèi)容,而是像一個(gè)高效的速讀者,先快速索引、評(píng)估上下文的重要性,然后只讓當(dāng)前Token與那些“真正相關(guān)”的Token進(jìn)行精細(xì)計(jì)算。
其結(jié)果是,在處理長(zhǎng)文本任務(wù)時(shí),DSA“極大減少了每層處理的Token數(shù)量”,從而“大幅削減了推理成本和處理時(shí)間”。最關(guān)鍵的一點(diǎn)是,根據(jù)DeepSeek的官方評(píng)測(cè),V3.2-Exp的性能與V3.1-Terminus保持在同一水平。
這徹底改變了游戲的性質(zhì)。DeepSeek證明了,通過(guò)算法和架構(gòu)的極致創(chuàng)新,可以在不犧牲模型質(zhì)量的前提下,將推理成本壓縮一半甚至更多。
這是對(duì)“規(guī)模派”的一次精準(zhǔn)“降維打擊”。它向市場(chǎng)傳遞了一個(gè)清晰的信號(hào):AI的競(jìng)爭(zhēng),已經(jīng)從單純比拼“肌肉”(參數(shù)規(guī)模)的1.0時(shí)代,進(jìn)入了比拼“神經(jīng)效率”(算法與工程優(yōu)化)的2.0時(shí)代。
夾縫中的“新大陸”:API價(jià)格戰(zhàn)與巨頭的“利潤(rùn)保衛(wèi)戰(zhàn)”
高階模型所形成的巨大價(jià)格鴻溝,正是當(dāng)前AI產(chǎn)業(yè)核心矛盾的爆發(fā)點(diǎn)。在這道鴻溝的兩側(cè),是中小企業(yè)和巨頭們截然不同的命運(yùn)。
對(duì)于數(shù)以萬(wàn)計(jì)的中小企業(yè)、初創(chuàng)公司和獨(dú)立開(kāi)發(fā)者而言,以DeepSeek為代表的“技術(shù)破價(jià)”無(wú)異于開(kāi)辟了一片“新大陸”。在此之前,AI應(yīng)用的成本是一只“攔路虎”,如今結(jié)束技術(shù)手段,正將AI的成本屬性從“咨詢(xún)費(fèi)”拉向“水電費(fèi)”。當(dāng)API成本降低50%甚至90%時(shí),AI應(yīng)用的“可行性”就可以完成“從0到1”。
正如行業(yè)分析師所指出的,DeepSeek的低成本創(chuàng)新,正在推動(dòng)AI應(yīng)用“從頭部企業(yè)壟斷轉(zhuǎn)向長(zhǎng)尾場(chǎng)景滲透”。這符合“杰文斯悖論”(Jevons Paradox)的經(jīng)典邏輯:技術(shù)效率的提升(成本降低)并不會(huì)減少總消耗,反而會(huì)因?yàn)殚T(mén)檻的降低而激發(fā)海量的、前所未有的新需求,最終帶來(lái)算力總需求的爆發(fā)式增長(zhǎng)。
然而,中小企業(yè)的狂歡,映襯出的卻是頭部巨頭的焦慮。DeepSeek的“技術(shù)破價(jià)”更是將這場(chǎng)沖突推向了高潮。
事實(shí)上,一場(chǎng)殘酷的“API價(jià)格戰(zhàn)”早已在國(guó)內(nèi)AI巨頭(如阿里、百度、騰訊、字節(jié))之間打響。早在2024年,字節(jié)豆包的“白菜價(jià)”就已迫使阿里云(Qwen-Long降價(jià)97%)和百度(文心兩大主力模型免費(fèi))倉(cāng)促應(yīng)戰(zhàn)。巨頭們不惜大幅降低API單價(jià),甚至將中小型模型免費(fèi),其核心目的就是“搶占AI云市場(chǎng)”的入口。 他們?cè)噲D用“模型補(bǔ)貼”換取“云客戶(hù)”,將用戶(hù)鎖定在自己的生態(tài)高墻內(nèi)。
這場(chǎng)“價(jià)格戰(zhàn)”與“效率戰(zhàn)”的疊加,讓巨頭們陷入了經(jīng)典的兩難困境。
一位不愿透露姓名的大模型頭部企業(yè)從業(yè)者在一次模擬采訪(fǎng)中這樣表述:“我們內(nèi)部現(xiàn)在很分裂。一方面,你必須跟進(jìn)(降價(jià)),市場(chǎng)份額丟了就再也回不來(lái)了,云業(yè)務(wù)的增長(zhǎng)指望著這個(gè)。另一方面,旗艦?zāi)P停ㄈ鏠wen3-Max)的推理成本是實(shí)打?qū)嵉?,降價(jià)就是‘割肉’。”
“我們現(xiàn)在的策略是分裂的:用免費(fèi)的中小模型去‘跑量’,穩(wěn)住開(kāi)發(fā)者生態(tài);同時(shí)用頂尖的旗艦?zāi)P腿ァ?biāo)桿’,服務(wù)那些真正愿意為0.1分性能提升付費(fèi)的頭部客戶(hù)?!钡诳啃实膭?chuàng)業(yè)公司的“攪局”之下,巨頭用‘規(guī)?!页鰜?lái)的性能溢價(jià),正在被他們迅速拉平。
這段基于行業(yè)普遍現(xiàn)狀的模擬表述,精準(zhǔn)地道出了巨頭的“利潤(rùn)保衛(wèi)戰(zhàn)”有多么艱難。他們?cè)噲D用“云服務(wù)+模型”的生態(tài)綁定構(gòu)建“護(hù)城河”,但在絕對(duì)的性?xún)r(jià)比面前,這種綁定的吸引力正在受到嚴(yán)峻考驗(yàn)。
超越“規(guī)?!迸c“效率”,AI價(jià)值正被再定義
Qwen3-Max的“登頂”和DeepSeek V3.2-Exp的“破價(jià)”,看似是兩條背道而馳的路線(xiàn),但它們聯(lián)手導(dǎo)演的這場(chǎng)“極限沖突”,實(shí)際上共同終結(jié)了大模型競(jìng)爭(zhēng)的“蠻荒時(shí)代”,并提前揭示了“中場(chǎng)戰(zhàn)事”的終局走向。
首先,未來(lái)“規(guī)模派”和“效率派”必然走向融合。
“規(guī)模派”同樣意識(shí)到單純堆料的不可持續(xù)。Qwen3-Max本身采用先進(jìn)的MoE(混合專(zhuān)家)架構(gòu),就是其主動(dòng)吸收“效率”技術(shù)的明證。未來(lái),巨頭們必須將DSA這類(lèi)稀疏算法和極致的推理優(yōu)化,作為其旗艦?zāi)P偷摹皹?biāo)配”,否則其“規(guī)?!睂⒁虺杀具^(guò)高而喪失意義。
而“效率派”也不會(huì)永遠(yuǎn)停留在“性?xún)r(jià)比”的舒適區(qū)。它們必須利用“技術(shù)破價(jià)”換來(lái)的海量市場(chǎng)和數(shù)據(jù)飛輪,反哺更高性能、更大規(guī)模模型的研發(fā)。否則,它們也將在“效率”的單一維度上,陷入新一輪的“內(nèi)卷”。
其次,這場(chǎng)沖突正在倒逼AI產(chǎn)業(yè)回歸商業(yè)本質(zhì):從“模型跑分”轉(zhuǎn)向“應(yīng)用價(jià)值”。
當(dāng)最頂尖的模型和性?xún)r(jià)比最高的模型同時(shí)擺在貨架上,客戶(hù)的選擇不再是盲目的“追高”,而是精準(zhǔn)的“適配”。市場(chǎng)被清晰地劃分:少數(shù)高敏、高價(jià)值的場(chǎng)景去追逐頂尖模型的極限性能;而海量的、對(duì)成本敏感的“長(zhǎng)尾應(yīng)用”,則會(huì)擁抱效率模型的極致效率。
這場(chǎng)由“規(guī)模”和“效率”共同導(dǎo)演的戲劇性沖突,其真正的價(jià)值在于“擠出”了AI的泡沫。它迫使所有玩家——無(wú)論是手握萬(wàn)億參數(shù)的巨頭,還是掌握效率利器的新貴——都必須回答同一個(gè)終極問(wèn)題:
你所提供的智能,究竟為客戶(hù)創(chuàng)造了多少可衡量的價(jià)值?
在AI的中場(chǎng)戰(zhàn)事中,誰(shuí)能率先回答好這個(gè)問(wèn)題,誰(shuí)才能定義下半場(chǎng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.