美團(tuán)的龍貓，放出來了

2025-09-02 00:11:07　來源: 未盡研究

上海舉報(bào)

分享至

中國的兩大外賣巨頭，開始在開源模型領(lǐng)域叫陣。

周末，美團(tuán)低調(diào)開源LongCat-Flash，號稱在智能體工具調(diào)用、指令遵循等部分測評上的表現(xiàn)，超越了阿里巴巴Qwen3-MoE-2507。數(shù)年來，王興對AI的野心與布局，終于浮出水面。

美團(tuán)所圖不小。2015年，美團(tuán)曾試圖通過云計(jì)算，參與產(chǎn)業(yè)互聯(lián)網(wǎng)；2025年，美團(tuán)再次主動進(jìn)攻，試圖通過智能計(jì)算，將連接線上場景與線下場景的美團(tuán)，轉(zhuǎn)型為連接數(shù)字世界與物理世界的平臺。

為此，LongCat（龍貓）必須自研，且必須是前沿模型。

高效MoE架構(gòu)

這是LongCat-Flash的首次公開亮相。年初，在2024年年報(bào)電話會議上，王興透露過LongCat的存在。盡管是后來者，盡管是初代模型，但技術(shù)報(bào)告開篇就從“擴(kuò)展定律”放緩切題，顯得野心勃勃。毫無疑問，它是朝著前沿模型競爭來的。

要繼續(xù)推進(jìn)前沿，無論是算法設(shè)計(jì)、底層系統(tǒng)優(yōu)化，還是數(shù)據(jù)策略，都還大有可為。美團(tuán)這次將LongCat-Flash的嘗試，放在了計(jì)算效率和智能體能力上。

LongCat-Flash擁有5600億總參數(shù)規(guī)模，是一個(gè)混合專家（MOE）模型。不過，與傳統(tǒng)的MOE模型不同，它在處理每個(gè)任務(wù)時(shí)，能夠根據(jù)不同的上下文需求，動態(tài)地將激活186億至313億的參數(shù)（平均約270億）。得益于在性能與效率上的平衡，如果基于H800，它的推理速度超過100 token/s，推理成本低至0.7美元/百萬token（輸出）。

按需分配，已是前沿模型的標(biāo)配。無論是DeepSeek的V3.1，融合了思考模式和非思考模式，還是作為“統(tǒng)一系統(tǒng)”的GPT-5，由實(shí)時(shí)路由選擇子模型，都嘗試動態(tài)調(diào)度算力資源，消耗更少的token，花費(fèi)更短的時(shí)間，達(dá)到相似的結(jié)果。LongCat-Flash也是，只不過，這次是在MOE模型架構(gòu)內(nèi)部。

“零計(jì)算專家”（ZCEs）是其中的一項(xiàng)關(guān)鍵技術(shù)。對于簡單問題，這些特殊的專家在接收到輸入的token后，將直接輸出輸入本身（即恒等映射），不做任何復(fù)雜運(yùn)算，幾乎不消耗額外算力。但難題在于，如何保證零計(jì)算專家在推理過程中，獲得了合理調(diào)度。一個(gè)策略是計(jì)算預(yù)算控制，相當(dāng)于美團(tuán)為它的大模型，設(shè)定了一個(gè)平均消費(fèi)標(biāo)準(zhǔn)；另一個(gè)策略是負(fù)載均衡控制，相當(dāng)于設(shè)定了“公平派單機(jī)制”。

“零計(jì)算專家”不是一個(gè)新概念。國內(nèi)團(tuán)隊(duì)為了盡可能地降低算力資源開銷，想盡了辦法。去年，昆侖萬維2050研究院與天工大模型（Skywork）提出了“MOE++”，就引入三種“零計(jì)算專家”，有的直接丟棄輸入，只輸出零向量；有的原樣照抄，復(fù)用輸入；還有的則用一個(gè)可訓(xùn)練的常量向量來替代輸入。上海交大的清源研究院也提出了類似的“空計(jì)算專家”（null experts）的概念。

第二項(xiàng)關(guān)鍵技術(shù)是“短路連接MoE”（ScMoE）。它試圖解決大規(guī)模MoE推理時(shí)的通信瓶頸問題。傳統(tǒng)上，專家并行在真正計(jì)算之前，token會被分發(fā)到分布在不同GPU上的專家，然后合并通信返回。這意味著在“通信”這個(gè)環(huán)節(jié)，GPU常常空轉(zhuǎn)。在MOE層里添加短路連接（shortcut），實(shí)現(xiàn)計(jì)算與通信重疊，就可以讓GPU在這段時(shí)間里完成另一個(gè)任務(wù)。相當(dāng)于，閑著的餐館只管自己做其他訂單，不必等待上一個(gè)訂單被外賣小哥取走或下一份訂單需求送達(dá)才再次運(yùn)營。

LongCat-Flash的預(yù)訓(xùn)練，用到了20萬億token規(guī)模的數(shù)據(jù)集，比早先月之暗面的Kimi-K2還大5萬億；隨后進(jìn)行強(qiáng)化推理與編碼，以及擴(kuò)展上下文窗口的中期訓(xùn)練，以及強(qiáng)化智能體能力的后訓(xùn)練。

不過，與在介紹推理性能時(shí)，明確提及部署了H800-80GB不同，在訓(xùn)練基礎(chǔ)設(shè)施層面，美團(tuán)使用了“數(shù)萬個(gè)加速卡”（accelerators）的表述。如此“曖昧”的表述，給市場留下了不少想象空間。至少，這說明美團(tuán)有足夠的基礎(chǔ)設(shè)施級別的工程能力，可以突破算力約束，留在追逐前沿模型的競爭隊(duì)列里。

第二個(gè)下半場

建設(shè)大規(guī)模算力基礎(chǔ)設(shè)施，美團(tuán)不是沒有這么干過。它與阿里巴巴的競爭，不僅僅關(guān)乎“外賣”，而是從云計(jì)算時(shí)代延伸至智能計(jì)算時(shí)代。10年前，云成為了美團(tuán)在互聯(lián)網(wǎng)的下半場，如今，大模型與智能體就是美團(tuán)的第二次下半場。

2015年，美團(tuán)云開始獨(dú)立運(yùn)營。王興還曾提出過“下半場”的概念，讓“互聯(lián)網(wǎng)＋”真正成為各個(gè)行業(yè)從上游到下游的產(chǎn)業(yè)互聯(lián)網(wǎng)化，不是僅僅停留在最末端做營銷、做交易那一小段。2017年，美團(tuán)云人工智能峰會召開，宣傳詞就主打建立“人與人、機(jī)器之間的廣泛鏈接”，如今再聽，有點(diǎn)智能體的味道了。不過，美團(tuán)基于云計(jì)算的嘗試，在2020年開始戰(zhàn)略性撤退。在這期間，美團(tuán)已經(jīng)在用AI系統(tǒng)優(yōu)化配送調(diào)度。

大模型讓美團(tuán)再次聞到了“下半場”的氣息。在ChatGPT問世后，無論是美團(tuán)王興，還是已經(jīng)從美團(tuán)退休的王慧文，都燃起了對AI的期待。大模型“即將創(chuàng)造出來的巨大生產(chǎn)力”讓王興興奮不已，它比手機(jī)與互聯(lián)網(wǎng)大得多。2023年2月，王慧文組建了光年之外，王興以個(gè)人身份入局；當(dāng)年6月，光年之外被美團(tuán)作價(jià)20億余元，打包收購，包括此前被光年之外收購的一流科技。

美團(tuán)收購光年之外，也許是一場意外，但不突兀。清華同窗與美團(tuán)舊將的王慧文因病退出，王興出手，合乎情誼。光年之外的資產(chǎn)，也能補(bǔ)強(qiáng)美團(tuán)內(nèi)部已經(jīng)啟動的大模型研發(fā)。在收購前的1個(gè)月，在一季報(bào)電話會議上，王興就表示公司多年運(yùn)營，積累了大量專有數(shù)據(jù)，對AI持開放態(tài)度，內(nèi)部團(tuán)隊(duì)也在致力于打造自研基礎(chǔ)模型及相關(guān)應(yīng)用程序。當(dāng)年11月，美團(tuán)大模型“通慧”獲得備案審批。此外，美團(tuán)還投資了大模型初創(chuàng)企業(yè)智譜與月之暗面，以及AI基礎(chǔ)設(shè)施的硅基流動。

但此后，AI很少在財(cái)報(bào)電話會議上出現(xiàn)。市場默認(rèn)美團(tuán)是干外賣的，最多就是本地生活。直到2024年年報(bào)發(fā)布，王興大聲而清晰地宣布了美團(tuán)“主動進(jìn)攻”的AI策略，并聲稱過去的一年，美團(tuán)的首要任務(wù)就是攢卡，保證算力供應(yīng)充足。當(dāng)像AI這樣具有根本性革命意義的技術(shù)到來時(shí)，唯一合理的策略，就是利用你所擁有的一切去嘗試進(jìn)攻。

王興還將當(dāng)前美團(tuán)的AI戰(zhàn)略分為三項(xiàng)，包括AI at Work，提升數(shù)十萬名員工的工作效率；AI in Products，改造現(xiàn)有產(chǎn)品并創(chuàng)建原生AI應(yīng)用；以及Building LLM，即持續(xù)投入資源自研大模型。當(dāng)時(shí)，王興首次提及LongCat（龍貓），當(dāng)時(shí)已在客服部門試用，效率提高了20%，客戶滿意度提高7.5個(gè)百分點(diǎn)；也介紹了它對業(yè)務(wù)拓展（BD）團(tuán)隊(duì)與軟件技術(shù)團(tuán)隊(duì)的幫助。

隨著LongCat的公開，美團(tuán)的第二次“下半場”變得清晰起來。在美團(tuán)，大模型將不僅僅是一個(gè)對話工具。它能夠?qū)⒚缊F(tuán)從以往的將線下業(yè)務(wù)與線上世界連接起來的公司，轉(zhuǎn)變?yōu)閷?shù)字世界和物理世界連接起來的平臺。別忘了，美團(tuán)還投資了機(jī)器人企業(yè)宇樹科技與銀河通用等等，無人機(jī)更是早在它的布局范圍之內(nèi)。

在LongCat的技術(shù)報(bào)告中，美團(tuán)引入了兩個(gè)全新的自研基準(zhǔn)Meeseeks和VitaBench，嘗試彌合傳統(tǒng)基準(zhǔn)和現(xiàn)實(shí)應(yīng)用之間的鴻溝。前者模擬“用戶和 AI 對話中的復(fù)雜指令”，尤其是跨輪、多條件、帶上下文的請求，像極了真人與客戶對話的應(yīng)用場景；后者則是利用真實(shí)世界的商業(yè)場景來評估模型處理復(fù)雜現(xiàn)實(shí)任務(wù)的能力。

在LongCat-Flash之外，美團(tuán)還藏了什么嗎？也許，市場應(yīng)該在一眾中國開源模型中，將美團(tuán)視為需要時(shí)刻關(guān)注的新玩家。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.