中國的兩大外賣巨頭,開始在開源模型領(lǐng)域叫陣。
周末,美團(tuán)低調(diào)開源LongCat-Flash,號稱在智能體工具調(diào)用、指令遵循等部分測評上的表現(xiàn),超越了阿里巴巴Qwen3-MoE-2507。數(shù)年來,王興對AI的野心與布局,終于浮出水面。
美團(tuán)所圖不小。2015年,美團(tuán)曾試圖通過云計(jì)算,參與產(chǎn)業(yè)互聯(lián)網(wǎng);2025年,美團(tuán)再次主動進(jìn)攻,試圖通過智能計(jì)算,將連接線上場景與線下場景的美團(tuán),轉(zhuǎn)型為連接數(shù)字世界與物理世界的平臺。
為此,LongCat(龍貓)必須自研,且必須是前沿模型。
高效MoE架構(gòu)
這是LongCat-Flash的首次公開亮相。年初,在2024年年報(bào)電話會議上,王興透露過LongCat的存在。盡管是后來者,盡管是初代模型,但技術(shù)報(bào)告開篇就從“擴(kuò)展定律”放緩切題,顯得野心勃勃。毫無疑問,它是朝著前沿模型競爭來的。
要繼續(xù)推進(jìn)前沿,無論是算法設(shè)計(jì)、底層系統(tǒng)優(yōu)化,還是數(shù)據(jù)策略,都還大有可為。美團(tuán)這次將LongCat-Flash的嘗試,放在了計(jì)算效率和智能體能力上。
LongCat-Flash擁有5600億總參數(shù)規(guī)模,是一個(gè)混合專家(MOE)模型。不過,與傳統(tǒng)的MOE模型不同,它在處理每個(gè)任務(wù)時(shí),能夠根據(jù)不同的上下文需求,動態(tài)地將激活186億至313億的參數(shù)(平均約270億)。得益于在性能與效率上的平衡,如果基于H800,它的推理速度超過100 token/s,推理成本低至0.7美元/百萬token(輸出)。
按需分配,已是前沿模型的標(biāo)配。無論是DeepSeek的V3.1,融合了思考模式和非思考模式,還是作為“統(tǒng)一系統(tǒng)”的GPT-5,由實(shí)時(shí)路由選擇子模型,都嘗試動態(tài)調(diào)度算力資源,消耗更少的token,花費(fèi)更短的時(shí)間,達(dá)到相似的結(jié)果。LongCat-Flash也是,只不過,這次是在MOE模型架構(gòu)內(nèi)部。
“零計(jì)算專家”(ZCEs)是其中的一項(xiàng)關(guān)鍵技術(shù)。對于簡單問題,這些特殊的專家在接收到輸入的token后,將直接輸出輸入本身(即恒等映射),不做任何復(fù)雜運(yùn)算,幾乎不消耗額外算力。但難題在于,如何保證零計(jì)算專家在推理過程中,獲得了合理調(diào)度。一個(gè)策略是計(jì)算預(yù)算控制,相當(dāng)于美團(tuán)為它的大模型,設(shè)定了一個(gè)平均消費(fèi)標(biāo)準(zhǔn);另一個(gè)策略是負(fù)載均衡控制,相當(dāng)于設(shè)定了“公平派單機(jī)制”。
“零計(jì)算專家”不是一個(gè)新概念。國內(nèi)團(tuán)隊(duì)為了盡可能地降低算力資源開銷,想盡了辦法。去年,昆侖萬維2050研究院與天工大模型(Skywork)提出了“MOE++”,就引入三種“零計(jì)算專家”,有的直接丟棄輸入,只輸出零向量;有的原樣照抄,復(fù)用輸入;還有的則用一個(gè)可訓(xùn)練的常量向量來替代輸入。上海交大的清源研究院也提出了類似的“空計(jì)算專家”(null experts)的概念。
第二項(xiàng)關(guān)鍵技術(shù)是“短路連接MoE”(ScMoE)。它試圖解決大規(guī)模MoE推理時(shí)的通信瓶頸問題。傳統(tǒng)上,專家并行在真正計(jì)算之前,token會被分發(fā)到分布在不同GPU上的專家,然后合并通信返回。這意味著在“通信”這個(gè)環(huán)節(jié),GPU常常空轉(zhuǎn)。在MOE層里添加短路連接(shortcut),實(shí)現(xiàn)計(jì)算與通信重疊,就可以讓GPU在這段時(shí)間里完成另一個(gè)任務(wù)。相當(dāng)于,閑著的餐館只管自己做其他訂單,不必等待上一個(gè)訂單被外賣小哥取走或下一份訂單需求送達(dá)才再次運(yùn)營。
LongCat-Flash的預(yù)訓(xùn)練,用到了20萬億token規(guī)模的數(shù)據(jù)集,比早先月之暗面的Kimi-K2還大5萬億;隨后進(jìn)行強(qiáng)化推理與編碼,以及擴(kuò)展上下文窗口的中期訓(xùn)練,以及強(qiáng)化智能體能力的后訓(xùn)練。
不過,與在介紹推理性能時(shí),明確提及部署了H800-80GB不同,在訓(xùn)練基礎(chǔ)設(shè)施層面,美團(tuán)使用了“數(shù)萬個(gè)加速卡”(accelerators)的表述。如此“曖昧”的表述,給市場留下了不少想象空間。至少,這說明美團(tuán)有足夠的基礎(chǔ)設(shè)施級別的工程能力,可以突破算力約束,留在追逐前沿模型的競爭隊(duì)列里。
第二個(gè)下半場
建設(shè)大規(guī)模算力基礎(chǔ)設(shè)施,美團(tuán)不是沒有這么干過。它與阿里巴巴的競爭,不僅僅關(guān)乎“外賣”,而是從云計(jì)算時(shí)代延伸至智能計(jì)算時(shí)代。10年前,云成為了美團(tuán)在互聯(lián)網(wǎng)的下半場,如今,大模型與智能體就是美團(tuán)的第二次下半場。
2015年,美團(tuán)云開始獨(dú)立運(yùn)營。王興還曾提出過“下半場”的概念,讓“互聯(lián)網(wǎng)+”真正成為各個(gè)行業(yè)從上游到下游的產(chǎn)業(yè)互聯(lián)網(wǎng)化,不是僅僅停留在最末端做營銷、做交易那一小段。2017年,美團(tuán)云人工智能峰會召開,宣傳詞就主打建立“人與人、機(jī)器之間的廣泛鏈接”,如今再聽,有點(diǎn)智能體的味道了。不過,美團(tuán)基于云計(jì)算的嘗試,在2020年開始戰(zhàn)略性撤退。在這期間,美團(tuán)已經(jīng)在用AI系統(tǒng)優(yōu)化配送調(diào)度。
大模型讓美團(tuán)再次聞到了“下半場”的氣息。在ChatGPT問世后,無論是美團(tuán)王興,還是已經(jīng)從美團(tuán)退休的王慧文,都燃起了對AI的期待。大模型“即將創(chuàng)造出來的巨大生產(chǎn)力”讓王興興奮不已,它比手機(jī)與互聯(lián)網(wǎng)大得多。2023年2月,王慧文組建了光年之外,王興以個(gè)人身份入局;當(dāng)年6月,光年之外被美團(tuán)作價(jià)20億余元,打包收購,包括此前被光年之外收購的一流科技。
美團(tuán)收購光年之外,也許是一場意外,但不突兀。清華同窗與美團(tuán)舊將的王慧文因病退出,王興出手,合乎情誼。光年之外的資產(chǎn),也能補(bǔ)強(qiáng)美團(tuán)內(nèi)部已經(jīng)啟動的大模型研發(fā)。在收購前的1個(gè)月,在一季報(bào)電話會議上,王興就表示公司多年運(yùn)營,積累了大量專有數(shù)據(jù),對AI持開放態(tài)度,內(nèi)部團(tuán)隊(duì)也在致力于打造自研基礎(chǔ)模型及相關(guān)應(yīng)用程序。當(dāng)年11月,美團(tuán)大模型“通慧”獲得備案審批。此外,美團(tuán)還投資了大模型初創(chuàng)企業(yè)智譜與月之暗面,以及AI基礎(chǔ)設(shè)施的硅基流動。
但此后,AI很少在財(cái)報(bào)電話會議上出現(xiàn)。市場默認(rèn)美團(tuán)是干外賣的,最多就是本地生活。直到2024年年報(bào)發(fā)布,王興大聲而清晰地宣布了美團(tuán)“主動進(jìn)攻”的AI策略,并聲稱過去的一年,美團(tuán)的首要任務(wù)就是攢卡,保證算力供應(yīng)充足。當(dāng)像AI這樣具有根本性革命意義的技術(shù)到來時(shí),唯一合理的策略,就是利用你所擁有的一切去嘗試進(jìn)攻。
王興還將當(dāng)前美團(tuán)的AI戰(zhàn)略分為三項(xiàng),包括AI at Work,提升數(shù)十萬名員工的工作效率;AI in Products,改造現(xiàn)有產(chǎn)品并創(chuàng)建原生AI應(yīng)用;以及Building LLM,即持續(xù)投入資源自研大模型。當(dāng)時(shí),王興首次提及LongCat(龍貓),當(dāng)時(shí)已在客服部門試用,效率提高了20%,客戶滿意度提高7.5個(gè)百分點(diǎn);也介紹了它對業(yè)務(wù)拓展(BD)團(tuán)隊(duì)與軟件技術(shù)團(tuán)隊(duì)的幫助。
隨著LongCat的公開,美團(tuán)的第二次“下半場”變得清晰起來。在美團(tuán),大模型將不僅僅是一個(gè)對話工具。它能夠?qū)⒚缊F(tuán)從以往的將線下業(yè)務(wù)與線上世界連接起來的公司,轉(zhuǎn)變?yōu)閷?shù)字世界和物理世界連接起來的平臺。別忘了,美團(tuán)還投資了機(jī)器人企業(yè)宇樹科技與銀河通用等等,無人機(jī)更是早在它的布局范圍之內(nèi)。
在LongCat的技術(shù)報(bào)告中,美團(tuán)引入了兩個(gè)全新的自研基準(zhǔn)Meeseeks和VitaBench,嘗試彌合傳統(tǒng)基準(zhǔn)和現(xiàn)實(shí)應(yīng)用之間的鴻溝。前者模擬“用戶和 AI 對話中的復(fù)雜指令”,尤其是跨輪、多條件、帶上下文的請求,像極了真人與客戶對話的應(yīng)用場景;后者則是利用真實(shí)世界的商業(yè)場景來評估模型處理復(fù)雜現(xiàn)實(shí)任務(wù)的能力。
在LongCat-Flash之外,美團(tuán)還藏了什么嗎?也許,市場應(yīng)該在一眾中國開源模型中,將美團(tuán)視為需要時(shí)刻關(guān)注的新玩家。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.