夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

美團(tuán)的龍貓,放出來了

0
分享至

中國的兩大外賣巨頭,開始在開源模型領(lǐng)域叫陣。

周末,美團(tuán)低調(diào)開源LongCat-Flash,號稱在智能體工具調(diào)用、指令遵循等部分測評上的表現(xiàn),超越了阿里巴巴Qwen3-MoE-2507。數(shù)年來,王興對AI的野心與布局,終于浮出水面。


美團(tuán)所圖不小。2015年,美團(tuán)曾試圖通過云計(jì)算,參與產(chǎn)業(yè)互聯(lián)網(wǎng);2025年,美團(tuán)再次主動進(jìn)攻,試圖通過智能計(jì)算,將連接線上場景與線下場景的美團(tuán),轉(zhuǎn)型為連接數(shù)字世界與物理世界的平臺。

為此,LongCat(龍貓)必須自研,且必須是前沿模型。

高效MoE架構(gòu)

這是LongCat-Flash的首次公開亮相。年初,在2024年年報(bào)電話會議上,王興透露過LongCat的存在。盡管是后來者,盡管是初代模型,但技術(shù)報(bào)告開篇就從“擴(kuò)展定律”放緩切題,顯得野心勃勃。毫無疑問,它是朝著前沿模型競爭來的。

要繼續(xù)推進(jìn)前沿,無論是算法設(shè)計(jì)、底層系統(tǒng)優(yōu)化,還是數(shù)據(jù)策略,都還大有可為。美團(tuán)這次將LongCat-Flash的嘗試,放在了計(jì)算效率和智能體能力上。

LongCat-Flash擁有5600億總參數(shù)規(guī)模,是一個(gè)混合專家(MOE)模型。不過,與傳統(tǒng)的MOE模型不同,它在處理每個(gè)任務(wù)時(shí),能夠根據(jù)不同的上下文需求,動態(tài)地將激活186億至313億的參數(shù)(平均約270億)。得益于在性能與效率上的平衡,如果基于H800,它的推理速度超過100 token/s,推理成本低至0.7美元/百萬token(輸出)。

按需分配,已是前沿模型的標(biāo)配。無論是DeepSeek的V3.1,融合了思考模式和非思考模式,還是作為“統(tǒng)一系統(tǒng)”的GPT-5,由實(shí)時(shí)路由選擇子模型,都嘗試動態(tài)調(diào)度算力資源,消耗更少的token,花費(fèi)更短的時(shí)間,達(dá)到相似的結(jié)果。LongCat-Flash也是,只不過,這次是在MOE模型架構(gòu)內(nèi)部。

“零計(jì)算專家”(ZCEs)是其中的一項(xiàng)關(guān)鍵技術(shù)。對于簡單問題,這些特殊的專家在接收到輸入的token后,將直接輸出輸入本身(即恒等映射),不做任何復(fù)雜運(yùn)算,幾乎不消耗額外算力。但難題在于,如何保證零計(jì)算專家在推理過程中,獲得了合理調(diào)度。一個(gè)策略是計(jì)算預(yù)算控制,相當(dāng)于美團(tuán)為它的大模型,設(shè)定了一個(gè)平均消費(fèi)標(biāo)準(zhǔn);另一個(gè)策略是負(fù)載均衡控制,相當(dāng)于設(shè)定了“公平派單機(jī)制”。

“零計(jì)算專家”不是一個(gè)新概念。國內(nèi)團(tuán)隊(duì)為了盡可能地降低算力資源開銷,想盡了辦法。去年,昆侖萬維2050研究院與天工大模型(Skywork)提出了“MOE++”,就引入三種“零計(jì)算專家”,有的直接丟棄輸入,只輸出零向量;有的原樣照抄,復(fù)用輸入;還有的則用一個(gè)可訓(xùn)練的常量向量來替代輸入。上海交大的清源研究院也提出了類似的“空計(jì)算專家”(null experts)的概念。

第二項(xiàng)關(guān)鍵技術(shù)是“短路連接MoE”(ScMoE)。它試圖解決大規(guī)模MoE推理時(shí)的通信瓶頸問題。傳統(tǒng)上,專家并行在真正計(jì)算之前,token會被分發(fā)到分布在不同GPU上的專家,然后合并通信返回。這意味著在“通信”這個(gè)環(huán)節(jié),GPU常常空轉(zhuǎn)。在MOE層里添加短路連接(shortcut),實(shí)現(xiàn)計(jì)算與通信重疊,就可以讓GPU在這段時(shí)間里完成另一個(gè)任務(wù)。相當(dāng)于,閑著的餐館只管自己做其他訂單,不必等待上一個(gè)訂單被外賣小哥取走或下一份訂單需求送達(dá)才再次運(yùn)營。

LongCat-Flash的預(yù)訓(xùn)練,用到了20萬億token規(guī)模的數(shù)據(jù)集,比早先月之暗面的Kimi-K2還大5萬億;隨后進(jìn)行強(qiáng)化推理與編碼,以及擴(kuò)展上下文窗口的中期訓(xùn)練,以及強(qiáng)化智能體能力的后訓(xùn)練。

不過,與在介紹推理性能時(shí),明確提及部署了H800-80GB不同,在訓(xùn)練基礎(chǔ)設(shè)施層面,美團(tuán)使用了“數(shù)萬個(gè)加速卡”(accelerators)的表述。如此“曖昧”的表述,給市場留下了不少想象空間。至少,這說明美團(tuán)有足夠的基礎(chǔ)設(shè)施級別的工程能力,可以突破算力約束,留在追逐前沿模型的競爭隊(duì)列里。

第二個(gè)下半場

建設(shè)大規(guī)模算力基礎(chǔ)設(shè)施,美團(tuán)不是沒有這么干過。它與阿里巴巴的競爭,不僅僅關(guān)乎“外賣”,而是從云計(jì)算時(shí)代延伸至智能計(jì)算時(shí)代。10年前,云成為了美團(tuán)在互聯(lián)網(wǎng)的下半場,如今,大模型與智能體就是美團(tuán)的第二次下半場。

2015年,美團(tuán)云開始獨(dú)立運(yùn)營。王興還曾提出過“下半場”的概念,讓“互聯(lián)網(wǎng)+”真正成為各個(gè)行業(yè)從上游到下游的產(chǎn)業(yè)互聯(lián)網(wǎng)化,不是僅僅停留在最末端做營銷、做交易那一小段。2017年,美團(tuán)云人工智能峰會召開,宣傳詞就主打建立“人與人、機(jī)器之間的廣泛鏈接”,如今再聽,有點(diǎn)智能體的味道了。不過,美團(tuán)基于云計(jì)算的嘗試,在2020年開始戰(zhàn)略性撤退。在這期間,美團(tuán)已經(jīng)在用AI系統(tǒng)優(yōu)化配送調(diào)度。

大模型讓美團(tuán)再次聞到了“下半場”的氣息。在ChatGPT問世后,無論是美團(tuán)王興,還是已經(jīng)從美團(tuán)退休的王慧文,都燃起了對AI的期待。大模型“即將創(chuàng)造出來的巨大生產(chǎn)力”讓王興興奮不已,它比手機(jī)與互聯(lián)網(wǎng)大得多。2023年2月,王慧文組建了光年之外,王興以個(gè)人身份入局;當(dāng)年6月,光年之外被美團(tuán)作價(jià)20億余元,打包收購,包括此前被光年之外收購的一流科技。

美團(tuán)收購光年之外,也許是一場意外,但不突兀。清華同窗與美團(tuán)舊將的王慧文因病退出,王興出手,合乎情誼。光年之外的資產(chǎn),也能補(bǔ)強(qiáng)美團(tuán)內(nèi)部已經(jīng)啟動的大模型研發(fā)。在收購前的1個(gè)月,在一季報(bào)電話會議上,王興就表示公司多年運(yùn)營,積累了大量專有數(shù)據(jù),對AI持開放態(tài)度,內(nèi)部團(tuán)隊(duì)也在致力于打造自研基礎(chǔ)模型及相關(guān)應(yīng)用程序。當(dāng)年11月,美團(tuán)大模型“通慧”獲得備案審批。此外,美團(tuán)還投資了大模型初創(chuàng)企業(yè)智譜與月之暗面,以及AI基礎(chǔ)設(shè)施的硅基流動。

但此后,AI很少在財(cái)報(bào)電話會議上出現(xiàn)。市場默認(rèn)美團(tuán)是干外賣的,最多就是本地生活。直到2024年年報(bào)發(fā)布,王興大聲而清晰地宣布了美團(tuán)“主動進(jìn)攻”的AI策略,并聲稱過去的一年,美團(tuán)的首要任務(wù)就是攢卡,保證算力供應(yīng)充足。當(dāng)像AI這樣具有根本性革命意義的技術(shù)到來時(shí),唯一合理的策略,就是利用你所擁有的一切去嘗試進(jìn)攻。

王興還將當(dāng)前美團(tuán)的AI戰(zhàn)略分為三項(xiàng),包括AI at Work,提升數(shù)十萬名員工的工作效率;AI in Products,改造現(xiàn)有產(chǎn)品并創(chuàng)建原生AI應(yīng)用;以及Building LLM,即持續(xù)投入資源自研大模型。當(dāng)時(shí),王興首次提及LongCat(龍貓),當(dāng)時(shí)已在客服部門試用,效率提高了20%,客戶滿意度提高7.5個(gè)百分點(diǎn);也介紹了它對業(yè)務(wù)拓展(BD)團(tuán)隊(duì)與軟件技術(shù)團(tuán)隊(duì)的幫助。

隨著LongCat的公開,美團(tuán)的第二次“下半場”變得清晰起來。在美團(tuán),大模型將不僅僅是一個(gè)對話工具。它能夠?qū)⒚缊F(tuán)從以往的將線下業(yè)務(wù)與線上世界連接起來的公司,轉(zhuǎn)變?yōu)閷?shù)字世界和物理世界連接起來的平臺。別忘了,美團(tuán)還投資了機(jī)器人企業(yè)宇樹科技與銀河通用等等,無人機(jī)更是早在它的布局范圍之內(nèi)。

在LongCat的技術(shù)報(bào)告中,美團(tuán)引入了兩個(gè)全新的自研基準(zhǔn)Meeseeks和VitaBench,嘗試彌合傳統(tǒng)基準(zhǔn)和現(xiàn)實(shí)應(yīng)用之間的鴻溝。前者模擬“用戶和 AI 對話中的復(fù)雜指令”,尤其是跨輪、多條件、帶上下文的請求,像極了真人與客戶對話的應(yīng)用場景;后者則是利用真實(shí)世界的商業(yè)場景來評估模型處理復(fù)雜現(xiàn)實(shí)任務(wù)的能力。

在LongCat-Flash之外,美團(tuán)還藏了什么嗎?也許,市場應(yīng)該在一眾中國開源模型中,將美團(tuán)視為需要時(shí)刻關(guān)注的新玩家。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
他三元及第,歷經(jīng)4朝,19年宰相未殺一人,子孫滿堂羨煞旁人

他三元及第,歷經(jīng)4朝,19年宰相未殺一人,子孫滿堂羨煞旁人

老達(dá)子
2025-09-03 06:30:02
深情告白!羅德里戈曬過往奪冠瞬間并配文:我的家

深情告白!羅德里戈曬過往奪冠瞬間并配文:我的家

直播吧
2025-09-03 10:16:28
2名女生和男生吃燒烤,坐姿豪放從凌晨吃到天亮:這是誰的菜?

2名女生和男生吃燒烤,坐姿豪放從凌晨吃到天亮:這是誰的菜?

唐小糖說情感
2025-09-03 09:14:39
9月3日閱兵,美、英、法、德領(lǐng)導(dǎo)人都不來,那是丟他們祖宗的臉

9月3日閱兵,美、英、法、德領(lǐng)導(dǎo)人都不來,那是丟他們祖宗的臉

大道無形我有型
2025-09-02 17:01:43
細(xì)思極恐!曝金昊什么都招了,瑤瑤身上疑似檢出鎮(zhèn)定劑成分,冷血

細(xì)思極恐!曝金昊什么都招了,瑤瑤身上疑似檢出鎮(zhèn)定劑成分,冷血

吃瓜盟主
2025-09-02 21:19:38
開學(xué)崩潰排行榜,一年級班主任穩(wěn)坐第一!網(wǎng)友:以后干啥事都能成

開學(xué)崩潰排行榜,一年級班主任穩(wěn)坐第一!網(wǎng)友:以后干啥事都能成

墻頭草
2025-09-03 08:22:56
虧損8.5億,《蛟龍行動》成年度最大票房慘案,于冬虧到懷疑人生

虧損8.5億,《蛟龍行動》成年度最大票房慘案,于冬虧到懷疑人生

電影票房預(yù)告片
2025-08-31 18:44:28
謝杏芳萬萬沒想到,因林丹敗光的體面,如今被9歲兒子掙了回來

謝杏芳萬萬沒想到,因林丹敗光的體面,如今被9歲兒子掙了回來

TVB的四小花
2025-08-28 00:29:04
又內(nèi)訌了!德云社元老人物離開,發(fā)文內(nèi)涵郭德綱,徹底撕開遮羞布

又內(nèi)訌了!德云社元老人物離開,發(fā)文內(nèi)涵郭德綱,徹底撕開遮羞布

有范又有料
2025-08-30 15:51:20
基辛格直言,美國100年搞垮了4個(gè)世界老二,第五個(gè)會反手干掉美國

基辛格直言,美國100年搞垮了4個(gè)世界老二,第五個(gè)會反手干掉美國

文史達(dá)觀
2024-03-07 14:02:52
吉鴻昌將軍后代隔空傳話:這盛世如你所愿

吉鴻昌將軍后代隔空傳話:這盛世如你所愿

大象新聞
2025-09-02 19:15:09
1979年鄧穎超說出:國民黨一位元老,是潛伏50多年的共產(chǎn)黨

1979年鄧穎超說出:國民黨一位元老,是潛伏50多年的共產(chǎn)黨

第四思維
2025-07-23 18:23:09
鐘鎮(zhèn)濤攜妻子范姜與朋友相聚,范姜54歲素顏,比章小蕙看著舒服

鐘鎮(zhèn)濤攜妻子范姜與朋友相聚,范姜54歲素顏,比章小蕙看著舒服

檸檬有娛樂
2025-09-03 14:38:34
高圓圓黑色透視裝10分鐘評論過萬,網(wǎng)友爭議不斷,美的極致?

高圓圓黑色透視裝10分鐘評論過萬,網(wǎng)友爭議不斷,美的極致?

娛樂領(lǐng)航家
2025-08-30 23:00:03
不裝了!央視主持人龍洋新身份曝光,36歲的她早已走上另一條道路

不裝了!央視主持人龍洋新身份曝光,36歲的她早已走上另一條道路

可樂談情感
2025-08-12 06:53:35
讓人心寒!佛山一商家因老人借用廁所猝死被索賠21萬,法院判了…

讓人心寒!佛山一商家因老人借用廁所猝死被索賠21萬,法院判了…

火山詩話
2025-09-02 10:12:49
斯洛伐克總理:歐盟很多人已脫離現(xiàn)實(shí),看不到外面的世界

斯洛伐克總理:歐盟很多人已脫離現(xiàn)實(shí),看不到外面的世界

紅星新聞
2025-09-03 14:15:25
中國小伙為救金日成而死,48年后他找到小伙后人,贈送20捆人民幣

中國小伙為救金日成而死,48年后他找到小伙后人,贈送20捆人民幣

歷史八卦社
2023-11-18 00:45:30
奧馬爾的致富經(jīng):一年時(shí)間凈資產(chǎn)增加3500%

奧馬爾的致富經(jīng):一年時(shí)間凈資產(chǎn)增加3500%

南文視界
2025-09-03 13:23:59
大利好!兩部門重磅發(fā)布

大利好!兩部門重磅發(fā)布

中國基金報(bào)
2025-09-02 20:48:17
2025-09-03 15:20:49
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
187文章數(shù) 41關(guān)注度
往期回顧 全部

科技要聞

谷歌搜索反壟斷案宣判:Chrome保住了

頭條要聞

日本"叫囂"介入臺海問題 媒體:用東風(fēng)-26威懾就夠了

頭條要聞

日本"叫囂"介入臺海問題 媒體:用東風(fēng)-26威懾就夠了

體育要聞

從山西到達(dá)拉斯,李月汝與她的籃球野心

娛樂要聞

謝霆鋒與王菲vs張柏芝合影 對比明顯

財(cái)經(jīng)要聞

黃金新一波漲勢來了!這輪能下場嗎?

汽車要聞

帶激光雷達(dá)的純電小型SUV 長安啟源全新Q05配色曝光

態(tài)度原創(chuàng)

健康
藝術(shù)
親子
數(shù)碼
時(shí)尚

內(nèi)分泌科專家破解身高八大謠言

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

上海這些寶媽,來看看能否領(lǐng)這筆錢!需滿足一定條件,尚在試點(diǎn)中,未來范圍將擴(kuò)大,助力“科研媽媽”回歸

數(shù)碼要聞

AMD Instinct MI500 超級計(jì)算艙曝光:64顆CPU+256個(gè)GPU

三種適合9月的風(fēng)格,好漂亮

無障礙瀏覽 進(jìn)入關(guān)懷版 最新国产精品第1页| heyzo无码综合国产精品| 中文字幕精品亚洲无线码一区| 九色丨PORNY丨自拍视频| 日日爱国产精品视频| 亚洲综合色噜噜狠狠网站超清| 丝袜 中出 制服 人妻 美腿| 国产真实交换配乱婬视频,| 欧美一区二区三区在线观看| 肥臀中文字幕| 漂亮人妻洗澡中文字幕久久婷| 日日噜噜夜夜狠狠视频无码| 女BWWW视| 唐朝av无码| 久久综合给合久久狠狠97色| 人妻少妇精品无码专区| 亚洲人成无码网站| 99久久久国产精品免费牛牛| 国产乱女乱子视频在线播放| 农民人伦一二三匹| 亚洲国产欧美在线看片一国产| 69激情视频| 开心五月综合| 一区二区三区四区亚洲| 国产又大又粗无套免费看| 我高潮太爽忍不住大叫怎么办| 熟女乱牛牛视频在线观看| 中文字幕亚洲乱码熟女| 人妻无码一区二区三区久久99| 农村熟女露脸一区| 一人高清无码在线观看| 久久A√无码人妻一区二区| 视频列表--国产| 日韩日本人体一二区| 啪啪毛片免费电影| 亚洲五月六月丁香缴情久久| 丰满多毛的大隂户毛茸茸的作者| 免费99精品国产自在在线| 99精品视频免费热播在线观看| 成人做受120秒试看试看视频| XXX片日本护士高潮片|