公司情報(bào)專家《財(cái)經(jīng)涂鴉》獲悉,9月1日,美團(tuán)宣布正式發(fā)布龍貓(LongCat-Flash-Chat)大模型,并同步開源。
作為一款非思考型基礎(chǔ)模型,龍貓采用創(chuàng)新性混合專家模型(Mixture-of-Experts, MoE)架構(gòu),由于主要面向推理效率的設(shè)計(jì)和創(chuàng)新,該模型具有更快的推理速度,更適合耗時(shí)較長(zhǎng)的復(fù)雜智能體應(yīng)用。
目前,LongCat-Flash-Chat已在Github、Hugging Face平臺(tái)同步開源。
值得一提的是,龍貓已于8月28日啟用名為“LongCat”的獨(dú)立公眾號(hào),注冊(cè)主體為北京三快科技有限公司,賬號(hào)簡(jiǎn)介為“美團(tuán)龍貓Longcat大模型官方賬號(hào)”。9月1日,該公眾號(hào)發(fā)布了第一篇也是截至目前唯一一篇文章,名為《美團(tuán)正式發(fā)布并開源LongCat-Flash-Chat,動(dòng)態(tài)計(jì)算開啟高效AI時(shí)代》。
來(lái)源:龍貓公眾號(hào)截圖
從性能方面看,美團(tuán)表示,在僅激活少量參數(shù)的前提下,該模型依然可“比肩當(dāng)下領(lǐng)先的主流模型”,尤其在智能體任務(wù)中具備突出優(yōu)勢(shì),實(shí)現(xiàn)了計(jì)算效率與性能的雙重優(yōu)化。
據(jù)介紹,LongCat-Flash模型在架構(gòu)層面引入“零計(jì)算專家(Zero-Computation Experts)”機(jī)制,總參數(shù)量560 B,每個(gè)token 依據(jù)上下文需求僅激活18.6B~31.3 B參數(shù),實(shí)現(xiàn)算力按需分配和高效利用。
通過(guò)算法和工程層面的聯(lián)合設(shè)計(jì),LongCat-Flash在理論上的成本和速度都大幅領(lǐng)先行業(yè)同等規(guī)模、甚至規(guī)模更小的模型;通過(guò)系統(tǒng)優(yōu)化,其在H800上可實(shí)現(xiàn)100 tokens/s的生成速度,在保持極速的同時(shí),輸出成本低至 5元/百萬(wàn)token。
同時(shí),該模型在通用領(lǐng)域知識(shí)、智能體(Agentic)工具使用、編程及指令遵循方面均實(shí)現(xiàn)了顯著的性能優(yōu)勢(shì)。
美團(tuán)表示,已同步提供了分別基于SGLang和vLLM兩種高效部署方案,以協(xié)助用戶輕松部署、快速體驗(yàn)?zāi)P托Ч?。此次開源倉(cāng)庫(kù)統(tǒng)一采用 MIT License,并允許用戶利用模型輸出、通過(guò)模型蒸餾等方式訓(xùn)練其他模型。
今年3月份,王興曾于2024年第四季度及年度業(yè)績(jī)會(huì)中強(qiáng)調(diào),“當(dāng)像AI這樣具有根本性革命意義的技術(shù)到來(lái)時(shí),唯一可行的策略是調(diào)動(dòng)所有資源主動(dòng)進(jìn)攻”。
他透露,美團(tuán)自主研發(fā)的“龍貓”大語(yǔ)言模型已與外部模型協(xié)同應(yīng)用,推動(dòng)員工生產(chǎn)力得到顯著提升。
例如在客服領(lǐng)域,基于自研模型打造的智能客服代理試點(diǎn)運(yùn)營(yíng)后,效率提升超20%,客戶滿意度上升7. 5個(gè)百分點(diǎn);在商務(wù)拓展中,AI銷售助手幫助團(tuán)隊(duì)在今年春節(jié)期間完成120萬(wàn)商戶信息更新,使BD團(tuán)隊(duì)工作量減少44%,平臺(tái)商戶信息準(zhǔn)確率同步提升;技術(shù)團(tuán)隊(duì)使用的AI編程工具已集成至開發(fā)環(huán)境,目前公司27%的新代碼由AI生成。
在5月份Q1業(yè)績(jī)會(huì)中,美團(tuán)又宣布于季內(nèi)迭代了基礎(chǔ)大語(yǔ)言模型,增強(qiáng)后的模型可在推理模式與非推理模式間無(wú)縫切換,且兩種模式下的性能均達(dá)到國(guó)內(nèi)領(lǐng)先模型水平。
同步更新的端到端語(yǔ)音交互模型,則在理解情感、語(yǔ)境等細(xì)微信息及進(jìn)行自然語(yǔ)音對(duì)話方面展現(xiàn)出先進(jìn)能力,性能已接近 GPT 4.0 水平。
不久前Q2業(yè)績(jī)會(huì)中,管理層進(jìn)一步表示,擴(kuò)展了AI業(yè)務(wù)協(xié)助的場(chǎng)景覆蓋范圍,努力覆蓋從簡(jiǎn)單日常任務(wù)到復(fù)雜操作的端到端工作流程,幫助商家降低成本、提高效率。
今年以來(lái),美團(tuán)已連續(xù)發(fā)布AI Coding Agent工具NoCode、經(jīng)營(yíng)決策助手袋鼠參謀、酒店垂類AI Agent美團(tuán)既白等多款垂直場(chǎng)景應(yīng)用。
作者:蘇打
編輯:tuya
出品:財(cái)經(jīng)涂鴉(ID:caijingtuya)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.