整理 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
到底是誰(shuí)說(shuō),今天的主要工作是等放假?明明是(被迫)跟著各家AI團(tuán)隊(duì)卷生卷死:
繼昨晚、今日凌晨,智譜、阿里、螞蟻、智源也都趕在節(jié)前最后一天“卷”起來(lái)了!
(即夢(mèng)AI生成)
智譜:GLM-4.6重磅上線,目前國(guó)內(nèi)最強(qiáng)的Coding模型
今天下午14:53,智譜正式發(fā)布并開源新一代大模型GLM-4.6,在真實(shí)編程、長(zhǎng)上下文處理、推理能力、信息搜索、寫作能力與智能體應(yīng)用等多個(gè)方面實(shí)現(xiàn)全面提升。
據(jù)官方介紹,GLM-4.6在公開基準(zhǔn)和真實(shí)編程任務(wù)中的表現(xiàn)已對(duì)齊Claude Sonnet 4、超越DeepSeek V3.2-Exp,是目前國(guó)內(nèi)最強(qiáng)的Coding模型:
(1)綜合評(píng)測(cè):在8大權(quán)威測(cè)試(AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA)中,GLM-4.6在部分榜單表現(xiàn)對(duì)齊Claude Sonnet 4/Claude Sonnet 4.5,穩(wěn)居國(guó)產(chǎn)模型首位;
(2)真實(shí)編程評(píng)測(cè):在Claude Code環(huán)境下完成74個(gè)場(chǎng)景任務(wù),結(jié)果顯示,GLM-4.6實(shí)測(cè)超過(guò)Claude Sonnet 4,同時(shí)平均token消耗比GLM-4.5低30%,為同類模型最低。
值得一提的是,GLM-4.6已在寒武紀(jì)國(guó)產(chǎn)芯片上實(shí)現(xiàn)FP8+Int4混合量化部署,這是首套投產(chǎn)的芯片一體化方案,同時(shí)基于vLLM框架,也能在摩爾線程新一代GPU上以原生FP8精度穩(wěn)定運(yùn)行。
目前,GLM-4.6已全面上線智譜MaaS平臺(tái)bigmodel.cn、z.ai、智譜清言,海外用戶可通過(guò)z.ai使用 API,同時(shí)將在Hugging Face和ModelScope開源,遵循MIT協(xié)議。
阿里通義Qwen:Qwen3-LiveTranslate-Flash,視、聽、說(shuō)全模態(tài)同傳大模型
而僅僅時(shí)隔半小時(shí)后,阿里通義Qwen團(tuán)隊(duì)在下午15:22,重磅介紹了視、聽、說(shuō)全模態(tài)同傳大模型Qwen3-LiveTranslate-Flash。
Qwen3-LiveTranslate-Flash是一款高精度、高響應(yīng)、高魯棒性的多語(yǔ)言實(shí)時(shí)音視頻同傳大模型,依托于Qwen3-Omni強(qiáng)大的基座能力、海量多模態(tài)數(shù)據(jù)、百萬(wàn)小時(shí)音視頻數(shù)據(jù),實(shí)現(xiàn)了覆蓋18種語(yǔ)言的離線和實(shí)時(shí)兩種音視頻翻譯能力。
不僅如此,Qwen3-LiveTranslate-Flash可實(shí)現(xiàn)最低3秒延遲的同傳體驗(yàn),采用語(yǔ)義單元預(yù)測(cè)技術(shù)緩解跨語(yǔ)言調(diào)序問(wèn)題,實(shí)現(xiàn)與離線翻譯幾乎無(wú)損的翻譯質(zhì)量。海量語(yǔ)音數(shù)據(jù)訓(xùn)練也保證了音色自然,可根據(jù)原語(yǔ)音內(nèi)容自適應(yīng)調(diào)節(jié)語(yǔ)氣和表現(xiàn)力。
從公開測(cè)試集的結(jié)果來(lái)看,Qwen3-LiveTranslate-Flash在中英及多語(yǔ)言語(yǔ)音翻譯準(zhǔn)確度方面顯著優(yōu)于Gemini-2.5-Flash、GPT-4o-Audio-Preview和Voxtral Small-24B等主流大模型:
在不同領(lǐng)域和復(fù)雜聲學(xué)環(huán)境下,Qwen3-LiveTranslate-Flash的翻譯性能也依然保持領(lǐng)先:
同時(shí),Qwen3-LiveTranslate-Flash還首次引入視覺(jué)上下文增強(qiáng)技術(shù),讓模型不僅“聽得懂”,還能“看得懂”,進(jìn)一步提升了對(duì)嘈雜音頻、一詞多譯及專有名詞翻譯的精度,在實(shí)時(shí)場(chǎng)景中的優(yōu)勢(shì)也更為明顯。
事實(shí)上早在上周,阿里Qwen團(tuán)隊(duì)負(fù)責(zé)人就曾在X平臺(tái)上透露,阿里Qwen團(tuán)隊(duì)要發(fā)布6個(gè)“新東西”,包括1個(gè)產(chǎn)品,2個(gè)開源模型,3個(gè)API接口,具體為Qwen3Guard、Qwen Chat、Qwen3-LiveTranslate-Flash、Qwen3-Coder升級(jí)、Qwen3-VL和Qwen3-Max發(fā)布。
螞蟻:開源首個(gè)萬(wàn)億參數(shù)推理大模型!
在今日凌晨Claude Sonnet4.5發(fā)布的同時(shí),螞蟻集團(tuán)也宣布開源自研的首個(gè)萬(wàn)億參數(shù)大模型Ring-1T-preview。
據(jù)介紹,Ring-1T-preview是萬(wàn)億參數(shù)推理大模型Ring-1T的預(yù)覽版,但其自然語(yǔ)言推理能力已相當(dāng)亮眼。例如,在數(shù)學(xué)能力測(cè)試AIME 25上,Ring-1T-preview取得92.6分,超越所有已知開源模型及Gemini 2.5 Pro,更接近GPT-5(無(wú)工具使用)的94.6分;在代碼生成領(lǐng)域的CodeForces測(cè)試中,Ring-1T-preview更是斬獲94.69分,直接超過(guò)GPT-5。
不僅如此,在LiveCodeBench、ARC-AGI-v1等權(quán)威榜單上,Ring-1T-preview也位列開源模型首位。據(jù)悉,螞蟻百靈團(tuán)隊(duì)還在國(guó)際奧林匹克數(shù)學(xué)競(jìng)賽(IMO25)上對(duì)其推理能力進(jìn)行了測(cè)試:Ring-1T-preview能一次性解對(duì)第三題,并在第1、2、4、5題可一次推理出部分正確答案,展現(xiàn)出其強(qiáng)大的邏輯與數(shù)學(xué)推理潛力。
螞蟻百靈團(tuán)隊(duì)還透露,當(dāng)前正在投入Ling2.0家族1T語(yǔ)言基座的后訓(xùn)練工作,以進(jìn)一步激發(fā)萬(wàn)億規(guī)?;P偷臐摿Γ桨鍾ing-1T也在訓(xùn)練中,未來(lái)將進(jìn)一步其極限能力。
智源:開源RoboBrain-X0,加速通用具身智能
除此之外,今天下午智源也開源了RoboBrain-X0——一個(gè)能夠在零樣本泛化、少量樣本微調(diào)條件下,驅(qū)動(dòng)多種不同真實(shí)機(jī)器人完成復(fù)雜任務(wù)的跨本體基座大模型。
根據(jù)智源介紹,RoboBrain-X0 源自 RoboBrain 的多模態(tài)基座能力,在 RoboBrain 2.0 數(shù)據(jù)基礎(chǔ)上,進(jìn)一步融合了真實(shí)機(jī)器人動(dòng)作數(shù)據(jù)。通過(guò)統(tǒng)一建模視覺(jué)、語(yǔ)言與動(dòng)作,RoboBrain-X0實(shí)現(xiàn)了跨本體的泛化與適配,具備從感知到執(zhí)行的一體化能力。
為了支撐這一能力,智源還同步開源了RoboBrain-X0-Dataset,其涵蓋多模態(tài)問(wèn)答、開源動(dòng)作、產(chǎn)業(yè)合作及自采數(shù)據(jù),構(gòu)建了覆蓋“感知—思考—行動(dòng)”的全鏈路訓(xùn)練基石。這一開放舉措旨在打破“數(shù)據(jù)孤島”,為開發(fā)者提供開箱即用的研發(fā)資源,加速機(jī)器人智能走向真實(shí)世界。
智源表示,RoboBrain-X0已全面開源,包括預(yù)訓(xùn)練模型、數(shù)據(jù)集和技術(shù)文檔,并接入RoboBrain 2.0工具鏈。未來(lái),團(tuán)隊(duì)將持續(xù)迭代,結(jié)合指令微調(diào)和強(qiáng)化學(xué)習(xí),推動(dòng)機(jī)器人在開放環(huán)境下的泛化與決策能力提升。
如此看來(lái),雙節(jié)前的最后一天,AI圈可謂是一點(diǎn)也沒(méi)消停,甚至卷勢(shì)還更勝以往……由此,不少圈內(nèi)人都在喊話:別卷了別卷了,咱們要不國(guó)慶歇一歇呢?
最后由于時(shí)間有限,文中或許還遺漏了一些大模型動(dòng)態(tài),也歡迎大家在評(píng)論區(qū)留言補(bǔ)充~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.