智東西
作者 王涵
編輯 漠影
智東西9月30日消息,今天,螞蟻百靈大模型宣布開源其思考模型Ring-1T的預(yù)覽版——Ring-1T-preview,參數(shù)量達(dá)1000B(1萬億)!
開源鏈接:
Hugging Face:https://huggingface.co/inclusionAI/Ring-1T-preview
魔搭社區(qū):https://modelscope.cn/models?page=1&tabKey=task
該模型延續(xù)Ling 2.0的MoE架構(gòu),在20T高質(zhì)量語料上完成預(yù)訓(xùn)練,結(jié)合此前公開的棒冰(icepop)方法,在自研開源高效強(qiáng)化學(xué)習(xí)系統(tǒng)ASystem上進(jìn)行了針對(duì)推理能力的RLVR訓(xùn)練。
在AIME 2025(美國數(shù)學(xué)邀請(qǐng)賽),Ring-1T通過純自然語言推理即可取得92.6的高分,進(jìn)一步逼近GPT-5 with thinking(no tools)的94.6水平。
此外,在哈佛-麻省理工數(shù)學(xué)競(jìng)賽HMMT 2025,競(jìng)賽級(jí)代碼生成任務(wù)LiveCodeBench v6、CodeForces上,以及抽象推理基準(zhǔn)ARC-AGI-1等任務(wù)中,Ring-1T均超越Gemini-2.5-pro和DeepSeek-V3.1-Terminus-Thinking。
為了進(jìn)一步探索Ring-1T早期版本的推理上限,研究團(tuán)隊(duì)將其接入多智能體框架AWorld,并在IMO 2025(國際數(shù)學(xué)奧林匹克競(jìng)賽)上進(jìn)行了純自然語言推理測(cè)試。
此前,Ring-flash-2.0在允許三次推理嘗試的設(shè)定下,直到第三次才勉強(qiáng)解出第3題。相比之下,Ring-1T在本次測(cè)試中僅用一次推理就解出了第3題,并且在第1、2、4、5題上也能一次性給出部分正確答案。
百靈團(tuán)隊(duì)稱Ring-1T仍在持續(xù)訓(xùn)練中,此次發(fā)布的預(yù)覽版仍存在語種混雜、推理重復(fù)、身份認(rèn)知錯(cuò)誤等問題,希望通過開源社區(qū)的反饋,進(jìn)一步完善Ring-1T的功能。
從今年3月到現(xiàn)在,螞蟻一直在對(duì)百靈大模型進(jìn)行迭代優(yōu)化。3月,螞蟻開源了兩款MoE(混合專家)大語言模型Ling-Lite和Ling-Plus,并在4月發(fā)布了Ling-Lite的更新版本Ling-lite-0415。4月初,輕量級(jí)推理模型Ring-lite-distill-preview和混合線性長(zhǎng)推理模型Ring-lite-linear-preview開源。
5月,螞蟻發(fā)布了MoE架構(gòu)的全模態(tài)大模型Ming-lite-omni-preview和Ming-lite-uni,并開源了統(tǒng)一多模態(tài)大模型Ming-lite-omni和Ling-lite-1.5。
6月,在Ling-lite-1.5的基礎(chǔ)上,螞蟻發(fā)布了輕量級(jí)推理模型Ring-lite。7月,其發(fā)布了Ming-lite-omni v1.5、Ring-lite-2507和Ling-lite-1.5-2507。
9月,螞蟻開源語言模型Ling-mini-2.0,在此基礎(chǔ)上推出了推理模型Ring-mini-2.0和輕量版Ling-flash-2.0以及思考模型Ring-flash-2.0。
上周五,螞蟻也才剛剛開源兩款思考模型——Ring-flash-linear-2.0 與 Ring-mini-linear-2.0,還同步發(fā)布兩大自研融合算子,即FP8融合算子和線性Attention推理融合算子。
結(jié)語:百靈大模型在復(fù)雜邏輯推理能力上下“狠功夫”
百靈大模型團(tuán)隊(duì)此次開源,是想要通過開放早期成果,匯聚社區(qū)智慧,對(duì)于Ring-1T進(jìn)行“查漏補(bǔ)缺”。
從AIME到IMO國際頂級(jí)數(shù)學(xué)競(jìng)賽的初步測(cè)試表現(xiàn)來看,Ring-1T在復(fù)雜邏輯推理能力上進(jìn)一步提升,正式版本的性能值得期待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.