9月24日消息,通義千問團(tuán)隊今日推出Qwen3-Max,號稱是迄今為止規(guī)模最大、能力最強(qiáng)的模型。
目前,Qwen3-Max-Instruct 的預(yù)覽版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。
正式版本在代碼能力和智能體(agent)能力方面進(jìn)一步提升,在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智能體任務(wù)和多語言理解的全面基準(zhǔn)測試中均達(dá)到業(yè)界領(lǐng)先水平。
Qwen3-Max模型總參數(shù)超過1T,預(yù)訓(xùn)練使用了36T tokens。模型結(jié)構(gòu)沿用了Qwen3系列的模型結(jié)構(gòu)設(shè)計范式,使用了我們提出的global-batch load balancing loss。
Qwen3-Max-Instruct的預(yù)覽版已在 LMArena 文本排行榜上穩(wěn)居全球前三。正式發(fā)布版本進(jìn)一步提升了其能力,尤其在代碼生成與智能體表現(xiàn)方面表現(xiàn)卓越。在專注于解決現(xiàn)實編程挑戰(zhàn)的基準(zhǔn)測試 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高達(dá)69.6分的優(yōu)異成績,穩(wěn)居全球頂尖模型之列。
Qwen3-Max 的推理增強(qiáng)版本—— Qwen3-Max-Thinking,通過集成代碼解釋器并運用并行測試時計算技術(shù),展現(xiàn)了前所未有的推理能力,尤其在極具挑戰(zhàn)性的數(shù)學(xué)推理基準(zhǔn)測試 AIME 25 和 HMMT 上,均取得了滿分。(AI普瑞斯編譯)
更多AI資訊請點擊:http://www.aipress.com.cn/
原文:http://www.aipress.com.cn/news/details?id=70640
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.