4月29日凌晨,阿里巴巴開(kāi)源新一代通義千問(wèn)模型Qwen3(簡(jiǎn)稱千問(wèn)3),參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等領(lǐng)先模型,登頂全球最強(qiáng)開(kāi)源模型。
根據(jù)官方的說(shuō)法,千問(wèn)3的旗艦版本 Qwen3-235B-A22B,在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,達(dá)到了與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。
在奧數(shù)水平的 AIME25 測(cè)評(píng)中,Qwen3-235B-A22B 斬獲 81.5 分,刷新了開(kāi)源模型的紀(jì)錄;在考察代碼能力的 LiveCodeBench 評(píng)測(cè)中,Qwen3-235B-A22B 突破 70 分,表現(xiàn)甚至超過(guò) Grok 3;在評(píng)估模型人類偏好對(duì)齊的 ArenaHard 測(cè)評(píng)中,Qwen3-235B-A22B 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。
此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌,甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。
千問(wèn)3總參數(shù)量235B,刷新了開(kāi)源模型的智能水平新高,阿里稱僅需4張H20即可部署千問(wèn)3滿血版,顯存占用僅為性能相近模型的三分之一。
千問(wèn)3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。
千問(wèn)3是國(guó)內(nèi)首個(gè)“混合推理模型”,模型支持兩種思考模式:思考模式:在這種模式下,模型會(huì)逐步推理,經(jīng)過(guò)深思熟慮后給出最終答案。這種方法適合需要深入思考的復(fù)雜問(wèn)題。非思考模式:在此模式中,模型提供快速、近乎即時(shí)的響應(yīng),適用于那些對(duì)速度要求高于深度的簡(jiǎn)單問(wèn)題。
在預(yù)訓(xùn)練方面,千問(wèn)3的數(shù)據(jù)集相比Qwen2.5有了顯著擴(kuò)展。Qwen2.5是在18萬(wàn)億個(gè)token上進(jìn)行預(yù)訓(xùn)練的,而千問(wèn)3使用的數(shù)據(jù)量幾乎是其兩倍,達(dá)到了約36萬(wàn)億個(gè)token,涵蓋了119種語(yǔ)言和方言。
同時(shí),千問(wèn)3為即將到來(lái)的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中,千問(wèn)3創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,將大幅降低Agent調(diào)用工具的門(mén)檻。
據(jù)悉,千問(wèn)3系列模型依舊采用寬松的Apache2.0協(xié)議開(kāi)源,并首次支持119多種語(yǔ)言,全球開(kāi)發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)在魔搭社區(qū)、HuggingFace等平臺(tái)下載模型并商用,也可以通過(guò)阿里云百煉調(diào)用千問(wèn)3的API服務(wù)。個(gè)人用戶可立即通過(guò)通義APP直接體驗(yàn)千問(wèn)3,夸克也即將全線接入千問(wèn)3。
目前,阿里通義已開(kāi)源200余個(gè)模型,全球下載量超3億次,千問(wèn)衍生模型數(shù)超10萬(wàn)個(gè),已超越美國(guó)Llama,成為全球第一開(kāi)源模型。
與此同時(shí),阿里巴巴千問(wèn)3開(kāi)源后,上下游供應(yīng)鏈連夜進(jìn)行適配和調(diào)用,英偉達(dá)、高通、聯(lián)發(fā)科、AMD等多家頭部芯片廠商已成功適配千問(wèn)3,在不同硬件平臺(tái)和軟件棧上的推理效率均顯著提升,可滿足移動(dòng)終端和數(shù)據(jù)中心場(chǎng)景的AI推理需求。
此外,在阿里千問(wèn)3開(kāi)源數(shù)小時(shí)后,華為官方宣布昇騰支持千問(wèn)3全系列模型部署,開(kāi)發(fā)者在MindSpeed和MindIE中開(kāi)箱即用,實(shí)現(xiàn)千問(wèn)3的0day適配。隨后海光信息也表示,在“深算智能”戰(zhàn)略引領(lǐng)下,海光DCU迅速完成對(duì)全部8款模型的無(wú)縫適配+調(diào)優(yōu),覆蓋235B/32B/30B/14B/8B/4B/1.7B/0.6B,實(shí)現(xiàn)零報(bào)錯(cuò)、零兼容性問(wèn)題的秒級(jí)部署。
早在2024年3月,智能手機(jī)芯片廠商聯(lián)發(fā)科,已在天璣9300等旗艦芯片上部署通義千問(wèn)18億、40億參數(shù)大模型,此次適配千問(wèn)3是雙方芯片級(jí)軟硬適配的延續(xù)。去年10月,高通在在發(fā)布會(huì)上宣布了跟騰訊混元和智譜的合作,騰訊混元大模型7B和3B版本、智譜的GLM-4V端側(cè)視覺(jué)大模型都會(huì)在搭載驍龍8 Elite的手機(jī)上落地。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.