夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

阿里發(fā)布Qwen3-Coder:4800億參數(shù),實現(xiàn)開源代碼模型新SOTA

0
分享至

今天,阿里全新開源代碼模型 Qwen3-Coder 正式發(fā)布。


(來源:X)

Qwen3-Coder 擁有多個尺寸,此次發(fā)布的是最強大的版本,名為 Qwen3-Coder-480B-A35B-Instruct(以下簡稱 Qwen3-Coder)。

它是一款混合專家(MoE)模型,總參數(shù)量高達 4,800 億,激活參數(shù)為 350 億,原生支持 256K token 的上下文,并可通過 YaRN 擴展到高達 1 百萬 token,支持 358 種編程語言。


圖 | Qwen3-Coder 在測試中的表現(xiàn)(來源:資料圖)

由于 Qwen3 系列模型的整體調(diào)整,Qwen3-Coder 僅支持非思考模式,不生成思考過程。

在注意力機制方面,Qwen3-Coder 采用了分組查詢注意力(GQA)方案,配備 96 個查詢(Q)注意力頭和 8 個鍵/值(KV)注意力頭,并擁有 160 個專家(Expert),其中 8 個專家被激活。


圖 | Qwen3-Coder 模型總覽(來源:Qwen)

據(jù)介紹,預(yù)訓(xùn)練階段,Qwen3-Coder 從數(shù)據(jù)、上下文、合成數(shù)據(jù)三個不同角度進行擴展(scaling),以提升模型的代碼能力。

在后訓(xùn)練階段,研究團隊選擇在更豐富的真實代碼任務(wù)上擴展代碼強化學(xué)習(xí)(Code RL)訓(xùn)練。通過自動擴展測試樣例,他們構(gòu)造了大量高質(zhì)量的訓(xùn)練實例,成功釋放了強化學(xué)習(xí)的潛力:不僅顯著提升了代碼執(zhí)行成功率,還對其他任務(wù)帶來增益。

此前網(wǎng)友挖出線索,阿里團隊在代碼中介紹 Qwen3-Coder 時寫道:“Qwen3-Coder-480B-A35B-Instruct 是一個強大的編碼專用語言模型,在代碼生成、工具使用和代理任務(wù)方面表現(xiàn)出色?!?/p>


圖 | 網(wǎng)友先前挖出 Qwen3-Coder 的線索(來源:X)

阿里表示,該模型“擁有卓越的代碼和代理能力”。Qwen3-Coder 在代理式編碼、代理式瀏覽器使用和代理式工具使用上成為了開源模型的 SOTA,可以媲美 Claude Sonnet 4。

Qwen3-Coder 也是受到了網(wǎng)友的大力追捧,代碼庫上線一小時就收獲了 5.1k Star。


(來源:GitHub)

與此同時,阿里還推出并開源了一款用于代理式編程的命令行工具:Qwen Code。

“Qwen Code 基于 Gemini Code 進行二次開發(fā),但我們進行了提示詞和工具調(diào)用協(xié)議適配,使得 Qwen Code 可以最大程度激發(fā) Qwen3-Coder 在代理式編程任務(wù)上的表現(xiàn)?!卑⒗镌诠倬W(wǎng)上表示。


(來源:資料圖)

另外,Qwen3-Coder 也可以和 AI 社區(qū)優(yōu)秀的編程工具結(jié)合使用,如 Claude Code、Cline 等。開發(fā)者也可以通過阿里云 Model Studio 調(diào)用 Qwen3-Coder API。

目前,Qwen3-Coder 網(wǎng)頁版已經(jīng)上線,筆者第一時間嘗試了它的編程水平。


(來源:https://chat.qwen.ai/)

在只提供一句“克隆推特網(wǎng)頁設(shè)計和UI”提示的情況下,Qwen3-Coder 給出的結(jié)果還是不錯的:


圖 | Qwen3-Coder 生成的仿推特 UI(來源:資料圖)

相比之下,ChatGPT(免費版)給出的結(jié)果則是有些簡陋,雖然文本和幾個功能區(qū)域都有,但幾乎沒有視覺元素:


圖 | ChatGPT 生成的仿推特 UI(來源:資料圖)

筆者還讓 Qwen3-Coder 做了一個簡單的網(wǎng)頁版乒乓球游戲,同樣只是一句話提示:“開發(fā)一個可以在網(wǎng)站上運行的乒乓球游戲”。

代碼生成后直接在 Artifact 上無縫運行,整個過程不到 20 秒,效果很驚艷,直接用鍵盤就能控制,支持兩人對戰(zhàn),它還自主發(fā)揮加上了獲勝規(guī)則:

而 ChatGPT 生成的雖然也能運行,但無論是美觀還是完整性,都遠不及 Qwen3-Coder:


圖 | ChatGPT 生成的乒乓球游戲截圖(來源:資料圖)

最后是官方給出的兩段代碼運行效果,分別是地球 3D 模擬和 Flappy Bird 游戲:

此次發(fā)布的 Qwen3-Coder 屬于阿里 Qwen3 系列。

三個月前,阿里發(fā)布了千問 3(Qwen3)系列模型,包括兩款混合專家 MoE 模型、六款密集模型和若干模型變種,例如后訓(xùn)練、FP8 版本等等。

其中的旗艦?zāi)P?Qwen3-235B-A22B,總參數(shù)量高達 2,350 億(235B),其中激活參數(shù)為 220 億(A22B),分布在 94 個深層網(wǎng)絡(luò)層中。

另外一個 MoE 模型 Qwen3-30B-A3B,尺寸較小,總參數(shù)量 300 億,激活參數(shù)量 30 億。


(來源:Qwen3)

當(dāng)時,Qwen3 系列引入了一種混合方法來解決問題,一個模型同時支持思考模式和非思考模式。但現(xiàn)在這種模式已經(jīng)被取消。

就在 Qwen3-Coder 發(fā)布的前一天,阿里同樣更新了 Qwen3 系列,新模型名為 Qwen3-235B-A22B-Instruct-2507(簡稱 Qwen3-2507),迭代速度令人驚喜。

阿里在官網(wǎng)表示,“經(jīng)過與社區(qū)溝通和深思熟慮后,我們決定停止使用混合思維模式。取而代之的是,我們將分別訓(xùn)練 Instruct 和 Thinking 模型,以獲得最佳質(zhì)量。所以我們發(fā)布了 Qwen3-235B-A22B-Instruct-2507 及其 FP8 版本,供大家使用?!?/p>


(來源:資料圖)

Qwen3-2507 在主流基準(zhǔn)測試中表現(xiàn)優(yōu)異。作為一款“沒有思考能力”的開源模型,它在 GPQA、AIME25 和 LiveCodeBench v6 等測試中均超越了未開啟思考模式的 Claude Opus 4。

可以說,無論是Qwen3-Coder 還是 Qwen3-2507,再加上 DeepSeek 和 Kimi,都是 AI 開源社區(qū)寶貴的財富。

在閉源模型各種刷榜的今天,它們難得的推動了大模型技術(shù)的普及化,為AI 社區(qū)開發(fā)者和研究人員提供了強大的免費工具。更重要的是,它們的廣受歡迎讓中國在全球 AI 開源領(lǐng)域占據(jù)了重要一席。


(來源:資料圖)

這不僅能促進 AI 技術(shù)的普惠發(fā)展,還能有效降低創(chuàng)新門檻,讓更多開發(fā)者參與進來,共同構(gòu)建一個更加開放和繁榮的 AI 生態(tài)系統(tǒng)。

反過來,這些模型未來在產(chǎn)業(yè)應(yīng)用、學(xué)術(shù)研究和人才培養(yǎng)等方面都將發(fā)揮不可估量的作用,進一步加速中國在 AI 領(lǐng)域的進步。

參考資料:

https://qwenlm.github.io/blog/qwen3-coder/

https://qwenlm.github.io/blog/qwen3/

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

https://arxiv.org/pdf/2505.09388

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
太郁悶了,靈活就業(yè)人員繳費20年,每月只發(fā)了1600元,合理嗎?

太郁悶了,靈活就業(yè)人員繳費20年,每月只發(fā)了1600元,合理嗎?

碎月導(dǎo)師
2025-08-07 07:00:03
福建90后夫妻6個兒子卻還要生,一頓吃500個水餃,想擁有36個孫子

福建90后夫妻6個兒子卻還要生,一頓吃500個水餃,想擁有36個孫子

牛牛叨史
2025-07-30 02:24:31
93年,男子借9萬買下北京院子的廁所被全家反對,16年后意外發(fā)生

93年,男子借9萬買下北京院子的廁所被全家反對,16年后意外發(fā)生

前沿天地
2025-08-05 12:34:06
004、005號即將公開!國產(chǎn)核航母刷新中國海軍歷史

004、005號即將公開!國產(chǎn)核航母刷新中國海軍歷史

書中自有顏如玉
2025-08-07 05:07:42
京東豪擲百億拿下比亞迪50萬輛大單,汽車帝國正式起航?

京東豪擲百億拿下比亞迪50萬輛大單,汽車帝國正式起航?

四象八卦
2025-08-05 06:36:30
國民黨主席選定?10萬人投票出爐,盧秀燕、蔣萬安排二三

國民黨主席選定?10萬人投票出爐,盧秀燕、蔣萬安排二三

愛意隨風(fēng)起呀
2025-08-06 09:02:54
記者:周末上海德比球票售罄 觀眾數(shù)大概率創(chuàng)近3賽季申花主場紀(jì)錄

記者:周末上海德比球票售罄 觀眾數(shù)大概率創(chuàng)近3賽季申花主場紀(jì)錄

直播吧
2025-08-07 11:05:13
在播劇熱度榜,《定風(fēng)波》第4,《凡人修仙傳》第2,第1后來居上

在播劇熱度榜,《定風(fēng)波》第4,《凡人修仙傳》第2,第1后來居上

娛君墜星河
2025-08-06 14:15:14
只剩最后不到1個月,莫迪提出無理要求,決心攪黃中方大事?

只剩最后不到1個月,莫迪提出無理要求,決心攪黃中方大事?

湘評中外
2025-08-07 17:35:08
7天新增2892例!多地通知:實行14天健康監(jiān)測!成都疾控發(fā)布重要提示!

7天新增2892例!多地通知:實行14天健康監(jiān)測!成都疾控發(fā)布重要提示!

CD潮生活
2025-08-07 11:47:14
iPhone 18 Pro首發(fā)!蘋果最強基帶曝光

iPhone 18 Pro首發(fā)!蘋果最強基帶曝光

快科技
2025-08-07 15:32:05
全員交社保,奶茶店的老板和員工怎么破局?結(jié)果應(yīng)該是這樣的

全員交社保,奶茶店的老板和員工怎么破局?結(jié)果應(yīng)該是這樣的

恪守原則和底線
2025-08-07 17:58:22
日媒:中國正在出口新型生產(chǎn)模式

日媒:中國正在出口新型生產(chǎn)模式

參考消息
2025-08-07 13:45:08
阿拉法特的錯誤,造成了巴勒斯坦的苦難,中國數(shù)十年前曾勸告未果

阿拉法特的錯誤,造成了巴勒斯坦的苦難,中國數(shù)十年前曾勸告未果

博覽歷史
2025-08-07 17:54:49
男子除夕夜殺害7個月大侄女案開庭 其弟:庭上與哥哥對視一直流淚,一家人鬧僵難以諒解

男子除夕夜殺害7個月大侄女案開庭 其弟:庭上與哥哥對視一直流淚,一家人鬧僵難以諒解

紅星新聞
2025-08-06 16:44:25
小鵬汽車何小鵬:以前是科技第一現(xiàn)在顏值第一,在上海租了兩棟樓給造型團隊,要啥給啥!一年在AI訓(xùn)練上花20億,設(shè)計也可花20億

小鵬汽車何小鵬:以前是科技第一現(xiàn)在顏值第一,在上海租了兩棟樓給造型團隊,要啥給啥!一年在AI訓(xùn)練上花20億,設(shè)計也可花20億

和訊網(wǎng)
2025-08-07 09:07:09
難!市場冷清+就業(yè)危機,威少恐無球可打,全看庫明加臉色啊

難!市場冷清+就業(yè)危機,威少恐無球可打,全看庫明加臉色啊

球童無忌
2025-08-07 18:09:20
印度公布陣風(fēng)被擊落原因,中國“虛標(biāo)”導(dǎo)彈射程,把印度騙慘了

印度公布陣風(fēng)被擊落原因,中國“虛標(biāo)”導(dǎo)彈射程,把印度騙慘了

博覽歷史
2025-08-04 18:04:18
網(wǎng)友爆料:全民社保后,樓下麥當(dāng)勞只招聘大學(xué)生兼職和50歲老人

網(wǎng)友爆料:全民社保后,樓下麥當(dāng)勞只招聘大學(xué)生兼職和50歲老人

古希臘掌管松餅的神
2025-08-06 09:10:59
這一仗徹底把泰國打醒,卡了中國四年的軍購,佩通坦內(nèi)閣終于點頭

這一仗徹底把泰國打醒,卡了中國四年的軍購,佩通坦內(nèi)閣終于點頭

史紀(jì)文譚
2025-08-07 16:36:20
2025-08-07 19:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15497文章數(shù) 513968關(guān)注度
往期回顧 全部

科技要聞

蘋果宣布在美追加千億投資,股價應(yīng)聲漲5%

頭條要聞

男子因雞蛋被侄兒吃掉抱怨 妻子崩潰摔碗后已經(jīng)回老家

頭條要聞

男子因雞蛋被侄兒吃掉抱怨 妻子崩潰摔碗后已經(jīng)回老家

體育要聞

文班接受加內(nèi)特指導(dǎo) 此前曾在少林寺練功夫

娛樂要聞

葉珂說剛生完孩子 和黃曉明沒分手?

財經(jīng)要聞

李稻葵:建議給外來打工者發(fā)15萬安家費

汽車要聞

90.8%得房率還有華為全家桶 嵐圖全新知音8月13日預(yù)售

態(tài)度原創(chuàng)

家居
親子
房產(chǎn)
數(shù)碼
軍事航空

家居要聞

自然開闊 溫暖簡約高級

親子要聞

3歲寶寶放暑假在家,大家聽聽他說的是人話嗎???

房產(chǎn)要聞

刺激!越來越多房企,沖入??诤勒袌觯?/h3>

數(shù)碼要聞

愛速特推出 AS72R 旗艦機架式 NAS,搭載八核 AMD "Zen 4" 處理器

軍事要聞

美國“最先進”驅(qū)逐艦??咳毡緯r被拍到銹跡斑斑

無障礙瀏覽 進入關(guān)懷版 亚洲av区无码字幕中文色| 国产精品久久久久久男宅| 手机av在线直接看| 无码中文亚洲av影音先锋| 天天色综合4| 无码精品国产va在线观看| 极品人妻少妇av免费久久| 99在线观看视频免费| www东京热| 天堂网av小说| av永久天堂一区二区三区| 国产精品线在线精品| 在线免费无码AV| 亚洲一区二区三区波多野结衣| 俄罗斯肥逼日日日| 凹凸aV一二三区| 欧美极品少妇做受| 亚洲午夜成人精品电影在线观看 | 99久久久无码国产精品不卡京东| 婷婷婷国产在线视频| 乱伦九九九视频| 美女午夜福利视频一区二区| 免费无码又爽又刺激蜜桃AV| 乱公和我做爽死我视频| 亚洲无码专区一区二区在线| 久久不见久久见免费影院国语| 亚洲AV无码精品一区二区三区l| 久久香蕉av| 俺也去噜色AV| 亚洲国产精品午夜电影| 色七七桃花影院| aⅴ成人久久| 在线高潮网站| 国产精品久久久久一区二区三区| 精品久久无码AV懂色| 人妻丰满av无码久久不卡| 风韵丰满熟妇啪啪区老老熟妇 | 少妇HD嗯嗯一区| 亚洲精品国产电影| 男女晚上日日麻批视频| 成在人线av无码免费高潮求绕|