今天,阿里通義團(tuán)隊(duì)發(fā)布并開(kāi)源了 Qwen 系列最強(qiáng) 代碼模型 Qwen3-Coder。
Qwen3-Coder 系列包括多個(gè)尺寸版本,其中 Qwen3-Coder-480B-A35B-Instruct 是最強(qiáng)大的版本。
Qwen3-Coder-480B-A35B-Instruct 是一個(gè) 480B 參數(shù)激活 35B 參數(shù)的 MoE 模型,原生支持 256K token 的上下文并可通過(guò) YaRN 擴(kuò)展到 1M token,代碼和 Agent 能力優(yōu)異。
在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 等方面均取得了開(kāi)源模型的 SOTA 效果,可與 Claude Sonnet4 媲美。
目前 Qwen3-Coder 已在 Qwen Chat 網(wǎng)頁(yè)版上線,用戶可免費(fèi)體驗(yàn)。
Qwen chat:chat.qwen.ai
阿里云百煉:https://bailian.console.aliyun.com/tab=model#/model-market/detail/qwen3-coder-480b-a35b-instruct
GitHub:https://github.com/QwenLM/Qwen3-Coder
Hugging Face:https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct
魔搭社區(qū):https://www.modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
超 10000 人的「AI 產(chǎn)品市集」社群!不錯(cuò)過(guò)每一款有價(jià)值的 AI 應(yīng)用。
邀請(qǐng)從業(yè)者、開(kāi)發(fā)人員和創(chuàng)業(yè)者,飛書(shū)掃碼加群:
進(jìn)群后,你有機(jī)會(huì)得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈(zèng)送熱門新品的邀請(qǐng)碼、會(huì)員碼;
最精準(zhǔn)的AI產(chǎn)品曝光渠道
Demo1:模擬煙囪拆除
Demo2:VS Code中生成煙花效果
Demo3:3D地球
Demo4:打字機(jī)效果
Demo5:小球沿立方體軌跡旋轉(zhuǎn)
Demo6:模擬太陽(yáng)系行星運(yùn)轉(zhuǎn)
Demo7:二重奏游戲
02技術(shù)細(xì)節(jié)
預(yù)訓(xùn)練階段
我們?cè)陬A(yù)訓(xùn)練上仍然在努力,這次 Qwen3-Coder 我們從不同角度進(jìn)行 Scaling,以提升模型的代碼能力:
數(shù)據(jù)擴(kuò)展:總計(jì) 7.5T(代碼占比 70%),在保持通用與數(shù)學(xué)能力的同時(shí),具備卓越的編程能力;
上下文擴(kuò)展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,專為倉(cāng)庫(kù)級(jí)和動(dòng)態(tài)數(shù)據(jù)(如 Pull Request)優(yōu)化,助力 Agentic Coding;
合成數(shù)據(jù)擴(kuò)展:利用 Qwen2.5-Coder 對(duì)低質(zhì)數(shù)據(jù)進(jìn)行清洗與重寫,顯著提升整體數(shù)據(jù)質(zhì)量。
后訓(xùn)練階段
Scaling Code RL: Hard to Solve, Easy to Verify
與當(dāng)前社區(qū)普遍聚焦于競(jìng)賽類代碼生成不同,我們認(rèn)為所有的代碼任務(wù)天然適合執(zhí)行驅(qū)動(dòng)的大規(guī)模強(qiáng)化學(xué)習(xí)。因此我們選擇在更豐富的真實(shí)代碼任務(wù)上擴(kuò)展 Code RL 訓(xùn)練。通過(guò)自動(dòng)擴(kuò)展測(cè)試樣例,我們構(gòu)造了大量高質(zhì)量的訓(xùn)練實(shí)例,成功釋放了強(qiáng)化學(xué)習(xí)的潛力:不僅顯著提升了代碼執(zhí)行成功率,還對(duì)其他任務(wù)帶來(lái)增益。這將鼓勵(lì)我們繼續(xù)尋找 Hard to Solve, Easy to Verify 的任務(wù),作為強(qiáng)化學(xué)習(xí)的土壤。
Scaling Long-Horizon RL
在真實(shí)世界的 Software Engneering Task,比如 SWE-Bench,模型需要在環(huán)境中不斷交互,自主規(guī)劃、選擇工具調(diào)用、接受反饋不斷做出新決策,這是一個(gè)典型的 Long-Horizon RL 任務(wù)。我們?cè)?Qwen3-Coder 的后訓(xùn)練階段執(zhí)行了 Agent RL,鼓勵(lì)模型通過(guò)多輪交互的方式利用工具解決問(wèn)題。Agent RL 的主要挑戰(zhàn)在于 Environment Scaling,我們實(shí)現(xiàn)了可驗(yàn)證環(huán)境的擴(kuò)展系統(tǒng),借助阿里云的基礎(chǔ)設(shè)施,實(shí)現(xiàn)同時(shí)運(yùn)行 20k 獨(dú)立環(huán)境。這一套基礎(chǔ)設(shè)施可以提供大規(guī)模的強(qiáng)化學(xué)習(xí)反饋和評(píng)測(cè),最終我們?cè)?SWE-bench Verified 上實(shí)現(xiàn)了開(kāi)源模型 SOTA 的效果。
03花式調(diào)用Qwen3-CoderQwen Code
除 了發(fā)布 Qwen3-Coder 系列模型外,官方 還推出并開(kāi)源了一款用于代理式編程的命令行工具:Qwen Code。Qwen Code 基于 Gemini Code 進(jìn)行二次開(kāi)發(fā),在經(jīng)過(guò) prompt 和工具調(diào)用協(xié)議適配后,Qwen C ode 可以最大程度激發(fā) Qwen3-Coder 在 Agentic Coding 任務(wù)上的表現(xiàn)。
Qwen Code 是一個(gè) CLI工具,修改自Gemini CLI,針對(duì) Qwen3?Coder系列的模型增強(qiáng)了解析器和工具支持。
step1:安裝Qwen Code
確保已安裝 Node.js 20 及以上版本,可以通過(guò)以下命令安裝:
curl -qL https://www.npmjs.com/install.sh | sh
step2:通過(guò) npm 管理器安裝 Qwen Code
從 npm 包安裝:
npm i -g @qwen-code/qwen-code
從源碼安裝:
git clone https://github.com/QwenLM/qwen-code
cd qwen-code && npm install && npm install -g .
step3:配置環(huán)境變量(使用 OpenAI SDK 調(diào)用 LLM)
Qwen Code 支持 OpenAI SDK 調(diào)用 LLM,你可以導(dǎo)出以下環(huán)境變量,或者簡(jiǎn)單地將其放在 .envfile 中。
export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"
現(xiàn)在,你可以通過(guò)簡(jiǎn)單地輸入 「qwen 」來(lái)享受 Qwen-Code 和 Qwen 帶來(lái)的編程體驗(yàn)。
Claude Code
除了 Qwen?Code 之外,還可以將 Qwen3?Coder 與 Claude?Code 搭配使用。只需在阿里云百煉平臺(tái)?(http://bailian.console.aliyun.com) 申請(qǐng)?API? Key,并安裝?Claude?Code,即可開(kāi)始暢享編碼體驗(yàn)。
npm install -g @anthropic-ai/claude-code
官方提供了兩種接入方式。
方案?1:使用dashscope提供的代理 ?API
只需要將Anthropic的base url替換成dashscope上提供的endpoint即可。
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
至此,你就可以直接輸入claude 開(kāi)始使用 Qwen3-Coder & Claude Code
方案?2:使用 claude-code-config 自定義路由
claude-code-router是一個(gè)第三方的路由工具,用于為?Claude?Code?靈活地切換不同的后端 API。dashscope平臺(tái)提供了一個(gè)簡(jiǎn)單的擴(kuò)展包 claude-code-config,可為 claude-code-router 生成包含 dashscope 支持的默認(rèn)配置。
npm install -g @musistudio/claude-code-router
npm install -g @dashscope-js/claude-code-config
生成配置文件和插件目錄:
ccr-dashscope
該命令會(huì)自動(dòng)生成 ccr 所需的配置文件和插件目錄。你也可以手動(dòng)調(diào)整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/中的配置。
最后,通過(guò) ccr 開(kāi)始使用 Claude Code:
ccr code
CLINE
此外,Qwen3-Coder 可以和社區(qū)優(yōu)秀的編程工具結(jié)合,如 Claude Code、Cline 等。
配置 Qwen3-Coder-480B-A35B-instruct 以使用 cline:
step1:進(jìn)入 cline 的配置設(shè)置
step2:選擇“OpenAI Compatible”模式
step3:在 OpenAI Compatible API tokens處,輸入從 Dashscope 獲取的密鑰
step4:勾選“使用自定義基礎(chǔ) URL”,并輸入:https://dashscope.aliyuncs.com/compatible-mode/v1
step5:輸入模型名稱:qwen3-coder-plus
05如何調(diào)用 API
如果你想要通過(guò)百煉 API 平臺(tái)(https://bailian.console.aliyun.com/)調(diào)用 Qwen3-Coder,歡迎使用以下示例代碼進(jìn)行測(cè)試。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
prompt = "Help me create a web page for an online bookstore."
# Send request to qwen3-coder-plus model
completion = client.chat.completions.create(
model="qwen3-coder-plus",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": prompt}
],
)
# Print the response
print(completion.choices[0].message.content.strip())
轉(zhuǎn)載原創(chuàng)文章請(qǐng)?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.