編輯丨王多魚
排版丨水成文
剛剛,DeepSeek 正式發(fā)布了DeepSeek-V3.1。這一升級(jí)版包含以下主要變化:
混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案;
更強(qiáng)的 Agent 能力:通過 Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
1. 混合推理架構(gòu):思考模式 & 非思考模式自由切換
DeepSeek-V3.1 首次引入混合推理架構(gòu),用戶可以在“深度思考”模式和 “非思考”模式之間自由切換:
思考模式(DeepSeek-Reasoner):適用于需要深度推理的任務(wù),如數(shù)學(xué)計(jì)算、復(fù)雜邏輯分析等,推理效率更高。
非思考模式(DeepSeek-Chat):適用于日常對(duì)話、信息查詢等輕量級(jí)任務(wù),響應(yīng)更迅速。
在官方 App 和網(wǎng)頁端,用戶可通過“深度思考”按鈕,一鍵切換模式,體驗(yàn)更智能的交互方式!
2. 更強(qiáng)的 Agent 能力:編程、搜索大幅提升
DeepSeek-V3.1 通過 Post-Training 優(yōu)化,大幅提升了工具使用和智能體任務(wù)的表現(xiàn):
編程智能體(SWE & Terminal Bench):在代碼修復(fù)(SWE)和命令行終端任務(wù)(Terminal Bench)中,表現(xiàn)優(yōu)于前代模型,所需輪數(shù)更少,效率更高!
搜索智能體(BrowseComp & HLE):在多步推理搜索(BrowseComp)和多學(xué)科專家級(jí)難題(HLE)測(cè)試中,性能大幅領(lǐng)先 DeepSeek-R1-0528,搜索能力更強(qiáng)!
3. 思考效率提升:更少 Token,相同表現(xiàn)
DeepSeek-V3.1 采用思維鏈壓縮訓(xùn)練,在輸出 Token 減少 20%-50% 的情況下,任務(wù)表現(xiàn)仍與 DeepSeek-R1-0528 持平,這意味著更快的響應(yīng)速度、更低的 API 調(diào)用成本。
4. API 全面升級(jí):128K上下文
DeepSeek API 已同步升級(jí),主要變化包括:
上下文擴(kuò)展至 128K,處理長(zhǎng)文檔更輕松!
新增 strict 模式 Function Calling,確保輸出的函數(shù)調(diào)用符合 Schema 定義。
支持 Anthropic API 格式,可輕松接入 Claude Code 框架!
5. 模型開源 & 價(jià)格調(diào)整
DeepSeek-V3.1 的 Base 模型和后訓(xùn)練模型已在 Hugging Face & 魔搭開源:
Base模型:
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后訓(xùn)練模型:
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
注意:DeepSeek-V3.1使用了 UE8M0 FP8 Scale 參數(shù)精度,分詞器和 chat template 也有較大調(diào)整,部署前請(qǐng)仔細(xì)閱讀文檔!
API價(jià)格調(diào)整:自 2025 年 9 月 6 日起,DeepSeek API 將執(zhí)行新版價(jià)格表,并取消 夜間時(shí)段優(yōu)惠。在此之前,仍按原價(jià)格計(jì)費(fèi),建議大家抓緊使用!
總結(jié)
DeepSeek-V3.1 帶來了更智能的混合推理、更高效的 Agent 能力、更強(qiáng)大的 API 支持,無論是開發(fā)者還是普通用戶,都能體驗(yàn)到更流暢、更智能的 AI 服務(wù)!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.