智東西
作者 李水青
編輯 漠影
智東西9月29日報道,剛剛,DeepSeek正式發(fā)布DeepSeek-V3.2-Exp模型,官方App、網(wǎng)頁端、小程序均已同步更新為該版本,同時API大幅度降價。
▲DeepSeek-V3.2-Exp的Hugging Face頁面截圖
DeepSeek-V3.2-Exp的一大亮點是價格暴降。在新的價格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。
據(jù)悉,DeepSeek-V3.2-Exp API的輸入價格由0.5元/百萬tokens降低為0.2元/百萬tokens(緩存命中),由4元/百萬tokens降低為2元/百萬tokens(緩存未命中),輸出價格由12元/百萬tokens降低為3元/百萬tokens。
▲DeepSeek-V3.2-Exp的全新價格政策
這得益于新模型服務成本的大幅降低。V3.2-Exp是一個實驗性(Experimental)的版本,作為邁向新一代架構的中間步驟,在V3.1-Terminus的基礎上引入了一種稀疏注意力機制(DeepSeek Sparse Attention,DSA),針對長文本的訓練和推理效率進行了探索性的優(yōu)化和驗證。
據(jù)悉,DSA首次實現(xiàn)了細粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,實現(xiàn)了長文本訓練和推理效率的大幅提升。
▲DeepSeek-V3.2-Exp相比V3.1-Terminus效率提升
為了嚴謹?shù)卦u估引入稀疏注意力帶來的影響,DeepSeek特意把DeepSeek-V3.2-Exp的訓練設置與V3.1-Terminus進行了嚴格的對齊。在各領域的公開評測集上,DeepSeek-V3.2-Exp的表現(xiàn)與V3.1-Terminus基本持平。
▲DeepSeek-V3.2-Exp與V3.1-Terminus測評表現(xiàn)對比
DeepSeek-V3.2-Exp一經(jīng)發(fā)布,就在外網(wǎng)社交平臺X等炸開了鍋。有網(wǎng)友對“成本降低50%”表示贊嘆,也有網(wǎng)友對DeepSeek“周更”的節(jié)奏表示滿意,還有更多網(wǎng)友催更DeepSeek新一代模型R2及V4,并期待DeepSeek打敗OpenAI。
▲社交平臺X網(wǎng)友熱議DeepSeek-V3.2-Exp
國產(chǎn)AI芯片公司紛紛第一時間宣布完成DeepSeek-V3.2-Exp的適配。
華為發(fā)文宣布,昇騰已快速基于vLLM/SGLang等推理框架完成適配部署,實現(xiàn)DeepSeek-V3.2-Exp 0day支持,并面向開發(fā)者開源所有推理代碼和算子實現(xiàn)。其在128K長序列下能夠保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。
▲華為計算官方公眾號發(fā)文
寒武紀也發(fā)文宣布,其已同步實現(xiàn)對深度求索公司最新模型DeepSeek-V3.2-Exp的0day適配,并開源大模型推理引擎vLLM-MLU源代碼。DeepSeek-V3.2-Exp疊加寒武紀的極致計算效率,可大幅降低長序列場景下的訓推成本。
▲寒武紀開發(fā)者公眾號發(fā)文
作為一個實驗性的版本,DeepSeek-V3.2-Exp雖然已經(jīng)在公開評測集上得到了有效性驗證,但仍然需要在用戶的真實使用場景中進行范圍更廣、規(guī)模更大的測試,以排除在某些場景下效果欠佳的可能。
為方便用戶進行對比測試,DeepSeek-V3.1-Terminus臨時保留了額外API訪問接口,保留到北京時間2025年10月15日23:59。
用戶只需修改base_url=”https://api.deepseek.com/v3.1_terminus_expires_on_20251015″ 即可訪問V3.1-Terminus,調(diào)用價格與 V3.2-Exp相同。
DeepSeek-V3.2-Exp模型現(xiàn)已在Hugging Face與魔搭開源。
HuggingFace地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope地址:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
論文地址:
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
結(jié)語:DeepSeek再降大模型落地門檻,國產(chǎn)芯片加速適配
DeepSeek的模型迭代速度正在加快。就在9月22日晚間,其剛剛發(fā)布了DeepSeek-V3.1-Terminus,優(yōu)化了編程、搜索智能體等表現(xiàn)。僅僅一周后,DeepSeek-V3.2-Exp隨之發(fā)布,帶來了大幅降低的成本體驗。
這預示著DeepSeek的下一代模型很快就要到來了,此前已有外媒報道稱,DeepSeek今年年底即將推出Agent模型。值得一提的是,我們看到DeepSeek不僅上線阿里魔搭社區(qū),并立馬適配華為昇騰、寒武紀等國產(chǎn)AI芯片,或許意味著其快速迭代及落地應用與國產(chǎn)AI芯片聯(lián)系更加緊密。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.