9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平臺(tái)發(fā)布并開源。
該版本作為邁向下一代架構(gòu)的重要中間步驟,在 V3.1-Terminus 的基礎(chǔ)上引入了團(tuán)隊(duì)自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力機(jī)制,旨在對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行探索性優(yōu)化與驗(yàn)證。這種架構(gòu)能夠降低計(jì)算資源消耗并提升模型推理效率。
目前,華為云已完成對(duì) DeepSeek-V3.2-Exp模型的適配工作,最大可支持160K長(zhǎng)序列上下文長(zhǎng)度。
隨著新模型服務(wù)成本的顯著降低,DeepSeek 同步采取了重磅舉措:大幅下調(diào)官方 API 價(jià)格,降價(jià)幅度超過 50%,新價(jià)格已即刻生效。目前,官方 App、網(wǎng)頁(yè)端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。
每日經(jīng)濟(jì)新聞綜合公開消息
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.