始智AI wisemodel.cn社區(qū)是源自中國(guó)的中立開(kāi)放的AI開(kāi)源社區(qū)。正在,歡迎加入共同成長(zhǎng)。A800/H20等算力6.25元/卡時(shí),支持在線微調(diào)訓(xùn)練,及線部署和。
Kimi K2 是由月之暗面最新開(kāi)源的一款具備更強(qiáng)代碼能力、更擅長(zhǎng)通用 Agent 任務(wù)的MoE架構(gòu)的基礎(chǔ)模型,總參數(shù) 1T,激活參數(shù) 32B ,支持 128K 最大上下文長(zhǎng)度 。在 SWE Bench Verified、Tau2、AceBench 等基準(zhǔn)性能測(cè)試中,Kimi K2 均取得開(kāi)源模型中的SOTA 成績(jī),展現(xiàn)出在代碼、Agent、數(shù)學(xué)推理任務(wù)上的領(lǐng)先能力。
wisemodel聯(lián)合賴耶AI,在模型市場(chǎng)上線了Kimi-K2-Instruct模型,價(jià)格為輸入4元/M Tokens,輸出為16元/ M Tokens。首次完成授權(quán)開(kāi)通模型市場(chǎng)的用戶,,完成,目前平臺(tái)也提供5折資源包,所有資源包均同時(shí)支持K2、R1、Qwen3等調(diào)用,歡迎需要大模型API服務(wù)的朋友前往wisemodel模型市場(chǎng)使用。
Kimi-K2-Instruct模型介紹:
https://wisemodel.cn/AImarket/modelmarket/91kk5hsaks1drwq01k0tdxc8q
Kimi-K2-Instruct模型API文檔:
https://wisemodel.cn/AImarket/modelmarket/91kk5hsaks1drwq01k0tdxc8q/apidoc
Kimi-K2-Instruct模型API地址:
https://laiyeapi.aifoundrys.com:7443/v1/chat/completions
01.
Kimi-K2模型評(píng)測(cè)結(jié)果
Kimi K2在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調(diào)用)這三項(xiàng)基準(zhǔn)測(cè)試中是開(kāi)源模型表現(xiàn)達(dá)到SOTA水準(zhǔn)。在自主編程(Agentic Coding)、工具調(diào)用(Tool Use)和數(shù)學(xué)推理(Math & Reasoning)這三個(gè)能力維度上,Kimi K2也緊逼Claude 4 Opus、OpenAI GPT-4.1等閉源模型。
智能體與工具使用:在評(píng)估多輪復(fù)雜工具調(diào)用的 Tau2-Bench 和 ACEBench 上,分別取得了 66.1 和 76.5 的高分,大幅領(lǐng)先所有對(duì)手。
軟件工程與代碼能力:在被譽(yù)為“代碼界珠峰”的 SWE-Bench Verified 上,Kimi K2取得了驚人的 65.8分,在多語(yǔ)言版的 SWE-Bench Multilingual 上也達(dá)到了 47.3分,顯著縮小了與最強(qiáng)閉源模型 Claude 4 Opus 的差距。
數(shù)學(xué)與推理:在 AIME 2025 (49.5分) 和 GPQA-Diamond (75.1分) 等高難度推理任務(wù)上,Kimi K2同樣展現(xiàn)了頂級(jí)的實(shí)力。
用戶口碑:在LMSYS Arena這個(gè)由全球用戶盲評(píng)的“模型武道場(chǎng)”上(截至2025年7月17日數(shù)據(jù)),Kimi K2憑借超過(guò)3000次的用戶投票,高居開(kāi)源模型榜首,總排名第五。
02.
Kimi-K2模型核心技術(shù)
1、MuonClip:為萬(wàn)億模型訓(xùn)練保駕護(hù)航
Kimi團(tuán)隊(duì)提出了全新優(yōu)化器MuonClip,巧妙地結(jié)合了高Token效率的Muon算法與QK-Clip 的穩(wěn)定性增強(qiáng)技術(shù),成功解決了Muon算法在超大規(guī)模訓(xùn)練中容易出現(xiàn)的不穩(wěn)定問(wèn)題。基于此,Kimi K2在15.5萬(wàn)億Tokens的龐大預(yù)訓(xùn)練過(guò)程中,實(shí)現(xiàn)了零損失尖峰的完美訓(xùn)練曲線,堪稱工程奇跡。
最終,在MuonClip的保駕護(hù)航下,Kimi K2的整個(gè)預(yù)訓(xùn)練過(guò)程如絲般順滑,下圖是其未經(jīng)任何平滑處理的原始訓(xùn)練損失曲線,沒(méi)有任何一次損失尖峰。
2、大規(guī)模智能體數(shù)據(jù)合成流水線:在模擬世界中學(xué)會(huì)使用工具
為了教會(huì)模型如何使用工具,Kimi團(tuán)隊(duì)構(gòu)建了一個(gè)可以大規(guī)模生成高質(zhì)量訓(xùn)練數(shù)據(jù)的系統(tǒng),能夠模擬真實(shí)世界環(huán)境,系統(tǒng)性地生成海量、多樣化且高質(zhì)量的工具使用軌跡數(shù)據(jù)。這個(gè)數(shù)據(jù)合成流水線有幾個(gè)關(guān)鍵特點(diǎn):
1)海量多樣的工具庫(kù):Kimi團(tuán)隊(duì)收集了超過(guò)3000個(gè)來(lái)自GitHub的真實(shí)工具(MCP),并利用“領(lǐng)域進(jìn)化”技術(shù)合成了超過(guò)20000個(gè)覆蓋金融、軟件、機(jī)器人等領(lǐng)域的虛擬工具。
2)多樣化的智能體和任務(wù):通過(guò)為智能體設(shè)定不同的“人設(shè)”(系統(tǒng)提示)和分配不同的工具組合,生成了數(shù)千個(gè)能力各異的智能體。同時(shí),為每個(gè)智能體生成了從簡(jiǎn)單到復(fù)雜的任務(wù),并配有明確的成功標(biāo)準(zhǔn)(Rubric)。
3)高度仿真的軌跡生成:流水線中包含了用戶模擬器(模擬真實(shí)用戶的多輪對(duì)話)、工具執(zhí)行環(huán)境(模擬工具調(diào)用的真實(shí)反饋,包括成功、失敗和各種意外情況),以及一個(gè)LLM裁判(根據(jù)任務(wù)標(biāo)準(zhǔn)評(píng)估軌跡質(zhì)量)。
4)真實(shí)與模擬的混合:對(duì)于代碼和軟件工程這類對(duì)真實(shí)性要求極高的任務(wù),團(tuán)隊(duì)將模擬環(huán)境與真實(shí)的執(zhí)行沙箱相結(jié)合。代碼在真實(shí)的開(kāi)發(fā)環(huán)境中運(yùn)行,用單元測(cè)試通過(guò)率等客觀指標(biāo)來(lái)提供反饋。
通過(guò)這個(gè)強(qiáng)大的混合數(shù)據(jù)生成流水線,Kimi K2在SFT階段就學(xué)習(xí)到了扎實(shí)的、可泛化的工具使用能力。
3、聯(lián)合強(qiáng)化學(xué)習(xí):在自我博弈中實(shí)現(xiàn)能力提升
Kimi K2的后訓(xùn)練采用了聯(lián)合強(qiáng)化學(xué)習(xí)(RL)框架,不僅能從有明確答案的任務(wù)(如代碼編譯、數(shù)學(xué)計(jì)算)中學(xué)習(xí),還能通過(guò)自我批判機(jī)制來(lái)評(píng)估和改進(jìn)自己在開(kāi)放式、主觀性任務(wù)(如創(chuàng)意寫(xiě)作)上的表現(xiàn),實(shí)現(xiàn)了模型能力的全面對(duì)齊與提升。
1)可驗(yàn)證獎(jiǎng)勵(lì)任務(wù)(RLVR)
對(duì)于有明確對(duì)錯(cuò)之分的任務(wù),Kimi K2通過(guò)如下的方法進(jìn)行訓(xùn)練:
數(shù)學(xué)、STEM和邏輯題:海量的數(shù)理競(jìng)賽題、邏輯謎題(數(shù)獨(dú)、密碼破譯等),模型給出答案后,系統(tǒng)能自動(dòng)判斷對(duì)錯(cuò)并給予獎(jiǎng)勵(lì)。
復(fù)雜指令遵循:各種帶有復(fù)雜約束條件的任務(wù)(比如“寫(xiě)一首五言絕句,其中必須包含‘月’和‘霜’,且不能出現(xiàn)‘悲傷’”),系統(tǒng)能自動(dòng)檢查模型是否滿足所有約束。
代碼與軟件工程:在包含真實(shí)GitHub問(wèn)題的軟件開(kāi)發(fā)環(huán)境中,模型生成的代碼可以直接在沙箱中運(yùn)行單元測(cè)試,通過(guò)率就是最直接的獎(jiǎng)勵(lì)信號(hào)。
安全性:通過(guò)一個(gè)自動(dòng)化的攻擊流水線,不斷生成各種“越獄”提示詞來(lái)攻擊模型,模型如果能守住安全底線,就會(huì)得到獎(jiǎng)勵(lì)。
2)自我批判獎(jiǎng)勵(lì)任務(wù)
對(duì)于沒(méi)有標(biāo)準(zhǔn)答案的主觀任務(wù)(如創(chuàng)意寫(xiě)作、開(kāi)放式問(wèn)答),Kimi K2采用自批判獎(jiǎng)勵(lì)機(jī)制 (Self-Critique Rubric Reward):
K2演員生成答案:對(duì)于一個(gè)開(kāi)放式問(wèn)題,K2模型(作為“演員”)會(huì)生成多個(gè)不同的回答。
K2評(píng)委進(jìn)行打分:K2模型(此時(shí)切換為“評(píng)委”角色)會(huì)根據(jù)一套內(nèi)置的、復(fù)雜的評(píng)分標(biāo)準(zhǔn)(Rubric),對(duì)這些回答進(jìn)行兩兩比較,選出更好的一個(gè)。
反饋給演員進(jìn)行優(yōu)化:被評(píng)委選出的“更優(yōu)答案”會(huì)作為正向信號(hào),用來(lái)優(yōu)化“演員”模型。
通過(guò)將這兩類任務(wù)結(jié)合,并輔以預(yù)算控制(防止模型啰嗦)、PTX損失(防止遺忘高質(zhì)量SFT數(shù)據(jù))、溫度衰減(從探索到利用的平滑過(guò)渡)等多種RL技巧,Kimi K2在保持開(kāi)放域能力的同時(shí),也極大地增強(qiáng)了在復(fù)雜、專業(yè)領(lǐng)域的解決問(wèn)題的能力。
03.
超高性價(jià)比K2模型API
賴耶AI作為Wisemodel首家入駐模型模型的API供應(yīng)商,通過(guò)優(yōu)化底層架構(gòu)和資源調(diào)度,確保了優(yōu)質(zhì)開(kāi)源模型的推理速度和響應(yīng)時(shí)間達(dá)到行業(yè)領(lǐng)先水平,為平臺(tái)用戶提供極致的性能體驗(yàn)。
:開(kāi)發(fā)者在wisemodel平臺(tái)是完成對(duì)賴耶AI的授權(quán),即刻免費(fèi)獲得20元資源包(截止7月31日)
開(kāi)發(fā)者在wisemodel平臺(tái)上完成企業(yè)實(shí)名認(rèn)證,即可獲得100元購(gòu)買(mǎi)價(jià)值1000元的資源包,限購(gòu)1次,限量100份,先到先得。
更多長(zhǎng)期優(yōu)惠資源包任選,低至市價(jià)5折:
長(zhǎng)期資源包支持按需選購(gòu),每月限購(gòu)1次,長(zhǎng)期使用性價(jià)比更高,適合有持續(xù)需求的用戶。
歡迎掃碼入群
----- END -----
wisemodel相關(guān):
系統(tǒng)升級(jí):
系列模型:
關(guān)于wisemodel更多
1
歡迎持續(xù)關(guān)注和支持
開(kāi)源社區(qū)建設(shè)需要長(zhǎng)期堅(jiān)持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開(kāi)源社區(qū)的志愿者計(jì)劃和開(kāi)源共創(chuàng)計(jì)劃。期待更多開(kāi)發(fā)者將開(kāi)源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開(kāi)放的AI開(kāi)源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請(qǐng)加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開(kāi)源社區(qū)動(dòng)態(tài)。
2
歡迎加盟wisemodel開(kāi)源社區(qū)
始智AI wisemodel社區(qū)自2023年9月上線以來(lái),逐漸成為影響力日益擴(kuò)大的中立開(kāi)放的AI開(kāi)源社區(qū),為了加快公司發(fā)展,我們長(zhǎng)期需要技術(shù)、運(yùn)營(yíng)等人才加盟,技術(shù)側(cè)重在AI infra、后端開(kāi)發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開(kāi)發(fā)者生態(tài)運(yùn)營(yíng)的成員,歡迎感興趣的朋友加盟,可以通過(guò)添加wisemodel微信,或者將簡(jiǎn)歷投遞到郵箱:liudaoquan@wisemodel.cn
3
歡迎投稿優(yōu)質(zhì)內(nèi)容
歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵(lì)高校實(shí)驗(yàn)室、大企業(yè)研究團(tuán)隊(duì)、個(gè)人等,在wisemodel平臺(tái)上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開(kāi)源成果介紹,也可以是關(guān)于AI技術(shù)實(shí)踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關(guān)于wisemodel開(kāi)源社區(qū)
始智AI wisemodel.cn開(kāi)源社區(qū)由清華校友總會(huì)AI大數(shù)據(jù)專委會(huì)副秘書(shū)長(zhǎng)劉道全創(chuàng)立,旨在打造和建設(shè)中立開(kāi)放的AI開(kāi)源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開(kāi)源社區(qū),匯聚主要AI開(kāi)源模型、數(shù)據(jù)集和代碼等,歡迎高??蒲性核⒋笮突ヂ?lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個(gè)人開(kāi)發(fā)者,以及政府部門(mén)、學(xué)會(huì)協(xié)會(huì)、聯(lián)盟、基金會(huì)等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開(kāi)源創(chuàng)新生態(tài)。
向上滑動(dòng)查看
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.