夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

再給老外億點(diǎn)點(diǎn)震撼?Kimi楊植麟:啥時(shí)發(fā)K3? 奧特曼的萬(wàn)億數(shù)據(jù)中心建成前

0
分享至

最近AI圈又炸了!月之暗面的Kimi K2 Thinking模型一經(jīng)發(fā)布,就讓海外開(kāi)發(fā)者社區(qū)徹底沸騰。

這款模型在Humanity's Last Exam、TAU-Bench等多項(xiàng)核心基準(zhǔn)測(cè)試中超越了OpenAI的GPT-5和Anthropic的Claude Sonnet 4.5,而API調(diào)用價(jià)格遠(yuǎn)低于兩者。

Hugging Face聯(lián)合創(chuàng)始人Thomas Wolf直接驚呼:"這是又一次DeepSeek式的輝煌時(shí)刻嗎?"


就在全球開(kāi)發(fā)者熱議之際,北京時(shí)間11月11日凌晨,當(dāng)國(guó)內(nèi)大部分人還在睡夢(mèng)中時(shí),月之暗面創(chuàng)始人楊植麟,以及聯(lián)合創(chuàng)始人周昕宇、吳育昕,在Reddit社群平臺(tái)進(jìn)行了一場(chǎng)長(zhǎng)達(dá)數(shù)小時(shí)的AMA(Ask Me Anything)問(wèn)答。


這也是三位聯(lián)創(chuàng)首次共同露面,面對(duì)海外開(kāi)發(fā)者的各種尖銳提問(wèn)。

問(wèn)答持續(xù)數(shù)小時(shí),從460萬(wàn)美元訓(xùn)練成本傳聞到K3何時(shí)發(fā)布,從開(kāi)源策略到行業(yè)競(jìng)爭(zhēng),從技術(shù)路徑到AGI時(shí)間表,楊植麟團(tuán)隊(duì)一口氣回答了數(shù)十個(gè)問(wèn)題。

460萬(wàn)美元傳聞不實(shí),真實(shí)成本難以量化

最受關(guān)注的問(wèn)題莫過(guò)于傳聞中的460萬(wàn)美元訓(xùn)練成本。面對(duì)這個(gè)讓整個(gè)硅谷都震驚的數(shù)字,楊植麟直接回應(yīng):

"這不是官方數(shù)據(jù)。由于訓(xùn)練成本中很大一部分是研究和實(shí)驗(yàn),所以很難量化具體數(shù)字。"


這一回應(yīng)打破了業(yè)界對(duì)K2 Thinking"超低成本"的猜測(cè)。盡管具體數(shù)字未公布,但從技術(shù)實(shí)現(xiàn)來(lái)看,該模型確實(shí)在成本控制上有所突破:

K2 Thinking采用1萬(wàn)億參數(shù)的混合專家架構(gòu),但每次推理僅激活320億參數(shù),并使用原生INT4量化技術(shù),將推理速度提升約2倍。

在硬件配置方面,楊植麟透露團(tuán)隊(duì)使用配備Infiniband的H800 GPU進(jìn)行訓(xùn)練。"雖然不如美國(guó)的高端GPU,我們?cè)跀?shù)量上也不占優(yōu)勢(shì),但我們把每張顯卡的性能都榨取得淋漓盡致。"


據(jù)悉,K2 Thinking的API調(diào)用價(jià)格為每百萬(wàn)token輸入1-4元,輸出16元,僅為GPT-5的四分之一,真正做到了性能與成本的完美平衡。

這種性價(jià)比優(yōu)勢(shì),正在吸引越來(lái)越多的企業(yè)用戶從閉源模型轉(zhuǎn)向開(kāi)源方案。

K2 Thinking過(guò)于“話癆”?專注Agent能力

面對(duì)眾多開(kāi)發(fā)者關(guān)于K2 Thinking"過(guò)于話嘮"的質(zhì)疑,團(tuán)隊(duì)給出了明確回應(yīng)。


楊植麟表示:"當(dāng)前版本中,我們更看重絕對(duì)性能而非token效率。后續(xù)會(huì)嘗試將效率納入獎(jiǎng)勵(lì)機(jī)制,讓模型學(xué)會(huì)壓縮思考過(guò)程。"


這種設(shè)計(jì)理念反映了月之暗面的技術(shù)取舍:為了確保復(fù)雜任務(wù)的完成質(zhì)量,可以適當(dāng)犧牲token效率。K2 Thinking能夠連續(xù)執(zhí)行200-300次工具調(diào)用來(lái)解決復(fù)雜問(wèn)題,在"思考-工具-思考-工具"的交替模式中保持穩(wěn)定性。

開(kāi)發(fā)過(guò)程中的最大挑戰(zhàn)

在技術(shù)實(shí)現(xiàn)上,團(tuán)隊(duì)采用端到端智能體強(qiáng)化學(xué)習(xí)訓(xùn)練方式,使模型在數(shù)百個(gè)步驟的工具調(diào)用以及包括檢索在內(nèi)的中間步驟中表現(xiàn)更佳。這種訓(xùn)練方式的核心是讓AI模仿人類解決問(wèn)題的過(guò)程,在反復(fù)迭代中逐步接近最優(yōu)解。

月之暗面聯(lián)合創(chuàng)始人吳育昕在回答中透露,支持交錯(cuò)的"思考-工具-思考-工具"模式是開(kāi)發(fā)過(guò)程中的主要挑戰(zhàn)之一,"這在LLM中是一種相對(duì)較新的行為,需要大量工作才能正確實(shí)現(xiàn)。"


K3什么時(shí)候發(fā)布?

當(dāng)有網(wǎng)友問(wèn)及K3的發(fā)布時(shí)間時(shí),楊植麟給出了一個(gè)頗具幽默感的回答:

"在Sam(山姆·奧特曼)的萬(wàn)億級(jí)數(shù)據(jù)中心建成之前。"


有人調(diào)侃:“所以,永遠(yuǎn)等不到了,反正他永遠(yuǎn)也搞不定那個(gè)爛尾工程?開(kāi)個(gè)玩笑啦~”

為什么先推純文本模型?

對(duì)于多模態(tài)能力的發(fā)展,楊植麟表示:"訓(xùn)練視覺(jué)語(yǔ)言模型需要時(shí)間獲取數(shù)據(jù)和調(diào)整訓(xùn)練,所以我們決定先發(fā)布一個(gè)文本模型。"


AGI有那個(gè)范兒了

在開(kāi)源動(dòng)機(jī)方面,楊植麟給出了頗具理想主義色彩的回答:"我們擁抱開(kāi)源,因?yàn)槲覀兿嘈臕GI應(yīng)該是一種導(dǎo)致團(tuán)結(jié)而不是分裂的追求。"


K2 Thinking采用Modified MIT許可證,在保留標(biāo)準(zhǔn)MIT許可證大部分自由的基礎(chǔ)上,添加了一項(xiàng)關(guān)鍵限制:當(dāng)模型被用于超過(guò)一億月活用戶或2000萬(wàn)美元月收入的商業(yè)產(chǎn)品時(shí),需要注明使用了Kimi K2模型。

當(dāng)被問(wèn)及AGI時(shí)間線時(shí),楊植麟給出了相對(duì)謹(jǐn)慎的回答:"AGI這件事很難定義,但大家已經(jīng)能感覺(jué)到那個(gè)范兒了,未來(lái)會(huì)有更多更強(qiáng)大的模型。"


是否會(huì)發(fā)布更大規(guī)模閉源模型?

對(duì)于是否會(huì)發(fā)布更大規(guī)模閉源模型的問(wèn)題,楊植麟給出了一個(gè)耐人尋味的回答:"如果它變得太危險(xiǎn)的話:)"


這既暗示了對(duì)模型安全性的考慮,也為未來(lái)的商業(yè)化策略留下了想象空間。

當(dāng)前,K2 Thinking在發(fā)布后不到48小時(shí)內(nèi)下載量已超過(guò)5萬(wàn),成為Hugging Face最熱門的開(kāi)源模型。

與DeepSeek的技術(shù)路徑分歧:OCR和KDA

面對(duì)不同技術(shù)路線的選擇,月之暗面團(tuán)隊(duì)展現(xiàn)出了明確的技術(shù)偏好。對(duì)于DeepSeek近期備受關(guān)注的OCR路線,周昕宇表達(dá)了不同看法:

"我個(gè)人覺(jué)得這條路走得有點(diǎn)重了,我更傾向于繼續(xù)在特征空間里下功夫,去找到更通用、并且與具體模態(tài)無(wú)關(guān)的方法,來(lái)提升模型效率。"

在未來(lái)發(fā)展方向上,團(tuán)隊(duì)透露KDA是他們最新的實(shí)驗(yàn)性架構(gòu),相關(guān)理念很可能會(huì)應(yīng)用于K3中。KDA采用3:1的比例將KDA和MLA路線混合,在傳統(tǒng)Transformer基礎(chǔ)上讓模型學(xué)會(huì)"抓重點(diǎn)信息",在性能、速度、顯存占用方面實(shí)現(xiàn)優(yōu)化。


楊植麟表示,團(tuán)隊(duì)已內(nèi)部試驗(yàn)Kimi Linear新結(jié)構(gòu)(架構(gòu)的核心是KDA,一種表達(dá)能力更強(qiáng)的線性注意力模塊),初步結(jié)果看起來(lái)有前景,并可進(jìn)一步與稀疏化技術(shù)組合。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
若中日再次爆發(fā)戰(zhàn)爭(zhēng),結(jié)局會(huì)如何?俄羅斯和美國(guó)看法一致?

若中日再次爆發(fā)戰(zhàn)爭(zhēng),結(jié)局會(huì)如何?俄羅斯和美國(guó)看法一致?

尋途
2025-11-04 21:16:03
高市早苗徹底呆住了,解放軍還沒(méi)動(dòng)手,日本掀起內(nèi)訌了。

高市早苗徹底呆住了,解放軍還沒(méi)動(dòng)手,日本掀起內(nèi)訌了。

荊楚寰宇文樞
2025-11-13 21:53:10
沈伯洋跑到德國(guó),叫囂“永不退縮”,話音剛落,大陸已經(jīng)重拳出擊

沈伯洋跑到德國(guó),叫囂“永不退縮”,話音剛落,大陸已經(jīng)重拳出擊

起喜電影
2025-11-13 14:28:39
剛剛!阿里,突發(fā)!直線爆拉!

剛剛!阿里,突發(fā)!直線爆拉!

中國(guó)基金報(bào)
2025-11-13 16:04:05
"沒(méi)人脈我不信"!太子集團(tuán)6年檢舉52次沒(méi)人查

"沒(méi)人脈我不信"!太子集團(tuán)6年檢舉52次沒(méi)人查

看看新聞Knews
2025-11-13 20:28:11
記者直擊張家界七星山荒野求生選手“刀疤哥”制作鉆木取火工具,他稱每天吃30多個(gè)野生獼猴桃,將堅(jiān)持到底

記者直擊張家界七星山荒野求生選手“刀疤哥”制作鉆木取火工具,他稱每天吃30多個(gè)野生獼猴桃,將堅(jiān)持到底

極目新聞
2025-11-13 18:05:15
雙十一沒(méi)落了?23年銷售額1.13萬(wàn)億,24年1.44萬(wàn)億,25年讓人驚訝

雙十一沒(méi)落了?23年銷售額1.13萬(wàn)億,24年1.44萬(wàn)億,25年讓人驚訝

探源歷史
2025-11-13 18:22:20
震驚!北大研究發(fā)現(xiàn),男性每增加一個(gè)親生子女,死亡風(fēng)險(xiǎn)降低4%

震驚!北大研究發(fā)現(xiàn),男性每增加一個(gè)親生子女,死亡風(fēng)險(xiǎn)降低4%

火山詩(shī)話
2025-11-13 11:37:14
山東建行“取款報(bào)警”事件,央視出手了!

山東建行“取款報(bào)警”事件,央視出手了!

鳴金網(wǎng)
2025-11-13 11:24:28
全運(yùn)會(huì)男子50米蛙泳:覃海洋犯規(guī)成績(jī)被取消,鄭英昊脫穎而出摘金

全運(yùn)會(huì)男子50米蛙泳:覃海洋犯規(guī)成績(jī)被取消,鄭英昊脫穎而出摘金

全景體育V
2025-11-13 20:07:30
歌手“阿珍”胸腔意外受電動(dòng)座椅架擠壓,搶救10余小時(shí)不幸去世,所在樂(lè)隊(duì)來(lái)自大連

歌手“阿珍”胸腔意外受電動(dòng)座椅架擠壓,搶救10余小時(shí)不幸去世,所在樂(lè)隊(duì)來(lái)自大連

極目新聞
2025-11-13 19:27:21
木村拓哉全家福罕見(jiàn)曝光,和工藤靜香結(jié)婚25年,終于被日本人認(rèn)可

木村拓哉全家福罕見(jiàn)曝光,和工藤靜香結(jié)婚25年,終于被日本人認(rèn)可

譯言
2025-11-13 10:55:28
廊坊7397萬(wàn)體彩巨獎(jiǎng)得主買彩票時(shí)衣著怪異戴墨鏡口罩?疑當(dāng)事人發(fā)聲,河北體彩回應(yīng)

廊坊7397萬(wàn)體彩巨獎(jiǎng)得主買彩票時(shí)衣著怪異戴墨鏡口罩?疑當(dāng)事人發(fā)聲,河北體彩回應(yīng)

瀟湘晨報(bào)
2025-11-13 13:59:58
1000多萬(wàn)枚未兌換出去,多地延遲兌換時(shí)間,80周年紀(jì)念幣何去何從

1000多萬(wàn)枚未兌換出去,多地延遲兌換時(shí)間,80周年紀(jì)念幣何去何從

方寸年華
2025-11-13 08:00:17
淚目!34歲國(guó)乒美女奧運(yùn)冠軍4-3逆轉(zhuǎn)進(jìn)決賽:又美又能打沖兩連冠

淚目!34歲國(guó)乒美女奧運(yùn)冠軍4-3逆轉(zhuǎn)進(jìn)決賽:又美又能打沖兩連冠

李喜林籃球絕殺
2025-11-13 11:49:14
保時(shí)捷又現(xiàn)神回復(fù),友商:學(xué)不完,根本學(xué)不完!

保時(shí)捷又現(xiàn)神回復(fù),友商:學(xué)不完,根本學(xué)不完!

LOGO研究所
2025-11-13 20:36:23
重大利好出現(xiàn),A股終于如期大漲!

重大利好出現(xiàn),A股終于如期大漲!

君臨財(cái)富
2025-11-13 16:12:46
外交部副部長(zhǎng)孫衛(wèi)東就日本首相高市早苗涉華錯(cuò)誤言行提出嚴(yán)正交涉

外交部副部長(zhǎng)孫衛(wèi)東就日本首相高市早苗涉華錯(cuò)誤言行提出嚴(yán)正交涉

澎湃新聞
2025-11-14 03:24:03
緬北KK園區(qū)頭目佘智江被押解回國(guó):登機(jī)前微笑,下機(jī)時(shí)腿軟

緬北KK園區(qū)頭目佘智江被押解回國(guó):登機(jī)前微笑,下機(jī)時(shí)腿軟

極目新聞
2025-11-13 19:58:52
狗主人被反殺妻子后悔闖入對(duì)方家中?果然是打不過(guò)才愛(ài)和平

狗主人被反殺妻子后悔闖入對(duì)方家中?果然是打不過(guò)才愛(ài)和平

姬鵬
2025-11-13 17:09:41
2025-11-14 06:56:49
華爾街見(jiàn)聞官方 incentive-icons
華爾街見(jiàn)聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
137498文章數(shù) 2651428關(guān)注度
往期回顧 全部

科技要聞

月產(chǎn)能突破百萬(wàn)片,中芯國(guó)際Q3凈利增43.1%

頭條要聞

外交部召見(jiàn)日本駐華大使:高市涉臺(tái)言論極為危險(xiǎn)

頭條要聞

外交部召見(jiàn)日本駐華大使:高市涉臺(tái)言論極為危險(xiǎn)

體育要聞

跟豪門傳了十年緋聞,他卻偏要“擇一隊(duì)終老”

娛樂(lè)要聞

王鶴棣孟子義真要搭?

財(cái)經(jīng)要聞

源峰25億賭局!漢堡王中國(guó)"賣身"求生

汽車要聞

具備高階輔助駕駛功能 歐拉5預(yù)售價(jià)10.98萬(wàn)起

態(tài)度原創(chuàng)

本地
時(shí)尚
手機(jī)
教育
公開(kāi)課

本地新聞

云游安徽 | 江聲浩蕩閱千年,文脈相承看蕪湖

被掃地出門的貴公子,真是活該

手機(jī)要聞

vivo X300 Ultra:核心配置曝光!vivo中端:超大電池正在試模!

教育要聞

2025年核心政策法規(guī)一句話案例整理。

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国内精品伊人久久久妇| 欧美成人精品一区二区综合| 一本一本久久a久久综合精品| 国产乱伦视频污| 成人国产果冻传媒无码视频| 欧美性猛交xxxx乱大交丰满| 正在播放的国产A一片| 97人妻人人操| 东北熟女久久久久久| 国产在线拍揄自揄视频菠萝| 久久久久久无码视频| 色咪咪肉伦AV| 精品少妇VA区一区二| 国产美女在线观看大长腿| 国产无玛精品一区二区| av毛片无码不卡| 亚洲欧美综合一区二区三区| 日韩精品视频一二三四区| 欧美白浆在线观看| 色先锋资源久久综合5566| 日韩午夜午码高清福利片| 欧美熟妇丰满乱XXZZXXZZ| 簧片在线免费看| 国产初高中生真实在线视频| 亚洲高清国产自产拍av| 久久伊人老熟女| caoprom人人操人人操人人| 亚洲国产精品一区二区制服| 男女性爽大片在线观看| 亚洲综合无码无在线观看| 精品人妻无码一区二| 中文字幕久久精品波多野结| 欧美超碰在线播放| 精品无码68区| 黑人操逼电影| 天堂V亚洲国产V第一次| 一区二区三区四区免费视频| 国产激情大臿免费视频| 国产色欲精品一区| 色悠久久久| 富婆熟女一区二区三区中文字幕|