夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

1 億美金砍到 50 萬(wàn)!這家中國(guó)公司讓訓(xùn)練成本暴跌 200 倍,算力公司要破產(chǎn)了

0
分享至


還記得半年前 DeepSeek 橫空出世時(shí)的震撼嗎?那個(gè)用不到 OpenAI 1/20 的成本就訓(xùn)練出頂級(jí)模型的"神話",不僅讓整個(gè)硅谷為之側(cè)目,更是給國(guó)內(nèi)的 AI 創(chuàng)業(yè)公司上了生動(dòng)的一課——原來(lái),大模型可以這樣玩。

DeepSeek 沖擊波下的轉(zhuǎn)型之路

對(duì)于被稱為"AI 六小龍"的 MINIMAX 來(lái)說(shuō),DeepSeek 的出現(xiàn)無(wú)異于一記當(dāng)頭棒喝。過(guò)去的劇本突然就講不下去了:瘋狂燒錢買算力,追著 OpenAI 的腳步跑,今天發(fā)個(gè)大模型,明天搞個(gè)視頻生成...看起來(lái)很忙,但總感覺在原地打轉(zhuǎn)。

投資人開始問(wèn):"既然 DeepSeek 能用這么少的錢做出這么好的效果,你們之前燒的那些錢都去哪了?"用戶開始問(wèn):"既然有免費(fèi)的 DeepSeek,我為什么還要付費(fèi)用你們的 API?"

但 MINIMAX 的反應(yīng)出人意料地迅速和果斷。他們沒(méi)有選擇繼續(xù)講老故事,而是徹底換了劇本:從追逐熱點(diǎn)轉(zhuǎn)向硬核技術(shù)突破,從商業(yè)化優(yōu)先轉(zhuǎn)向開源優(yōu)先,從模仿 OpenAI 轉(zhuǎn)向?qū)?biāo) DeepSeek。

實(shí)際上,MiniMax 在今年 1 月份就推出了開源模型 Minimax-01,其中包括語(yǔ)言模型和視覺模型,但似乎反向平平。

半年的蟄伏與沉淀后,他們暫停了所有非核心項(xiàng)目,把最優(yōu)秀的工程師都調(diào)到了一個(gè)神秘的項(xiàng)目上。

MiniMax-M1:半年磨一劍的技術(shù)突破

昨天,MINIMAX 終于交出了答卷——MiniMax-M1,他們宣稱這是世界上第一個(gè)開源的大規(guī)?;旌霞軜?gòu)的推理模型。這不是一個(gè)匆忙的應(yīng)景之作,而是一次深思熟慮的技術(shù)革新。


突破一:Lightning Attention - 超長(zhǎng)文本處理

M1 原生支持100 萬(wàn)字符的超長(zhǎng)文本處理,處理 10 萬(wàn)字文本時(shí)只需要其他模型 25% 的計(jì)算資源。這意味著可以一次性分析整本小說(shuō)或研究報(bào)告,而不需要拆分處理。

? 突破二:CISPO 算法 - 更聰明的學(xué)習(xí)方式

傳統(tǒng)訓(xùn)練方法會(huì)忽略"不尋常"的學(xué)習(xí)過(guò)程,但 CISPO 算法不再丟棄任何"思考片段",充分利用每個(gè)思維火花。實(shí)驗(yàn)顯示,這種方法比傳統(tǒng)方法快 2 倍,效果還更好。

突破三:超低成本訓(xùn)練

僅用 53.74 萬(wàn)美元就完成了整個(gè)強(qiáng)化訓(xùn)練,相比 GPT-4 超過(guò) 1 億美元的成本,M1 幾乎是同等能力模型中最便宜的。這不是簡(jiǎn)單的"省錢",而是技術(shù)效率的革命性提升。

需要說(shuō)明的是,53.74 萬(wàn)美元并非模型的全部訓(xùn)練成本,而僅僅是強(qiáng)化學(xué)習(xí)階段的費(fèi)用。MINIMAX 表示他們僅用 512 塊 H800 GPU 訓(xùn)練了三周就完成了這一階段,這一效率比行業(yè)預(yù)期至少提升了一個(gè)數(shù)量級(jí)。

不過(guò),與 DeepSeek 不同的是,MINIMAX 并未公布模型從預(yù)訓(xùn)練到最終完成的完整訓(xùn)練成本(不包括實(shí)驗(yàn)費(fèi)用)。因此,53.74 萬(wàn)美元這個(gè)數(shù)字雖然令人印象深刻,但可能只是冰山一角。

實(shí)戰(zhàn)表現(xiàn):數(shù)據(jù)說(shuō)話的硬實(shí)力

經(jīng)過(guò)半年的技術(shù)沉淀,MiniMax-M1 在各個(gè)關(guān)鍵領(lǐng)域的表現(xiàn)如何?我們用一張完整的對(duì)比表來(lái)看看它與頂級(jí)模型的真實(shí)差距:


雖然 M1 把訓(xùn)練成本又下調(diào)了一個(gè)數(shù)量級(jí),但在常見的指標(biāo)測(cè)試中,這個(gè)模型并無(wú)一項(xiàng)能到最優(yōu)。比較亮眼的是長(zhǎng)文本能力,在 MRCR(128K) 測(cè)試中得分 73.4,僅次于 Gemini 2.5 Pro 的 76.8,在 LongBench-v2 中更是達(dá)到 61.5 的第二名成績(jī),可見 Lightning Attention 確實(shí)非常有效。

值得一提的是,M1 有兩項(xiàng)指標(biāo)超越了 DeepSeek R1,即數(shù)學(xué)方面的 AIME 2025(76.9 vs 70.0)以及編程能力方面的 LiveCodeBench(65.0 vs 55.9)。這表明 MINIMAX 在核心技術(shù)突破上確實(shí)有所建樹。

盡管綜合來(lái)看,這些指標(biāo)并不算最亮眼,但作為第一款開源模型,在成本控制以及長(zhǎng)文本處理方面有這么突出的創(chuàng)新,已經(jīng)非常難能可貴了。

從跟隨者到引領(lǐng)者的華麗轉(zhuǎn)身

MINIMAX 的轉(zhuǎn)型反映了 AI 行業(yè)的變化趨勢(shì)。從追逐商業(yè)化到選擇開源路線,從高成本訓(xùn)練到技術(shù)效率優(yōu)化,這種策略調(diào)整與當(dāng)前行業(yè)對(duì)成本控制和技術(shù)創(chuàng)新的重視相符。

開源模式正在 AI 領(lǐng)域獲得更多關(guān)注。DeepSeek 的成功為行業(yè)提供了新的發(fā)展思路,而 MiniMax-M1 的發(fā)布進(jìn)一步驗(yàn)證了這一方向的可行性。隨著更多公司選擇開源策略,行業(yè)競(jìng)爭(zhēng)重心可能會(huì)從資本投入轉(zhuǎn)向技術(shù)創(chuàng)新。

從追逐者到開拓者,MINIMAX 用半年時(shí)間完成了一次完美的轉(zhuǎn)身。這一轉(zhuǎn)變表明"AI 六小龍"已經(jīng)開始探索新的發(fā)展路徑。

算力泡沫破滅:一場(chǎng)正在發(fā)生的行業(yè)洗牌

從 1 億美金到 50 萬(wàn)美金,訓(xùn)練成本在短短的 1 年時(shí)間內(nèi)的暴跌,正在引發(fā)整個(gè)算力市場(chǎng)的劇烈震蕩。這不僅僅是數(shù)字的變化,更是一場(chǎng)顛覆性的行業(yè)重構(gòu)。

那些曾經(jīng)瘋狂囤積算力的公司,如今面臨著尷尬的現(xiàn)實(shí):昂貴的 GPU 集群突然變成了"負(fù)資產(chǎn)"。據(jù)業(yè)內(nèi)消息,已有大批公司開始大量退卡,試圖減少損失。

而一些專門提供算力租賃服務(wù)的供應(yīng)商,更是直接面臨破產(chǎn)危機(jī)——當(dāng)客戶發(fā)現(xiàn)用更少的錢就能獲得更好的效果時(shí),誰(shuí)還會(huì)為過(guò)時(shí)的"算力迷信"買單?

這場(chǎng)技術(shù)革命告訴我們:真正的護(hù)城河從來(lái)不是資源的堆砌,而是效率的突破。 在 AI 的下半場(chǎng),拼的不再是誰(shuí)燒錢更多,而是誰(shuí)的技術(shù)更聰明。

本文由「AI 范兒」出品

我每天都在更新,如果你覺得這些內(nèi)容對(duì)你有用,

那我們就加個(gè)關(guān)注、交個(gè)朋友。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被許家印拖累,建工大佬黃裕輝遭“天價(jià)懸賞”:最高可達(dá)2500萬(wàn)元!旗下公司曾建設(shè)東方明珠電視塔、上海環(huán)球金融中心

被許家印拖累,建工大佬黃裕輝遭“天價(jià)懸賞”:最高可達(dá)2500萬(wàn)元!旗下公司曾建設(shè)東方明珠電視塔、上海環(huán)球金融中心

每日經(jīng)濟(jì)新聞
2025-11-04 23:26:09
通臂拳傳人被KO,永遠(yuǎn)扇不醒裝睡的人

通臂拳傳人被KO,永遠(yuǎn)扇不醒裝睡的人

難得君
2025-11-04 17:19:21
武切準(zhǔn)絕殺公牛逆轉(zhuǎn)76人升東部第一 馬克西39分吉迪連場(chǎng)三雙

武切準(zhǔn)絕殺公牛逆轉(zhuǎn)76人升東部第一 馬克西39分吉迪連場(chǎng)三雙

醉臥浮生
2025-11-05 11:29:58
白發(fā)越多,患癌越少?Nature子刊:壓力下的頭發(fā)變白,能預(yù)防癌癥,是身體啟動(dòng)的“自我保衛(wèi)戰(zhàn)”

白發(fā)越多,患癌越少?Nature子刊:壓力下的頭發(fā)變白,能預(yù)防癌癥,是身體啟動(dòng)的“自我保衛(wèi)戰(zhàn)”

梅斯醫(yī)學(xué)
2025-11-05 07:52:50
突然退網(wǎng)!干崩京東的楊笠扛不住了!

突然退網(wǎng)!干崩京東的楊笠扛不住了!

廣告案例精選
2025-11-04 22:17:13
歐冠狂歡夜:拜仁2-1贏巴黎登頂 利物浦送皇馬首敗 阿森納10連勝

歐冠狂歡夜:拜仁2-1贏巴黎登頂 利物浦送皇馬首敗 阿森納10連勝

侃球熊弟
2025-11-05 05:09:46
官媒發(fā)文,王虹再破天花板,讓韋神和整個(gè)學(xué)術(shù)圈都“沉默”了

官媒發(fā)文,王虹再破天花板,讓韋神和整個(gè)學(xué)術(shù)圈都“沉默”了

曉劗就是我
2025-11-04 07:09:39
楊瀚森翻譯進(jìn)教練組是誤傳!本人澄清傳言:全因小楊英語(yǔ)進(jìn)步太快

楊瀚森翻譯進(jìn)教練組是誤傳!本人澄清傳言:全因小楊英語(yǔ)進(jìn)步太快

羅說(shuō)NBA
2025-11-05 11:25:20
這一次,英達(dá)終于反擊高調(diào)宣布喜訊,眾多明星前來(lái)捧場(chǎng)掙足了面子

這一次,英達(dá)終于反擊高調(diào)宣布喜訊,眾多明星前來(lái)捧場(chǎng)掙足了面子

以茶帶書
2025-11-04 14:13:20
突發(fā)!神舟二十號(hào)飛船遭太空垃圾撞擊,將推遲返回!問(wèn)題大不大?

突發(fā)!神舟二十號(hào)飛船遭太空垃圾撞擊,將推遲返回!問(wèn)題大不大?

科普大世界
2025-11-05 11:06:27
跟一位日本比亞迪車主聊了聊,才明白我們對(duì)「出?!褂卸嗵煺?>
    </a>
        <h3>
      <a href=極客公園
2025-11-04 12:54:39
“大哥”承諾每月給1萬(wàn)元養(yǎng)家費(fèi),要求小弟把事都扛了!入獄后小弟崩潰:我被耍了……

“大哥”承諾每月給1萬(wàn)元養(yǎng)家費(fèi),要求小弟把事都扛了!入獄后小弟崩潰:我被耍了……

方圓
2025-11-04 15:38:28
神舟二十號(hào)飛船推遲返回:地球軌道上對(duì)航天器構(gòu)成潛在威脅的空間碎片估計(jì)超100萬(wàn)個(gè),中國(guó)空間站曾多次主動(dòng)實(shí)施空間碎片規(guī)避

神舟二十號(hào)飛船推遲返回:地球軌道上對(duì)航天器構(gòu)成潛在威脅的空間碎片估計(jì)超100萬(wàn)個(gè),中國(guó)空間站曾多次主動(dòng)實(shí)施空間碎片規(guī)避

極目新聞
2025-11-05 11:11:12
抄底!潘石屹夫婦用356億給美國(guó)上了一課

抄底!潘石屹夫婦用356億給美國(guó)上了一課

大貓財(cái)經(jīng)Pro
2025-11-04 17:32:48
女孩稱洗澡時(shí)被父親偷看,相關(guān)部門:系口角矛盾產(chǎn)生誤會(huì),父親回應(yīng):只是遞牙刷,無(wú)不妥舉動(dòng)

女孩稱洗澡時(shí)被父親偷看,相關(guān)部門:系口角矛盾產(chǎn)生誤會(huì),父親回應(yīng):只是遞牙刷,無(wú)不妥舉動(dòng)

極目新聞
2025-11-04 19:30:08
“史上最長(zhǎng)”春節(jié)假期來(lái)了!連休9天,臘月二十八和除夕均放假

“史上最長(zhǎng)”春節(jié)假期來(lái)了!連休9天,臘月二十八和除夕均放假

紅星新聞
2025-11-04 17:11:09
臺(tái)灣舉行大閱兵,場(chǎng)景太凄涼了

臺(tái)灣舉行大閱兵,場(chǎng)景太凄涼了

遠(yuǎn)方青木
2025-11-05 00:12:54
北京地鐵蕉內(nèi)廣告引爭(zhēng)議 網(wǎng)友吐槽“辣眼睛” 官方回應(yīng)將下刊處理

北京地鐵蕉內(nèi)廣告引爭(zhēng)議 網(wǎng)友吐槽“辣眼睛” 官方回應(yīng)將下刊處理

經(jīng)濟(jì)觀察網(wǎng)
2025-11-04 07:59:20
南京大學(xué)食堂推“999元帝王蟹”,負(fù)責(zé)人回應(yīng):系新開海鮮檔口常規(guī)菜品,比市場(chǎng)價(jià)便宜

南京大學(xué)食堂推“999元帝王蟹”,負(fù)責(zé)人回應(yīng):系新開海鮮檔口常規(guī)菜品,比市場(chǎng)價(jià)便宜

上游新聞
2025-11-03 14:59:07
被剪刀差剪掉的一生:1.8億農(nóng)村老人為何只能靠百元養(yǎng)老金度日?

被剪刀差剪掉的一生:1.8億農(nóng)村老人為何只能靠百元養(yǎng)老金度日?

霹靂炮
2025-11-02 20:52:08
2025-11-05 12:44:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個(gè)專注于人工智能領(lǐng)域的資訊和學(xué)習(xí)平臺(tái),提供最新的人工智能資訊
572文章數(shù) 163關(guān)注度
往期回顧 全部

科技要聞

馬斯克萬(wàn)億美元薪酬投票在即,大股東反對(duì)

頭條要聞

牛彈琴:美國(guó)上演極致"流氓外交" 讓西方媒體目瞪口呆

頭條要聞

牛彈琴:美國(guó)上演極致"流氓外交" 讓西方媒體目瞪口呆

體育要聞

貝克漢姆獲封爵士 曼聯(lián)官方祝賀

娛樂(lè)要聞

王家衛(wèi)事件再次升級(jí),可憐了這些明星

財(cái)經(jīng)要聞

飛天跌破1700元 茅臺(tái)迎來(lái)最不確定的冬天

汽車要聞

內(nèi)飾配置再提升 新款極氪X內(nèi)飾官圖發(fā)布

態(tài)度原創(chuàng)

健康
時(shí)尚
教育
本地
游戲

超聲探頭會(huì)加重受傷情況嗎?

2025羽絨服8大流行趨勢(shì),溫暖時(shí)髦過(guò)冬天!

教育要聞

禁止學(xué)生回寢室午休,教育局回應(yīng):未強(qiáng)制限定午休地點(diǎn)

本地新聞

秋顏悅色 | 在榆中,秋天是一場(chǎng)盛大的視覺交響

又一魔獸電影將登大熒幕!漢尼拔演員參演

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 五月婷婷开心中文字幕| ZZIJZZIJ亚洲日本少妇| 在线精品自拍亚洲第一区| 成人无码在线视频网站| 亚洲午夜精品久久久久久久久久 | 久久人妻精品国产| 欧州黄色视频| 777国产精品永久免费观看| 在线精品国产亚洲AV观看| 久久免费精品国自产拍网站| 丝袜国产精品91| 国产精品国产三级国AV麻豆 | 国产午夜精华液| 伊人久久亚洲综合影院首页| 粉嫩久久99精品久久久久久夜| 北条麻妃av高清无码| 欧美少妇尉房性生治片| 无卡无码无免费毛片| 天天爽夜夜爱| 亚洲欧洲免费视频| 久久人妻AV无码一区二区| 久久久久久久久久久高潮一区二区| 日韩精品亚洲人旧成在线| 成视人a免费观看 视频| 久久精品国产亚洲AV麻豆仙踪林| 无码精品人妻一区二区三区av| 久久精品高清一区二区三区| 懂色av色欲av蜜臀av| ww国产内射精品后入国产| 中文字幕视频一区| 国产美女极度色诱视频www| 久久久久久久久久久高潮一区二区| 亚洲午夜久久久影院伊人| 欧美疯狂做受xxxx高潮| 成人无遮挡18禁免费视频| 麻豆人妻少妇精品无码5| 欧美淫乱一区二区三区| 亚洲精品自偷自拍无码| 亚洲av永久无码天堂网手机版| 日本高清中文字幕免费一区二区 | 97精品无码一区区三区蜜桃|