夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

性價(jià)比搏擊:Grok 4 Fast 推理成本直降 98%

0
分享至



打響低成本推理之爭。

作者丨梁丙鑒

編輯丨馬曉寧

幾乎沒有預(yù)熱,馬斯克不聲不響把模型調(diào)用成本砍掉 98%。

作為低成本推理模型的最新進(jìn)展,xAI 于上周五發(fā)布了其旗艦?zāi)P偷妮p量化版本 Grok 4 Fast。

通過大規(guī)模強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)智能密度最大化,Grok 4 Fast 在基準(zhǔn)測試上實(shí)現(xiàn)了與 Grok 4 相當(dāng)?shù)谋憩F(xiàn)。同時(shí)由于推理任務(wù)的平均 token 消耗減少了 40 %,xAI 此次更新將前沿模型的調(diào)用成本大幅降低。

據(jù)官方測算,Grok 4 Fast 單個(gè)推理任務(wù)的成本最低可降至原來的 2%。

這已經(jīng)是一個(gè)可以改寫大模型競爭規(guī)則的數(shù)字。

01

端到端強(qiáng)化學(xué)習(xí)

如果要給 Grok 4 Fast 三個(gè)關(guān)鍵詞,那應(yīng)該是 AI 搜索、上下文窗口和統(tǒng)一模型架構(gòu)。

xAI 在一篇博客中介紹,Grok 4 Fast 擁有原生的工具調(diào)用能力,這是指 Grok 4 Fast 通過端到端工具使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,在決定何時(shí)調(diào)用代碼或網(wǎng)頁等工具方面表現(xiàn)出色。

由于背靠 X 平臺的豐富數(shù)據(jù),此舉為 Grok 4 Fast 在自主探索能力方面帶來的優(yōu)勢更為突出。該模型能夠無縫瀏覽網(wǎng)頁和 X 平臺,利用實(shí)時(shí)數(shù)據(jù)增強(qiáng)查詢,同時(shí)支持跳轉(zhuǎn)鏈接獲取媒體內(nèi)容,并以極快速度綜合生成結(jié)果。

對于外部工具的自主使用能力,Grok 4 Fast 在 BrowseComp(44.9%)和 X Bench Deepsearch(74%)等基準(zhǔn)測試中,表現(xiàn)優(yōu)均于 Grok 4。

在 LMArena 的搜索競技場中,Grok 4 Fast 以 1163 分位列第一,力壓此前 OpenAI 領(lǐng)先的 o3-websearch,更是優(yōu)于 gpt-5-search 和 grok-4-search。在文本競技場中,Grok 4 Fast 則排名第八,以一分之差險(xiǎn)勝 grok-4-0709版本。

可以看到,Grok 4 Fast 已經(jīng)顯著優(yōu)于同等量級的模型,而在搜索相關(guān)任務(wù)中,模型參數(shù)造成的差距則可以被強(qiáng)化學(xué)習(xí)帶來的推理效率和智能密度所追平甚至跨越。


即將和 Grok 4 Fast 同期推出的是其兩個(gè)版本,grok-4-fast-reasoning 和 grok-4-fast-non-reasoning,即長鏈?zhǔn)剿季S和快速響應(yīng)兩種推理模式,均具備 200 萬 token 的上下文窗口。

值得一提的是,Grok 4 Fast 采用了統(tǒng)一模型架構(gòu)。

此前,在不同推理模式下應(yīng)用不同的獨(dú)立模型已經(jīng)成為業(yè)界通行的選擇。對于僅需要簡單回答和大量推理的任務(wù),手動(dòng)切換模型的開關(guān)對于各個(gè)模型廠商來說幾乎已是標(biāo)配。

而 Grok 4 Fast 此次更新引入了統(tǒng)一架構(gòu),其中 reasoning(長鏈?zhǔn)剿季S)和 non-reasoning(快速響應(yīng))兩種模式由同一模型權(quán)重處理,推理過程中通過系統(tǒng)提示進(jìn)行引導(dǎo)。

這種設(shè)計(jì)進(jìn)一步降低了端到端延遲和 token 成本。可以預(yù)見的結(jié)果是,在壓縮調(diào)用成本之外,Grok 4 Fast 距離那些對即時(shí)響應(yīng)存在高需求的場景也更近了一步。

02

SOTA 性價(jià)比

SOTA一日三變,市場對模型性能擠牙膏的戲碼早就沒有了耐心。

xAI 也深知這一點(diǎn),所以比起循例公布的基準(zhǔn)測試結(jié)果,此次更新真正的“軍火展示”其實(shí)是下面這兩張圖。



Grok 4 Fast 的 token 效率提升了 40%,加之每個(gè) token 的大幅降價(jià),最終結(jié)果是開發(fā)者的模型調(diào)用成本顯著降低。而此時(shí)的模型性能,仍可以基本保持在 Grok 4 的水平。

根據(jù) Artificial Analysis 的獨(dú)立評測,Grok 4 Fast 相較于其它公開可用的模型,展現(xiàn)出了 SOTA 級別的性價(jià)比。

在官方博客中,xAI 將 Grok 4 Fast 稱為“低成本推理的最近進(jìn)展”。98% 的成本壓縮一出,馬斯克就差把“我們最便宜大碗”寫在臉上。雖然沒能在追求智能上限的路上甩開友商,但“誰都能用”是在“比誰都強(qiáng)”之外,另一種打遍天下的可行方案。

在此前的很長一段時(shí)間里,大模型都是一場暴力美學(xué)的軍備競賽,更大的參數(shù)規(guī)模、算力消耗和更強(qiáng)的推理能力成為了模型廠商競爭的硬指標(biāo)。GPT-4、Gemini、Llama系列,乃至 xAI 自家的 Grok 4 Heavy,都是這種極致性能追求下的產(chǎn)物。

然而實(shí)驗(yàn)室之外的世界沒有那么關(guān)注技術(shù)邊界,當(dāng)大模型以一款產(chǎn)品的角色面向市場,過去的技術(shù)路線也在應(yīng)用場景之前留下了一道道坎,其中最為明顯的就是昂貴的推理成本和漫長的響應(yīng)時(shí)間。

相比之下,曾經(jīng)被視為閹割性能的小模型,如今卻正在成為應(yīng)用普及的關(guān)鍵角色。

xAI 雖未公布 Grok 4 Fast 的具體參數(shù),但根據(jù)命名邏輯的行業(yè)慣例,其大概率是在 Grok 4 的基礎(chǔ)上通過蒸餾、架構(gòu)優(yōu)化等技術(shù)降低了計(jì)算負(fù)載與延遲。這意味著它能在更低配置的服務(wù)器甚至邊緣設(shè)備上高效運(yùn)行,并實(shí)現(xiàn)遠(yuǎn)低于 Grok 4 Heavy 每百萬 tokens 輸入 3 美元、輸出 15 美元的“奢侈品”定價(jià)。

“低成本推理”主打的不是推理,而是低成本。在智能上限短期內(nèi)突破無望的背景下,每省下一個(gè) token,每個(gè) token 多便宜一點(diǎn),都是向落地多邁出了一步。而在這場性價(jià)比搏擊中,馬斯克先揮出了一記重拳。

參考資料:


https://x.ai/news/grok-4-fast
-tool-use-with-sota-search

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
反常!國內(nèi)金價(jià)漲破1400元!黃金回收卻遇冷!為什么會這樣?

反常!國內(nèi)金價(jià)漲破1400元!黃金回收卻遇冷!為什么會這樣?

趣味萌寵的日常
2025-12-28 01:12:27
全國首臺!只殺癌細(xì)胞,不傷好細(xì)胞,武漢癌癥“大殺器”正式啟用

全國首臺!只殺癌細(xì)胞,不傷好細(xì)胞,武漢癌癥“大殺器”正式啟用

荷蘭豆愛健康
2025-12-26 07:05:32
凌晨三四點(diǎn)無故驚醒,別不當(dāng)回事,或是“不干凈”的東西在敲門

凌晨三四點(diǎn)無故驚醒,別不當(dāng)回事,或是“不干凈”的東西在敲門

古怪奇談錄
2025-11-06 14:23:56
全球最精確預(yù)言家:2026,歷史性的一年, 能說的都在這里

全球最精確預(yù)言家:2026,歷史性的一年, 能說的都在這里

神奇故事
2025-12-24 23:34:15
“薛寶釵”張莉現(xiàn)狀:住加拿大豪宅,60歲仍似少女,至今不婚不育

“薛寶釵”張莉現(xiàn)狀:住加拿大豪宅,60歲仍似少女,至今不婚不育

艷姐的搞笑視頻
2025-12-27 21:27:01
海南封關(guān)成照妖鏡,東南亞國家挨個(gè)現(xiàn)行,新加坡直言不準(zhǔn)自給自足

海南封關(guān)成照妖鏡,東南亞國家挨個(gè)現(xiàn)行,新加坡直言不準(zhǔn)自給自足

眼底星碎
2025-12-26 19:35:35
西方都很好奇:全世界到處都在打仗,憑什么中國反而進(jìn)入了盛世?

西方都很好奇:全世界到處都在打仗,憑什么中國反而進(jìn)入了盛世?

閱微札記
2025-12-25 16:14:54
摩根士丹預(yù)測:2026年1季度汽車銷量 下跌30%-35%

摩根士丹預(yù)測:2026年1季度汽車銷量 下跌30%-35%

網(wǎng)上車市
2025-12-26 15:38:06
醫(yī)生發(fā)現(xiàn):天冷堅(jiān)持戴口罩的人,用不了多久,身體或會有5大變化

醫(yī)生發(fā)現(xiàn):天冷堅(jiān)持戴口罩的人,用不了多久,身體或會有5大變化

霹靂炮
2025-12-04 22:54:47
婆婆66歲伺候我8年,她生日當(dāng)天我說:你該去你女兒家了!

婆婆66歲伺候我8年,她生日當(dāng)天我說:你該去你女兒家了!

風(fēng)起見你
2025-12-28 01:27:59
不只是俄羅斯傻眼了,就連我們都傻眼了

不只是俄羅斯傻眼了,就連我們都傻眼了

南權(quán)先生
2025-12-24 16:55:53
徐湖平在部隊(duì)期間因“手腳不干凈”,被營長岳振華踢出了軍隊(duì)?

徐湖平在部隊(duì)期間因“手腳不干凈”,被營長岳振華踢出了軍隊(duì)?

方圓文史
2025-12-27 16:56:27
老公轉(zhuǎn)我十五萬,閨蜜請我吃日料,我卻在餐具上看到她約我老公

老公轉(zhuǎn)我十五萬,閨蜜請我吃日料,我卻在餐具上看到她約我老公

曉艾故事匯
2025-12-27 17:15:47
連Andrej Karpathy都慌了:AI編程的9級地震正在發(fā)生什么

連Andrej Karpathy都慌了:AI編程的9級地震正在發(fā)生什么

AI進(jìn)化論花生
2025-12-27 11:26:15
警惕!小心這些藥正在“溶解”你的肌肉

警惕!小心這些藥正在“溶解”你的肌肉

PSM藥盾公益
2025-11-21 16:59:45
南博事件升級!已敲定6點(diǎn)定論,《江南春》送上拍賣場另有買家

南博事件升級!已敲定6點(diǎn)定論,《江南春》送上拍賣場另有買家

火山詩話
2025-12-24 10:55:06
防守不積極,快攻第一名,有他在湖人不可能奪冠!

防守不積極,快攻第一名,有他在湖人不可能奪冠!

愛體育
2025-12-27 23:29:26
中超動(dòng)態(tài)!邦本宜裕續(xù)約,非體育因素成遼寧鐵人放棄核心主因

中超動(dòng)態(tài)!邦本宜裕續(xù)約,非體育因素成遼寧鐵人放棄核心主因

智商已欠費(fèi)啦
2025-12-27 16:10:16
沉默5天,蔡英文終發(fā)文哀悼!臺北全城警戒,國民黨揪出罪惡根源

沉默5天,蔡英文終發(fā)文哀悼!臺北全城警戒,國民黨揪出罪惡根源

桑啟紅原
2025-12-28 01:26:57
浙江:“大綜合一體化”行政執(zhí)法改革試點(diǎn)任務(wù)“通關(guān)”

浙江:“大綜合一體化”行政執(zhí)法改革試點(diǎn)任務(wù)“通關(guān)”

新華社
2025-12-26 22:20:04
2025-12-28 06:16:49
AI科技評論 incentive-icons
AI科技評論
點(diǎn)評學(xué)術(shù),服務(wù)AI
7025文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

藝術(shù)
本地
親子
教育
房產(chǎn)

藝術(shù)要聞

手串種類大盤點(diǎn),全見過的算得上是文玩老手了!

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

親子要聞

親密障礙改善的不僅是能力,更是溝通模式!

教育要聞

家長對于孩子正向的反饋太缺少了

房產(chǎn)要聞

年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

無障礙瀏覽 進(jìn)入關(guān)懷版 欧美ⅩⅩⅩⅩ| 亚洲av永久无无码精品一区二区三区| AV天堂婷婷| 国产干干干射射射| 国产精品xxx在线| 久久久久无码精品国产H动漫猫咪| 亚洲av无码影院| 中文字幕人妻一区二区在线视频 | 精品蜜臀国产av一区二区| 国产开嫩包视频在线观看| 一本到中文无码av在线精品| 国产亚精一二区视在线| 欧美成人午夜影院| 医院人妻闷声隔着帘子被中出| 亚洲精品视频免费观看| 欧美成 人版在线观看| 国产在线美女| 亚洲男人天堂高清无码黄色毛片| 一本一本久久aa综合精品| 少妇高潮大叫好爽| 免费日本a级网站| 国产精品白嫩白嫩大学美女| 无码毛片aaa国产蜜乳| 最近中文字幕国语免费| 天天狠天天操| 爽 好大 快 潘甜甜| 久久人人爽人人爽| 好吊视频在线一区二区三区| 农村的激情av| caoporn成人免费公开| 内谢少妇xxxxx8老少交| 99久久精品国产一区二区三区| 西西4444www大胆无码| 日韩成人一区二区二十六区| 97久久综合一区二区三区| 无码不卡的中文字幕视频 | 欧美成人h亚洲综合在线观看| 熟女系列一二三四区| 亚洲AV无码乱码国产麻豆| 欧美国产综合| 乱码视频午夜在线观看|