xAI 新模型 Grok 4 Fast 卷瘋了！少用 40% token 還能追平 Grok 4，限定范圍可直接免費(fèi)用

2025-09-24 22:49:50　來源: InfoQ

北京舉報(bào)

分享至

整理 | 華衛(wèi)

近日，埃隆?馬斯克（Elon Musk）旗下的 xAI 公司推出了一款新的 AI 模型 ——Grok 4 Fast。該模型旨在通過將非推理能力與推理能力整合到單一系統(tǒng)中，實(shí)現(xiàn)低成本與高競爭力準(zhǔn)確性的兼顧，從而不再需要單獨(dú)的框架。

據(jù) xAI 介紹，Grok 4 Fast 思考所用的 token 數(shù)量約為 Grok 4 的 40%。盡管在性能測試中使用的 token 數(shù)量更少，但其結(jié)果卻與 Grok 4 十分接近。根據(jù) Artificial Analysis 所做的客觀研究，Grok 4 Fast 在保持同等性能的前提下，運(yùn)行成本可降低 98%，性價(jià)比大幅提升。

在 2025 年 AIME（美國數(shù)學(xué)邀請賽）、2025 年 HMMT（哈佛 - 麻省理工數(shù)學(xué)競賽）以及 GPQA 鉆石測試中，該模型的得分分別為 85.7%、92% 和 93.3%。此外，它在 SimpleQA 測試中得分 95%，在 X Bench Deepsearch 測試中得分 74%。這意味著 Grok 4 Fast 可應(yīng)用于多種任務(wù)，包括代碼執(zhí)行和復(fù)雜搜索。

同時(shí)，Grok 4 Fast 擁有 200 萬 token 的上下文窗口，能夠處理更大規(guī)模的輸入數(shù)據(jù)。其訓(xùn)練采用了在效率和延遲方面均達(dá)到最優(yōu)的強(qiáng)化學(xué)習(xí)方法，且作為單一模型，可同時(shí)運(yùn)行推理與非推理任務(wù)，從而降低了企業(yè)級應(yīng)用與消費(fèi)級應(yīng)用的成本。

此前版本的 Grok 需通過不同模型來完成各類任務(wù)，而此次 Grok 4 Fast 的發(fā)布對這一問題進(jìn)行了優(yōu)化。借助上述技術(shù)特性，Grok 4 Fast 的部署更為便捷、易用，對企業(yè)和開發(fā)者也更友好。

xAI 證實(shí)，Grok 4 Fast 可在多個(gè)平臺上使用：用戶可通過 grok.com 官網(wǎng)應(yīng)用、iOS 與 Android 客戶端訪問，也可連接至 OpenRouter、Vercel AI 網(wǎng)關(guān)及 xAI API。在 OpenRouter 和 Vercel 平臺上，用戶可在限定范圍內(nèi)免費(fèi)使用該模型。

目前，Grok 4 Fast 提供兩種版本：Grok-4-fast-reasoning（推理版）與 Grok-4-fast-non-reasoning（非推理版），兩者均支持 200 萬 token 的完整上下文窗口。定價(jià)方面，基礎(chǔ)計(jì)費(fèi)標(biāo)準(zhǔn)基于小額工作量設(shè)定，為每百萬輸入 token 0.20 美元，實(shí)際成本會(huì)根據(jù) token 消耗量按比例計(jì)算。

此次 Grok 4 Fast 的推出，使其成為此前版本模型的高性價(jià)比替代方案，也為有意尋求高效 AI 解決方案的開發(fā)者與企業(yè)提供了可擴(kuò)展的選擇。

https://www.analyticsinsight.net/news/elon-musks-xai-launches-grok-4-fast-with-2m-token-limit-and-40-lower-costs

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.