整理 | 華衛(wèi)
近日,埃隆?馬斯克(Elon Musk)旗下的 xAI 公司推出了一款新的 AI 模型 ——Grok 4 Fast。該模型旨在通過將非推理能力與推理能力整合到單一系統(tǒng)中,實(shí)現(xiàn)低成本與高競爭力準(zhǔn)確性的兼顧,從而不再需要單獨(dú)的框架。
據(jù) xAI 介紹,Grok 4 Fast 思考所用的 token 數(shù)量約為 Grok 4 的 40%。盡管在性能測試中使用的 token 數(shù)量更少,但其結(jié)果卻與 Grok 4 十分接近。根據(jù) Artificial Analysis 所做的客觀研究,Grok 4 Fast 在保持同等性能的前提下,運(yùn)行成本可降低 98%,性價(jià)比大幅提升。
在 2025 年 AIME(美國數(shù)學(xué)邀請賽)、2025 年 HMMT(哈佛 - 麻省理工數(shù)學(xué)競賽)以及 GPQA 鉆石測試中,該模型的得分分別為 85.7%、92% 和 93.3%。此外,它在 SimpleQA 測試中得分 95%,在 X Bench Deepsearch 測試中得分 74%。這意味著 Grok 4 Fast 可應(yīng)用于多種任務(wù),包括代碼執(zhí)行和復(fù)雜搜索。
同時(shí),Grok 4 Fast 擁有 200 萬 token 的上下文窗口,能夠處理更大規(guī)模的輸入數(shù)據(jù)。其訓(xùn)練采用了在效率和延遲方面均達(dá)到最優(yōu)的強(qiáng)化學(xué)習(xí)方法,且作為單一模型,可同時(shí)運(yùn)行推理與非推理任務(wù),從而降低了企業(yè)級應(yīng)用與消費(fèi)級應(yīng)用的成本。
此前版本的 Grok 需通過不同模型來完成各類任務(wù),而此次 Grok 4 Fast 的發(fā)布對這一問題進(jìn)行了優(yōu)化。借助上述技術(shù)特性,Grok 4 Fast 的部署更為便捷、易用,對企業(yè)和開發(fā)者也更友好。
xAI 證實(shí),Grok 4 Fast 可在多個(gè)平臺上使用:用戶可通過 grok.com 官網(wǎng)應(yīng)用、iOS 與 Android 客戶端訪問,也可連接至 OpenRouter、Vercel AI 網(wǎng)關(guān)及 xAI API。在 OpenRouter 和 Vercel 平臺上,用戶可在限定范圍內(nèi)免費(fèi)使用該模型。
目前,Grok 4 Fast 提供兩種版本:Grok-4-fast-reasoning(推理版)與 Grok-4-fast-non-reasoning(非推理版),兩者均支持 200 萬 token 的完整上下文窗口。定價(jià)方面,基礎(chǔ)計(jì)費(fèi)標(biāo)準(zhǔn)基于小額工作量設(shè)定,為每百萬輸入 token 0.20 美元,實(shí)際成本會(huì)根據(jù) token 消耗量按比例計(jì)算。
此次 Grok 4 Fast 的推出,使其成為此前版本模型的高性價(jià)比替代方案,也為有意尋求高效 AI 解決方案的開發(fā)者與企業(yè)提供了可擴(kuò)展的選擇。
https://www.analyticsinsight.net/news/elon-musks-xai-launches-grok-4-fast-with-2m-token-limit-and-40-lower-costs
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.