經(jīng)過半年多的爆料和預(yù)熱,世界機器人大會即將開幕之際,史上最強大模型GPT-5終于來了!
北京時間8月8日凌晨,OpenAI CEO奧爾特曼(Sam Altman)發(fā)布其最新、最先進(jìn)的AI大模型GPT-5系列。
這距離上一次GPT-4的發(fā)布,過去了長達(dá)兩年半的時間。
奧爾特曼表示,GPT-5是OpenAI經(jīng)過兩年多開發(fā)、歷經(jīng)多次挫折與延期后的成果,使用這項新技術(shù)“真的就像在與某個領(lǐng)域的博士級專家對話”。據(jù)悉,該公司正在向所有人開放GPT-5,包括其免費用戶、Plus用戶、Pro用戶和團(tuán)隊用戶,下周向企業(yè)用戶和教育用戶推出。
OpenAI表示,該模型更智能、更快速,“更有用”,尤其是在寫作、編碼和醫(yī)療等領(lǐng)域。公司強調(diào),在視覺推理、代理編碼和研究生水平的科學(xué)問題解決等功能上,GPT-5輸出token數(shù)量減少50%-80%。在思考時,GPT-5的響應(yīng)包含事實錯誤的可能性比 OpenAI o3 低約80%。
“讓這項服務(wù)免費提供給我們有重大意義;讓每個人都能獲得博士級別的智慧。此外,用戶還可獲得更高的速率限制,專業(yè)用戶獲得 GPT-5 pro;真的很聰明?!眾W爾特曼稱,API主要包含3個新模型:GPT-5、GPT-5 mini、GPT-5 nano等,支持新的推理模式、工具調(diào)用等功能。
奧爾特曼強調(diào),接下來,GPT-5將升級語音模式,讓語音更加自然,更加智能。此外,免費用戶現(xiàn)在可以使用GPT-5聊天數(shù)小時,而付費用戶則幾乎不受限制。
據(jù)Artificial Analysis基準(zhǔn)測試結(jié)果,GPT-5現(xiàn)在是領(lǐng)先的AI模型,超越了Grok-4、Qwen3-235B以及DeepSeek R1等。
具體來說,GPT-5(high)達(dá)到了68分,位列第一;GPT-5(medium)67分,與Grok 4并列第二;OpenAI o3得分67分,Google Gemini 2.5 Pro和DeepSeek R1都是65分,而Anthropic Claude 4 Opus只有59分。
事實上,不僅是新的模型。有趣的是,就在昨天,博主@Yuchenj_UW發(fā)文稱,奧爾特曼宣布為2年內(nèi)的每位在職員工提供150萬美元(約合人民幣1077萬元)的獎金?!坝ミ_(dá)78%的員工都是百萬富翁。在OpenAI,這個比例更是高達(dá)100%,我們可以稱之為‘扎克伯格挖角效應(yīng)’。”
他隨后補充稱,每個OpenAI員工,甚至新入職的員工,在接下來的兩年內(nèi)都會獲得150萬美元的獎金。
顯然,全球大模型市場競爭已如此激烈,在這樣的背景下,OpenAI卻選擇給員工放假并加薪。而奧爾特曼此舉的最終目的很明確:推動GPT-5順利發(fā)布,讓OpenAI得以持續(xù)穩(wěn)坐全球 AI 大模型領(lǐng)域的頭部寶座。
GPT-5 API低至0.40美元,C端免費用
OpenAI從一個僅有14人的研究實驗室,十年間成長為全球領(lǐng)先的AI平臺公司。
2018年,OpenAI發(fā)布GPT-1,成為OpenAI第一個大規(guī)模預(yù)訓(xùn)練的語言模型;次年,OpenAI發(fā)布GPT-2,模型規(guī)模擴大10倍,擁有 1.5 億個參數(shù),在生成文本方面展現(xiàn)出強大能力,但因潛在濫用風(fēng)險,OpenAI以內(nèi)測形式使用。
2020年5月,OpenAI推出GPT-3,擁有1750億個參數(shù)。兩年后的2022年11月30日,OpenAI發(fā)布基于GPT-3.5的 AI 聊天機器人產(chǎn)品ChatGPT,風(fēng)靡全球。
2023年3月14日,OpenAI發(fā)布GPT-4,語言理解能力更強大,能處理圖像內(nèi)容,對月訂閱費20美元的Plus用戶開放使用。11月7日,OpenAI在首屆開發(fā)者大會上宣布GPT-4升級為GPT-4 Turbo。
2024年5月,OpenAI 推出可免費使用的 GPT-4o,支持文本、視覺、音頻多模態(tài);7月18日,OpenAI推出GPT-4o mini;9 月 12 日,OpenAI 正式對外發(fā)布 o1 模型的預(yù)覽版,同時發(fā)布了o1-mini。12月5日,OpenAI發(fā)布了正式版OpenAI o1模型,隨后在今年還公布了o3-mini系列,性能和性價比都超越o1模型。
到了2025年2月,開源AI模型DeepSeek V3/R1,以及馬斯克的競購動作影響下,一夜之間,OpenAI終于不再“擠牙膏”,全面加速。奧爾特曼首先承認(rèn),OpenAI 已經(jīng)意識到自家的模型和產(chǎn)品供應(yīng)已經(jīng)變得非常復(fù)雜,需要簡化產(chǎn)品供應(yīng),并于數(shù)周內(nèi)發(fā)布了GPT-4.5、o3系列模型等。
值得一提的是,OpenAI時隔六年,終于在今年8月6日凌晨開源兩個推理模型:gpt-oss-120b和gpt-oss-20b。其中,gpt-oss-120b高達(dá)1170億參數(shù)規(guī)模,采用MoE架構(gòu),激活參數(shù)約51億,可在單張80GB GPU上運行,性能接近閉源的o4-mini,而gpt-oss-20b性能接近o3-mini。
奧爾特曼在社交平臺上表示,這兩款模型的“價值”在于,可以在本地筆記本(20b的可以在手機上)運行。而這是公司耗資數(shù)十億美元的研究成果。
對于GPT-5,早在今年7月,奧爾特曼就對其大加贊賞。
奧爾特曼表示,“今天早上,我正在測試我們的新模型,然后我收到了一個問題。我通過電子郵件收到了一個我不太明白的問題。我把它放進(jìn)了模型中,這就是 GPT-5,它完美地回答了這個問題。我真的坐回到椅子上,心想,天哪,這一刻就到了。我覺得自己相對于人工智能來說毫無用處,我覺得我應(yīng)該能夠做到這一點,但我做不到。這真的很難。但人工智能就是這么做的。感覺很奇怪?!?/p>
如今,OpenAI發(fā)布了爆料已久的GPT-5系列,包括GPT-5、GPT-5 Pro、GPT-5 mini、GPT-5 nano。基于微軟Azure AI超級計算機上進(jìn)行訓(xùn)練,GPT-5在智能水平、API價格、企業(yè)復(fù)雜任務(wù)落地等多個層面均有升級。
首先,GPT-5可以端到端地處理復(fù)雜任務(wù),并提供更易于使用的代碼、更好的設(shè)計,并且調(diào)試更有效;同時,GPT-5全面提升了智能水平,在數(shù)學(xué)、科學(xué)、金融、法律等領(lǐng)域提供更實用的答案,就像擁有一支隨時待命的專家團(tuán)隊,隨時解答你的疑問;此外,針對于健康話題,GPT-5事故針對健康相關(guān)問題的最佳模型,它能夠提供更精確、更可靠的答案;而且,基于GPT-5的ChatGPT現(xiàn)在可以在您需要時進(jìn)行深入思考。
發(fā)布會演示中,在多個基準(zhǔn)測試?yán)?,GPT-5的性能遠(yuǎn)超o3和GPT-4o。
其中,GPT-5在數(shù)學(xué)(AIME 2025工具測試得分 94.6%)、真實世界編碼(SWE-bench Verified 得分 74.9%,Aider Polyglot 得分 88%)、多模態(tài)理解(MMMU 得分 84.2%)和健康(HealthBench Hard 得分 46.2%)方面均創(chuàng)下了新的最高水平——這些提升在日常使用中得到了充分體現(xiàn)。憑借 GPT-5 pro 的擴展推理能力,該模型還在GPQA上創(chuàng)下了新的最高水平,工具測試得分高達(dá)88.4%。
其次,API價格層面,GPT-5 nano API每百萬tokens輸出價格低至0.40美元。雖然沒有開源模型gpt-oss系列價格那么夸張,但GPT-5性價比依然不錯。
再次,企業(yè)層面,GPT-5可以通過使用公司文件和連接網(wǎng)盤類平臺應(yīng)用,來生成更高質(zhì)量的內(nèi)容。同時,GPT-5擅長寫作、研究、分析、編程和解決問題,它能夠提供更準(zhǔn)確、更專業(yè)的響應(yīng),就像與一位聰明、有思想的同事合作。
最后,GPT-5支持多模推理統(tǒng)一,該模型在一系列多模態(tài)基準(zhǔn)測試中表現(xiàn)出色,涵蓋視覺推理、視頻推理、空間推理和科學(xué)推理。更強大的多模態(tài)性能意味著 ChatGPT 能夠更準(zhǔn)確地對圖像和其他非文本輸入進(jìn)行推理——無論是解讀圖表、總結(jié)演示文稿照片,還是回答有關(guān)圖表的問題。
OpenAI強調(diào),GPT-5用更少的思考時間實現(xiàn)了更大的價值。在評估中,GPT-5(具備思考能力)的表現(xiàn)優(yōu)于 OpenAI o3,在視覺推理、代理編碼和研究生水平的科學(xué)問題解決等功能上,其輸出token數(shù)量減少了 50% 至 80%。
幻覺層面,GPT-5 產(chǎn)生幻覺的可能性顯著低于我們之前的模型。在 ChatGPT 生產(chǎn)流量中代表匿名提示的網(wǎng)頁搜索中,GPT-5 的響應(yīng)包含事實錯誤的可能性比 GPT-4o 低約 45%;在思考時,GPT-5 的響應(yīng)包含事實錯誤的可能性比 OpenAI o3 低約 80%。
而為了應(yīng)對最具挑戰(zhàn)性、最復(fù)雜的任務(wù),OpenAI還發(fā)布了 GPT-5 pro,以取代OpenAI o3-pro,它能夠長時間思考,使用可擴展且高效的并行測試時間計算,從而提供最高質(zhì)量和最全面的答案。
GPT-5 pro在對1000多個具有經(jīng)濟價值的現(xiàn)實世界推理問題評估中,外部專家67.8%的答案是GPT-5 pro,而非“GPT-5 thinking”。GPT-5 pro的重大錯誤減少了22%,其答案較為相關(guān)、實用且全面。
OpenAI每月賺10億美元、估值超3萬億
自ChatGPT發(fā)布至今981天間,OpenAI已經(jīng)不只是一家AI獨角獸公司,而且還是全球市值最高、融資最多、模型收入最好的AI公司。
目前,OpenAI在營收、融資方面都持續(xù)加速,每月賺10億美元,估值遠(yuǎn)超3萬億元。
據(jù)報道,OpenAI正在推進(jìn)其史無前例的400億美元融資計劃,融資前估值達(dá)到2600億美元。
該公司在6月獲得100億美元融資后,目前OpenAI正在為第二部分300億美元融資尋找投資者,并與現(xiàn)有投資者展開初步談判,商討員工持股的股權(quán)出售事宜。
其中,包括風(fēng)險投資公司興盛資本(Thrive Capital)等現(xiàn)有投資者,已向OpenAI提出收購員工股份的請求。截至目前,OpenAI已接近完成其中的75億美元融資。
如果這一投資交易順利達(dá)成,OpenAI的估值預(yù)計將從目前的3000億美元躍升至5000億美元(約合人民幣3.59萬億元),超過馬斯克的航天公司SpaceX(3500億美元),成為全球最具價值的AI公司之一。
另據(jù)The Information報道,目前,OpenAI年化收入已翻倍至120億美元,同時其旗艦產(chǎn)品ChatGPT的周活躍用戶數(shù)突破7億人次。
這意味著,OpenAI每月就賺10億美元,而且今年前七個月就實現(xiàn)收入翻番,收入主要來自于更多企業(yè)和個人訂閱其用于編程和其他任務(wù)的ChatGPT服務(wù)。
根據(jù)FutureSearch最新公布的研究報告和相關(guān)數(shù)據(jù),其中,ChatGPT Plus是OpenAI最大的收入來源,有76%來自ChatGPT付費用戶,面向開發(fā)者端的API接口收入占比僅為15%左右。報告稱,在數(shù)據(jù)安全、知識產(chǎn)權(quán)等多重風(fēng)險的影響下,B端創(chuàng)收相較C端更加艱難。
除了軟件和AI模型的創(chuàng)新,OpenAI還在硬件領(lǐng)域展開布局。
最近,OpenAI收購了由iPhone設(shè)計師喬尼·艾夫(Jony Ive)創(chuàng)辦的初創(chuàng)公司io,交易金額高達(dá)64億美元。根據(jù)奧爾特曼的說法,OpenAI計劃生產(chǎn)1億個AI“伴侶”,這些設(shè)備將成為用戶日常生活的重要組成部分。
“我們不會在第一天就生產(chǎn)1億臺設(shè)備?!眾W爾特曼表示,他預(yù)測OpenAI將以“比任何公司都快的速度”生產(chǎn)出這么大數(shù)量的高質(zhì)量設(shè)備。他的目標(biāo)是在2026年底前推出設(shè)備。
快速增長的同時,OpenAI的現(xiàn)金消耗也在加速。該公司已將2025年現(xiàn)金消耗預(yù)期上調(diào)至約80億美元,較此前預(yù)期增加10億美元。其在服務(wù)器租賃方面的支出可能超過此前預(yù)計的140億美元。
近期紅杉資本“2025 AI Ascent”大會上,奧爾特曼表示,未來,ChatGPT將演進(jìn)為一種高度個性化的AI服務(wù)——它能夠記住用戶的完整生活背景,從對話記錄到電子郵件內(nèi)容,同時能夠在多個應(yīng)用和服務(wù)之間無縫銜接、自然協(xié)作。
“我們希望成為用戶的核心AI訂閱服務(wù)提供商。其中一部分功能將通過ChatGPT實現(xiàn),其他還會涵蓋一些關(guān)鍵模塊。但最核心的,還是打造更智能的模型,探索新的交互入口。比如,專屬硬件終端設(shè)備,甚至類似操作系統(tǒng)的基礎(chǔ)平臺。至于API或SDK的形態(tài),我們現(xiàn)在還沒有完全想清楚,但一定會找到合理的路徑??赡軙?jīng)歷幾輪嘗試,但最終我們會做成。我希望我們的平臺能為全世界創(chuàng)造巨大的價值,成為其他開發(fā)者創(chuàng)新的基礎(chǔ)。”奧爾特曼表示。
談及大公司AI技術(shù)發(fā)展,奧爾特曼指出,他對大公司的轉(zhuǎn)型速度感到失望,但并不意外。他認(rèn)為大公司犯的錯誤與以往如出一轍——過度依賴傳統(tǒng)流程,固守舊有思維。
“我的判斷是,未來一到兩年里,它們?nèi)詴?jīng)歷掙扎期——試圖假裝AI不會顛覆一切,等真正危機降臨時才匆忙轉(zhuǎn)型,但往往已經(jīng)為時過晚。屆時,初創(chuàng)公司早已利用靈活機制和新范式完成‘彎道超車’?!眾W爾特曼稱。
奧爾特曼強調(diào),2025年,AI Agent(智能體)將開始大規(guī)?!吧蠉彙?,處理復(fù)雜任務(wù),編程等場景;2026年,智能體將具備自主發(fā)現(xiàn)新知識的能力,形成具有獨立邏輯的決策框架;到2027年,智能體將正式進(jìn)入物理世界,作為“數(shù)字勞動力”創(chuàng)造實際商業(yè)價值。(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.