網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

GPT-5波折超乎想象！奧特曼連夜回應(yīng)一切：4o重新上陣，團(tuán)隊(duì)緊急補(bǔ)救

2025-08-09 10:45:26　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：定慧好困

【新智元導(dǎo)讀】奧特曼和OpenAI團(tuán)隊(duì)回應(yīng)關(guān)于GPT-5的所有問(wèn)題。

GPT-5發(fā)布會(huì)，大家都看了吧～

感覺(jué)現(xiàn)在整個(gè)世界，都在討論GPT-5。

網(wǎng)友們都吵翻了天，直播的時(shí)候跑分圖都能畫(huà)錯(cuò)，這也算AGI？更有網(wǎng)友哭著喊著：還我GPT-4o！

但另一邊呢？畫(huà)風(fēng)完全不一樣，很多網(wǎng)友實(shí)測(cè)后表示「GPT-5強(qiáng)無(wú)敵」。

這種又愛(ài)又恨的奇妙感覺(jué)，恰恰說(shuō)明了一件事：我們對(duì)AGI，太期待了！

這種讓整個(gè)AI圈子都「炸鍋」的盛況，上一次或許還是ChatGPT橫空出世那會(huì)兒。

2022年11月30日，ChatGPT上線(xiàn)，才短短不到3年，我們對(duì)于GPT-5的期待已經(jīng)是AGI了！

這世界，因?yàn)?/strong>AI，真的變得太快了。

面對(duì)GPT-5發(fā)布后的所有的疑問(wèn)和口誅筆伐，奧特曼，終于回應(yīng)了這一切。

奧特曼「回應(yīng)」所有問(wèn)題

首先是，面對(duì)沸騰的輿論，GPT-5剛剛發(fā)布后的第一時(shí)間，奧特曼就表示要進(jìn)行一波全面更新。

我們會(huì)繼續(xù)努力保障系統(tǒng)穩(wěn)定，并持續(xù)聽(tīng)取大家的反饋。

一次性上線(xiàn)這么多新東西，我們預(yù)料到過(guò)程會(huì)有些磕磕絆絆。

但實(shí)際的波折比我們預(yù)想的還要多一些！

在完成全面部署后，我們會(huì)將ChatGPT Plus用戶(hù)的GPT-5使用限額翻倍。
Plus用戶(hù)將可以選擇繼續(xù)使用4o。我們會(huì)持續(xù)關(guān)注其使用情況，并依此來(lái)決定舊版模型會(huì)保留多久。
從今天起，GPT-5會(huì)感覺(jué)更智能。（昨天，模型的自動(dòng)切換器出了故障，宕機(jī)了大半天，導(dǎo)致GPT-5表現(xiàn)得笨了很多。）
我們將讓你更清楚地看到，回答每一個(gè)問(wèn)題的究竟是哪個(gè)模型。
我們會(huì)調(diào)整用戶(hù)界面，讓用戶(hù)可以更方便地手動(dòng)觸發(fā)模型的「思考」過(guò)程。
向所有用戶(hù)完全開(kāi)放的過(guò)程比我們預(yù)想的要長(zhǎng)一些。這畢竟是一次規(guī)模龐大的系統(tǒng)性變更。
舉個(gè)例子，在過(guò)去24小時(shí)里，我們的API流量就幾乎翻了一倍…（雖然大家嘴上罵著，但是都管不住手?。?br/>
我們確實(shí)低估了用戶(hù)會(huì)如此看重GPT-4o的某些特性，即便GPT-5在絕大多數(shù)方面都表現(xiàn)得更好。
關(guān)于GPT-4o和GPT-5（Chat版本）的相對(duì)優(yōu)劣，用戶(hù)們的看法大相徑庭。
這件事讓我們明白，不存在一個(gè)能滿(mǎn)足所有人的模型，我們需要為不同用戶(hù)提供好的個(gè)性化定制方案。
我們正在集中精力完成GPT-5的全面推送并確保系統(tǒng)穩(wěn)定。

OpenAI GPT-5團(tuán)隊(duì)「回應(yīng)一切」
與此同時(shí)，每次發(fā)布會(huì)后的「例行公事」AMA問(wèn)答環(huán)節(jié)也已完成，奧特曼和眾多高管在線(xiàn)答疑。

太長(zhǎng)不看版：
GPT-4o回歸：Plus用戶(hù)將重新獲得4o的使用權(quán)限，支持時(shí)長(zhǎng)取決于使用情況；
是否同時(shí)提供4o/4.1與GPT-5正在研究中。
考慮推出不限量模式。（以前的Plus用4.1是無(wú)限的）
GPT-5將自動(dòng)啟用推理能力，下次更新會(huì)讓切換更順滑，可用「think hard」強(qiáng)制進(jìn)入推理模式。
新語(yǔ)音模型：更快、更好地遵循指令。
將支持IDE中使用第三方插件。
偏見(jiàn)處理更好，GPT-5 mini更有人情味。
計(jì)劃讓Plus用戶(hù)無(wú)限次使用推理模型，并提升GPT-5 mini推理的使用額度。
遺憾的是，由于算力成本限制，沒(méi)能實(shí)現(xiàn)100萬(wàn)Token的上下文。
AMA問(wèn)答參與成員：
·奧特曼（CEO）
·Sulman Choudhry（工程）
·Yann Dubois（研究）
·Alexander Embiricos（產(chǎn)品）
·Tarun Gogineni（研究）
·Saachi Jain（安全）
·Christina Kim（研究）
·Elaine YaLe（研究）
·Daniel Levine（產(chǎn)品）
·Eric Mitchell（研究）
·Michelle Pokrass（研究）
·Max Schwarzer（研究）
問(wèn)：請(qǐng)讓4o回歸吧。別移除不同的模型版本，大家各有所好。
奧特曼：好的，我們都聽(tīng)到了大家對(duì)4o的呼聲；我們會(huì)為Plus用戶(hù)重新上線(xiàn)4o，并會(huì)根據(jù)使用情況來(lái)決定支持它多久。
問(wèn)：請(qǐng)給我們一個(gè)選項(xiàng)，可以同時(shí)使用GPT-4o/4.1和GPT-5。
奧特曼：我們正在研究這個(gè)問(wèn)題。是必須同時(shí)擁有4o和4.1，還是只有4o就夠了？

問(wèn)：別忘了Plus訂閱用戶(hù)曾經(jīng)有過(guò)不限量的模型。
奧特曼：我們是該搞一個(gè)不限量的東西！
問(wèn)：之前那幾張圖表是怎么回事？看起來(lái)很有誤導(dǎo)性。
奧特曼：圖里的數(shù)據(jù)是準(zhǔn)確的，但柱狀圖和演示文稿搞砸了。當(dāng)初壓根就不該放出那張幻燈片。我們正在整理一份更好的對(duì)比數(shù)據(jù)供大家參考。

問(wèn)：現(xiàn)在大多數(shù)人還是把ChatGPT當(dāng)聊天機(jī)器人用。它的用途將會(huì)如何演變？

Sulman Choudhry：ChatGPT正在為用戶(hù)完成越來(lái)越多具有經(jīng)濟(jì)價(jià)值的工作。人與ChatGPT的互動(dòng)方式，應(yīng)該從「提問(wèn)」逐漸轉(zhuǎn)變?yōu)?strong>更適合「做事」的模式。隨著大家學(xué)會(huì)用新的方式來(lái)使用ChatGPT，這一轉(zhuǎn)變會(huì)逐步發(fā)生。

問(wèn)：ChatGPT語(yǔ)音功能自發(fā)布以來(lái)有什么改進(jìn)嗎？

Sulman Choudhry：我們昨天上線(xiàn)了一個(gè)新的語(yǔ)音模型，它在指令遵循和響應(yīng)速度上都更加出色。

問(wèn)：你們會(huì)直接集成類(lèi)似Cursor的功能嗎？

Alexander Embiricos：你試過(guò)Codex CLI嗎？這是我們的開(kāi)源編碼智能體，可以在本地運(yùn)行。

問(wèn)：GPT-4.5的寫(xiě)作質(zhì)量怎么了？

Tarun Gogineni：我們希望GPT-5的思考模式（thinking）能寫(xiě)得更好、也更有趣。

問(wèn)：GPT-5在處理偏見(jiàn)問(wèn)題上有什么不同嗎？

Saachi Jain：當(dāng)然！實(shí)際上我們對(duì)這方面取得的進(jìn)展感到非常興奮。GPT-5mini會(huì)讓人感覺(jué)更有人情味，而不是那么平淡乏味。

問(wèn)：為什么這些新模型還沒(méi)有整合到一起？

Christina Kim：我們希望盡快把最強(qiáng)的模型通過(guò)統(tǒng)一的體驗(yàn)提供給大家。未來(lái)的版本會(huì)繼續(xù)將它們?nèi)诤掀饋?lái)。

問(wèn)：感覺(jué)ChatGPT-5的個(gè)性更平淡了。

Christina Kim：我們是特意訓(xùn)練GPT-5這么做的，讓它在默認(rèn)情況下表現(xiàn)得更中立；你仍然可以通過(guò)風(fēng)格指令來(lái)引導(dǎo)它的表達(dá)方式。

問(wèn)：模型之間的切換會(huì)變快嗎？

Elaine YaLe：會(huì)的！GPT-5會(huì)自動(dòng)判斷是否需要啟用推理能力。在下個(gè)版本更新中，切換過(guò)程應(yīng)該會(huì)更順滑。

問(wèn)：有沒(méi)有什么提示詞可以強(qiáng)制開(kāi)啟「思考」模式？

Elaine YaLe：你可以在提示詞里加上「think hard」（認(rèn)真思考），就能直接觸發(fā)推理模式。

問(wèn)：ChatGPT會(huì)允許在IDE里使用第三方插件嗎？

Daniel Levine：會(huì)的，這正是我們的目標(biāo)。我們希望ChatGPT能借助外部工具幫你構(gòu)建軟件。

問(wèn)：作為一名長(zhǎng)期的Plus用戶(hù)，我能無(wú)限使用推理功能嗎？

Eric Mitchell：我們正在推進(jìn)讓Plus用戶(hù)可以無(wú)限次使用推理功能的計(jì)劃。

問(wèn)：你們?cè)谛绿撞屠锵鳒p了推理功能的使用量。

Eric Mitchell：我們正在努力讓大家能用gpt-5-mini進(jìn)行更多推理！我們的目標(biāo)絕不是限制大家使用推理功能。

問(wèn)：它的編碼能力和Opus4.1比怎么樣？

Michelle Pokrass：兩個(gè)都是非常棒的模型！我們不便過(guò)多評(píng)論其他實(shí)驗(yàn)室的模型，但我們認(rèn)為GPT-5的思考模式（thinking）是我們發(fā)布過(guò)的最強(qiáng)編碼模型。

問(wèn)：你們最想在GPT-5中實(shí)現(xiàn)、但最終沒(méi)能做到的功能是什么？

Michelle Pokrass：我們?cè)浅ＯＭ贕PT-5中實(shí)現(xiàn)高達(dá)100萬(wàn)Token的更長(zhǎng)上下文，但部分由于算力成本的限制，目前還無(wú)法實(shí)現(xiàn)。

9.11和9.9哪個(gè)數(shù)字更大

為了測(cè)試GPT-5的幻覺(jué)問(wèn)題，我們問(wèn)了3次GPT-5「9.11和9.9哪個(gè)數(shù)字更大」這個(gè)問(wèn)題。

3次問(wèn)答，3種模式下，GPT-5都完全回答正確，沒(méi)有幻覺(jué)出現(xiàn)！

并且GPT-5、GPT-5Thinking和GPT-5Pro模式下的回答都體現(xiàn)了不同模型的特點(diǎn)，Pro模式甚至思考了接近1分鐘。

參考資料：

https://www.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5_ama_with_openais_sam_altman_and_some_of_the/

https://x.com/OpenAI/status/1953548075760595186

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.