新智元報(bào)道
編輯:定慧 好困
【新智元導(dǎo)讀】奧特曼和OpenAI團(tuán)隊(duì)回應(yīng)關(guān)于GPT-5的所有問(wèn)題。
GPT-5發(fā)布會(huì),大家都看了吧~
感覺(jué)現(xiàn)在整個(gè)世界,都在討論GPT-5。
網(wǎng)友們都吵翻了天,直播的時(shí)候跑分圖都能畫(huà)錯(cuò),這也算AGI?更有網(wǎng)友哭著喊著:還我GPT-4o!
但另一邊呢?畫(huà)風(fēng)完全不一樣,很多網(wǎng)友實(shí)測(cè)后表示「GPT-5強(qiáng)無(wú)敵」。
這種又愛(ài)又恨的奇妙感覺(jué),恰恰說(shuō)明了一件事:我們對(duì)AGI,太期待了!
這種讓整個(gè)AI圈子都「炸鍋」的盛況,上一次或許還是ChatGPT橫空出世那會(huì)兒。
2022年11月30日,ChatGPT上線(xiàn),才短短不到3年,我們對(duì)于GPT-5的期待已經(jīng)是AGI了!
這世界,因?yàn)?/strong>AI,真的變得太快了。
面對(duì)GPT-5發(fā)布后的所有的疑問(wèn)和口誅筆伐,奧特曼,終于回應(yīng)了這一切。
奧特曼「回應(yīng)」所有問(wèn)題
首先是,面對(duì)沸騰的輿論,GPT-5剛剛發(fā)布后的第一時(shí)間,奧特曼就表示要進(jìn)行一波全面更新。
我們會(huì)繼續(xù)努力保障系統(tǒng)穩(wěn)定,并持續(xù)聽(tīng)取大家的反饋。
一次性上線(xiàn)這么多新東西,我們預(yù)料到過(guò)程會(huì)有些磕磕絆絆。
但實(shí)際的波折比我們預(yù)想的還要多一些!
在完成全面部署后,我們會(huì)將ChatGPT Plus用戶(hù)的GPT-5使用限額翻倍。
Plus用戶(hù)將可以選擇繼續(xù)使用4o。我們會(huì)持續(xù)關(guān)注其使用情況,并依此來(lái)決定舊版模型會(huì)保留多久。
從今天起,GPT-5會(huì)感覺(jué)更智能。(昨天,模型的自動(dòng)切換器出了故障,宕機(jī)了大半天,導(dǎo)致GPT-5表現(xiàn)得笨了很多。)
我們將讓你更清楚地看到,回答每一個(gè)問(wèn)題的究竟是哪個(gè)模型。
我們會(huì)調(diào)整用戶(hù)界面,讓用戶(hù)可以更方便地手動(dòng)觸發(fā)模型的「思考」過(guò)程。
向所有用戶(hù)完全開(kāi)放的過(guò)程比我們預(yù)想的要長(zhǎng)一些。這畢竟是一次規(guī)模龐大的系統(tǒng)性變更。
舉個(gè)例子,在過(guò)去24小時(shí)里,我們的API流量就幾乎翻了一倍…(雖然大家嘴上罵著,但是都管不住手?。?br/>
我們確實(shí)低估了用戶(hù)會(huì)如此看重GPT-4o的某些特性,即便GPT-5在絕大多數(shù)方面都表現(xiàn)得更好。
關(guān)于GPT-4o和GPT-5(Chat版本)的相對(duì)優(yōu)劣,用戶(hù)們的看法大相徑庭。
這件事讓我們明白,不存在一個(gè)能滿(mǎn)足所有人的模型,我們需要為不同用戶(hù)提供好的個(gè)性化定制方案。
我們正在集中精力完成GPT-5的全面推送并確保系統(tǒng)穩(wěn)定。
OpenAI GPT-5團(tuán)隊(duì)「回應(yīng)一切」
與此同時(shí),每次發(fā)布會(huì)后的「例行公事」AMA問(wèn)答環(huán)節(jié)也已完成,奧特曼和眾多高管在線(xiàn)答疑。
太長(zhǎng)不看版:
GPT-4o回歸:Plus用戶(hù)將重新獲得4o的使用權(quán)限,支持時(shí)長(zhǎng)取決于使用情況;
是否同時(shí)提供4o/4.1與GPT-5正在研究中。
考慮推出不限量模式。(以前的Plus用4.1是無(wú)限的)
GPT-5將自動(dòng)啟用推理能力,下次更新會(huì)讓切換更順滑,可用「think hard」強(qiáng)制進(jìn)入推理模式。
新語(yǔ)音模型:更快、更好地遵循指令。
將支持IDE中使用第三方插件。
偏見(jiàn)處理更好,GPT-5 mini更有人情味。
計(jì)劃讓Plus用戶(hù)無(wú)限次使用推理模型,并提升GPT-5 mini推理的使用額度。
遺憾的是,由于算力成本限制,沒(méi)能實(shí)現(xiàn)100萬(wàn)Token的上下文。
AMA問(wèn)答參與成員:
·奧特曼(CEO)
·Sulman Choudhry(工程)
·Yann Dubois(研究)
·Alexander Embiricos(產(chǎn)品)
·Tarun Gogineni(研究)
·Saachi Jain(安全)
·Christina Kim(研究)
·Elaine YaLe(研究)
·Daniel Levine(產(chǎn)品)
·Eric Mitchell(研究)
·Michelle Pokrass(研究)
·Max Schwarzer(研究)
問(wèn):請(qǐng)讓4o回歸吧。別移除不同的模型版本,大家各有所好。
奧特曼:好的,我們都聽(tīng)到了大家對(duì)4o的呼聲;我們會(huì)為Plus用戶(hù)重新上線(xiàn)4o,并會(huì)根據(jù)使用情況來(lái)決定支持它多久。
問(wèn):請(qǐng)給我們一個(gè)選項(xiàng),可以同時(shí)使用GPT-4o/4.1和GPT-5。
奧特曼:我們正在研究這個(gè)問(wèn)題。是必須同時(shí)擁有4o和4.1,還是只有4o就夠了?
問(wèn):別忘了Plus訂閱用戶(hù)曾經(jīng)有過(guò)不限量的模型。
奧特曼:我們是該搞一個(gè)不限量的東西!
問(wèn):之前那幾張圖表是怎么回事?看起來(lái)很有誤導(dǎo)性。
奧特曼:圖里的數(shù)據(jù)是準(zhǔn)確的,但柱狀圖和演示文稿搞砸了。當(dāng)初壓根就不該放出那張幻燈片。我們正在整理一份更好的對(duì)比數(shù)據(jù)供大家參考。
問(wèn):現(xiàn)在大多數(shù)人還是把ChatGPT當(dāng)聊天機(jī)器人用。它的用途將會(huì)如何演變?
Sulman Choudhry:ChatGPT正在為用戶(hù)完成越來(lái)越多具有經(jīng)濟(jì)價(jià)值的工作。人與ChatGPT的互動(dòng)方式,應(yīng)該從「提問(wèn)」逐漸轉(zhuǎn)變?yōu)?strong>更適合「做事」的模式。隨著大家學(xué)會(huì)用新的方式來(lái)使用ChatGPT,這一轉(zhuǎn)變會(huì)逐步發(fā)生。
問(wèn):ChatGPT語(yǔ)音功能自發(fā)布以來(lái)有什么改進(jìn)嗎?
Sulman Choudhry:我們昨天上線(xiàn)了一個(gè)新的語(yǔ)音模型,它在指令遵循和響應(yīng)速度上都更加出色。
問(wèn):你們會(huì)直接集成類(lèi)似Cursor的功能嗎?
Alexander Embiricos:你試過(guò)Codex CLI嗎?這是我們的開(kāi)源編碼智能體,可以在本地運(yùn)行。
問(wèn):GPT-4.5的寫(xiě)作質(zhì)量怎么了?
Tarun Gogineni:我們希望GPT-5的思考模式(thinking)能寫(xiě)得更好、也更有趣。
問(wèn):GPT-5在處理偏見(jiàn)問(wèn)題上有什么不同嗎?
Saachi Jain:當(dāng)然!實(shí)際上我們對(duì)這方面取得的進(jìn)展感到非常興奮。GPT-5mini會(huì)讓人感覺(jué)更有人情味,而不是那么平淡乏味。
問(wèn):為什么這些新模型還沒(méi)有整合到一起?
Christina Kim:我們希望盡快把最強(qiáng)的模型通過(guò)統(tǒng)一的體驗(yàn)提供給大家。未來(lái)的版本會(huì)繼續(xù)將它們?nèi)诤掀饋?lái)。
問(wèn):感覺(jué)ChatGPT-5的個(gè)性更平淡了。
Christina Kim:我們是特意訓(xùn)練GPT-5這么做的,讓它在默認(rèn)情況下表現(xiàn)得更中立;你仍然可以通過(guò)風(fēng)格指令來(lái)引導(dǎo)它的表達(dá)方式。
問(wèn):模型之間的切換會(huì)變快嗎?
Elaine YaLe:會(huì)的!GPT-5會(huì)自動(dòng)判斷是否需要啟用推理能力。在下個(gè)版本更新中,切換過(guò)程應(yīng)該會(huì)更順滑。
問(wèn):有沒(méi)有什么提示詞可以強(qiáng)制開(kāi)啟「思考」模式?
Elaine YaLe:你可以在提示詞里加上「think hard」(認(rèn)真思考),就能直接觸發(fā)推理模式。
問(wèn):ChatGPT會(huì)允許在IDE里使用第三方插件嗎?
Daniel Levine:會(huì)的,這正是我們的目標(biāo)。我們希望ChatGPT能借助外部工具幫你構(gòu)建軟件。
問(wèn):作為一名長(zhǎng)期的Plus用戶(hù),我能無(wú)限使用推理功能嗎?
Eric Mitchell:我們正在推進(jìn)讓Plus用戶(hù)可以無(wú)限次使用推理功能的計(jì)劃。
問(wèn):你們?cè)谛绿撞屠锵鳒p了推理功能的使用量。
Eric Mitchell:我們正在努力讓大家能用gpt-5-mini進(jìn)行更多推理!我們的目標(biāo)絕不是限制大家使用推理功能。
問(wèn):它的編碼能力和Opus4.1比怎么樣?
Michelle Pokrass:兩個(gè)都是非常棒的模型!我們不便過(guò)多評(píng)論其他實(shí)驗(yàn)室的模型,但我們認(rèn)為GPT-5的思考模式(thinking)是我們發(fā)布過(guò)的最強(qiáng)編碼模型。
問(wèn):你們最想在GPT-5中實(shí)現(xiàn)、但最終沒(méi)能做到的功能是什么?
Michelle Pokrass:我們?cè)浅OM贕PT-5中實(shí)現(xiàn)高達(dá)100萬(wàn)Token的更長(zhǎng)上下文,但部分由于算力成本的限制,目前還無(wú)法實(shí)現(xiàn)。
9.11和9.9哪個(gè)數(shù)字更大
為了測(cè)試GPT-5的幻覺(jué)問(wèn)題,我們問(wèn)了3次GPT-5「9.11和9.9哪個(gè)數(shù)字更大」這個(gè)問(wèn)題。
3次問(wèn)答,3種模式下,GPT-5都完全回答正確,沒(méi)有幻覺(jué)出現(xiàn)!
并且GPT-5、GPT-5Thinking和GPT-5Pro模式下的回答都體現(xiàn)了不同模型的特點(diǎn),Pro模式甚至思考了接近1分鐘。
參考資料:
https://www.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5_ama_with_openais_sam_altman_and_some_of_the/
https://x.com/OpenAI/status/1953548075760595186
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.