新智元報(bào)道
編輯:艾倫
【新智元導(dǎo)讀】直播事故、網(wǎng)友吐槽、專家唱衰……GPT-5登場第一天就遭遇口碑滑鐵盧。有人說這是AI泡沫破裂的前兆,也有人預(yù)言「第二個(gè)AI寒冬」或?qū)砼R。但奧特曼在近日接受Wired采訪時(shí)不認(rèn)輸,認(rèn)為這是一次被誤解的躍遷。真相究竟如何?
GPT-5的發(fā)布不算體面。
發(fā)布會(huì)直播中,演示圖表數(shù)據(jù)繪制錯(cuò)誤導(dǎo)致嚴(yán)重誤導(dǎo),被觀眾抓包;
網(wǎng)友直接在發(fā)布會(huì)視頻下面銳評(píng)并被點(diǎn)贊到第一位:「看吧,這肯定是用GPT-5做的PPT?!?/p>
Reddit上用戶吐槽,「更不靈光」「沒了GPT-4o的溫柔」;
AI專家Gary Marcus更是在多個(gè)平臺(tái)「慶功」,直言這款史上最被吹捧的AI模型沒達(dá)標(biāo),AGI和「博士級(jí)認(rèn)知」連邊都沒碰到。
質(zhì)疑聲席卷而來,一些人甚至喊出「AI第二次寒冬要來了」。
但OpenAI顯然不這么認(rèn)為。
奧特曼事后接受采訪時(shí)坦言:「確實(shí),發(fā)布當(dāng)天的氛圍不太妙?!?/p>
不過他說,這不是模型能力的問題,而是節(jié)奏錯(cuò)了,期待錯(cuò)位了。
換句話說,GPT-5不是不行,而是大家看它的角度出了偏差。
為什么這代GPT升級(jí)
普通人感覺不到
要理解這點(diǎn),得先搞清楚一個(gè)問題:GPT-5到底進(jìn)化了什么?
OpenAI的解釋是——這一代的提升主要集中在科研、數(shù)學(xué)、代碼等高階領(lǐng)域。
奧特曼舉了個(gè)例子:有物理學(xué)家說GPT-5幫他解開了研究瓶頸;生物學(xué)家驚嘆它在某個(gè)難題上「想得出奇」。
可問題是,這些例子沒人實(shí)名,也不是每個(gè)人都用得上。
正如奧特曼自己也承認(rèn):「大多數(shù)人不是物理研究員?!?/p>
于是,「進(jìn)步」變得不明顯,甚至成了「退步」。
再看幾個(gè)更具體的細(xì)節(jié):
在數(shù)學(xué)能力上,GPT-5已經(jīng)可以躋身「國際數(shù)學(xué)奧賽前五名」——而GPT-4還在「Top 200」徘徊();
在代碼推理方面,GPT-5能更準(zhǔn)確地識(shí)別多步邏輯錯(cuò)誤,甚至可以做部分單元測試的自動(dòng)化;
它更擅長寫論文摘要、提出科學(xué)假設(shè),部分實(shí)驗(yàn)室已開始小規(guī)模應(yīng)用。
這些變化,普通用戶幾乎感受不到。也正因此,它被誤會(huì)成了「換皮產(chǎn)品」。
GPT的技術(shù)范式
已經(jīng)偷偷改道了
過去幾年,OpenAI的策略是「投喂更多數(shù)據(jù) + 更大模型 + 更強(qiáng)算力」,一條路走到底。
但到了GPT-5,事情變了。
這一代模型的能力,不是靠數(shù)據(jù)量或算力暴力增長堆出來的。
核心升級(jí)源自:基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。
簡單說,就是找來一批專家,對(duì)模型輸出進(jìn)行評(píng)估、打分、反饋,再反復(fù)訓(xùn)練它「像專家一樣思考」。
更有意思的是:現(xiàn)在的模型已經(jīng)可以「喂自己吃東西」了。
Greg Brockman稱,當(dāng)模型不夠聰明時(shí),只能靠大模型訓(xùn)練;但一旦它有足夠的判斷力,就可以從自己的輸出中篩選優(yōu)質(zhì)內(nèi)容,再回過頭來教自己。
這個(gè)邏輯叫「自采樣」(sampling from itself),是AI走向自我優(yōu)化的關(guān)鍵節(jié)點(diǎn)。
這場技術(shù)轉(zhuǎn)向帶來了很大的變化:
它更擅長處理復(fù)雜推理鏈條;
對(duì)幻覺和錯(cuò)誤率的控制更嚴(yán)格;
在專業(yè)場景的適應(yīng)性更強(qiáng)。
GPT變得更像一個(gè)滿嘴術(shù)語的專家了,但或許也和普通人之間交流的隔閡變深了。
OpenAI沒放棄規(guī)?;?/strong>
只是暫時(shí)「火力不足」
面對(duì)「規(guī)模化路線失敗」的批評(píng),OpenAI并不認(rèn)同。
雖然GPT-5并不是靠「多10倍顯卡」訓(xùn)練出來的,但他們并沒有停止投資基礎(chǔ)設(shè)施。
相反,奧特曼明確表示:我們依然相信規(guī)模,但現(xiàn)在的難度是物理級(jí)的。
以他們正在德州阿比林(Abilene, Texas)建設(shè)的數(shù)據(jù)中心為例,預(yù)算高達(dá)數(shù)百億美元。
Greg Brockman形容,這種規(guī)模的基建,「就像做一臺(tái)2倍大的火箭——難度是10倍以上」。
原因顯而易見:下一代模型的突破,不僅需要更聰明的訓(xùn)練策略,還要更大算力支撐,而現(xiàn)在的全球芯片與電力資源遠(yuǎn)遠(yuǎn)跟不上。
也就是說,強(qiáng)化學(xué)習(xí)是「當(dāng)下最優(yōu)解」,但真正把AI推向AGI級(jí)別,還是得靠規(guī)模發(fā)力。
AGI不再是一個(gè)終點(diǎn)
而是一種「持續(xù)影響力」
奧特曼過去幾年的演講里,AGI一直被描述為終極目標(biāo):「當(dāng)AI能完成大多數(shù)人類有價(jià)值的工作,我們就完成了使命?!?/p>
但最近,他換了說法。
現(xiàn)在的OpenAI認(rèn)為:AGI不是終點(diǎn)站,而是一段旅程。
或者說,它是一個(gè)「指數(shù)式增長的過程」,而非某個(gè)模型突然變得「全能」。
這種轉(zhuǎn)向有兩個(gè)好處:
再也不需要設(shè)定一個(gè)「AGI發(fā)布日期」來背負(fù)壓力;
更適合以「科學(xué)進(jìn)展速度」為衡量標(biāo)準(zhǔn),而不是單次能力躍遷。
奧特曼的新定義里,AGI的核心是能參與推動(dòng)基礎(chǔ)科研進(jìn)步,比如物理理論、化學(xué)實(shí)驗(yàn)、藥物篩選。
正因如此,你會(huì)看到OpenAI內(nèi)部正在「品牌化」這個(gè)模糊概念:
員工筆電上貼著「FEEL THE AGI」;
總部一樓有賣同款T恤;
辦公區(qū)墻上貼滿「AI青春期」的解釋圖——指的是AI從「只會(huì)模仿」走向「有點(diǎn)意識(shí)」的尷尬階段。
OpenAI眼中的GPT-5,就是AGI的青春期。
你或許應(yīng)該更關(guān)注的是
今天它能幫你做多少事
GPT-5的爭議,其實(shí)是一場「敘事落差」:
公眾盼望的是「AI通關(guān)」,而OpenAI現(xiàn)在給的是「能力曲線」。
模型升級(jí)的路線,已經(jīng)從「炫技」轉(zhuǎn)向「內(nèi)功」。
奧特曼說,GPT-6會(huì)更好,GPT-7會(huì)更驚人。
但真正值得期待的,是你手里的模型,能不能今天就幫你少錯(cuò)一步、多做一點(diǎn)。
參考資料:
https://www.wired.com/story/sam-altman-says-the-gpt-5-haters-got-it-all-wrong/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.