新智元報(bào)道
編輯:元宇
【新智元導(dǎo)讀】GPT-5上線引發(fā)全網(wǎng)吐槽。8月14日,ChatGPT負(fù)責(zé)人Nick Turley深度復(fù)盤了GPT-5發(fā)布「風(fēng)波」,并詳細(xì)總結(jié)了此次產(chǎn)品發(fā)布中的失誤:比如過快下線GPT-4o、低估用戶會(huì)對(duì)模型的情感依戀、沒有讓用戶建立起「可預(yù)期性」等。Nick也分享了OpenAI的產(chǎn)品設(shè)計(jì)哲學(xué),要堅(jiān)持「真正對(duì)用戶有幫助」的原則。
「還我GPT-4o!」
GPT-5發(fā)布后不到一周,在用戶強(qiáng)大的反對(duì)聲浪中,OpenAI不得不火速宣布GPT-4o等前代模型回歸。
至此,大家才意識(shí)到:用戶對(duì)4o等上一代模型,已經(jīng)產(chǎn)生了深深的「依戀感」。
下線4o,已經(jīng)不再是產(chǎn)品升級(jí)那么簡(jiǎn)單了,更像是忽然從用戶身邊帶走了一位熟人或伙伴。
尤其是對(duì)于深度用戶來說,這一點(diǎn)更為明顯。他們很多都是4o等前代模型的忠實(shí)擁躉,反彈情緒也更為強(qiáng)烈。
這一點(diǎn)令A(yù)ltman,以及一直領(lǐng)導(dǎo)ChatGPT開發(fā)的Nick Turle都始料未及。
于是,便有了GPT-4o的火速回歸。
事實(shí)上,GPT-5的發(fā)布會(huì),給了OpenAI一個(gè)很好的反思產(chǎn)品的機(jī)會(huì)。
一周之后,Nick Turley在《The Verge》編輯Alex Heath的采訪中,深度復(fù)盤了GPT-5發(fā)布后面臨的用戶差評(píng)風(fēng)波,以及他的一些思考。
對(duì)談中,Nick詳細(xì)總結(jié)了GPT-5發(fā)布的一些失誤,比如:
過快下線GPT-4o、低估用戶會(huì)對(duì)模型的情感依戀、用一個(gè)模型適用所有用戶、沒有讓用戶建立起「可預(yù)期性」等。
Nick表示,OpenAI已經(jīng)認(rèn)識(shí)到持續(xù)迭代模型人格的重要性,并提到通過一個(gè)Model Behavior的團(tuán)隊(duì)來推動(dòng)這項(xiàng)工作。
同時(shí),Nick也分享了OpenAI的產(chǎn)品設(shè)計(jì)哲學(xué),是幫用戶解決長(zhǎng)期問題、達(dá)成長(zhǎng)期目標(biāo),而不是讓用戶盡可能留在產(chǎn)品里。
「真正對(duì)用戶有幫助」,才是其設(shè)計(jì)產(chǎn)品的核心原則。
忽視用戶情感
讓GPT-5發(fā)布后迎意外暴擊
忽視用戶的「依戀感」,讓GPT-5在發(fā)布不到一周后,便被網(wǎng)友錘爆了。
用Nick的話說,「很多意外都是寫進(jìn)常態(tài)的」。
但也沒辦法,ChatGPT現(xiàn)在有7億周活用戶:用戶太多,千人千面,眾口難調(diào)。
這搞得Nick著實(shí)頭大,幾天后他在接受《The Verge》采訪時(shí),仍在「消化」這次發(fā)布會(huì)所帶來的影響。
他先是總結(jié)了GPT-5發(fā)布的兩點(diǎn)失誤:
Nick:第一,GPT-4o下線走得太快了,至少在過渡期沒有繼續(xù)提供GPT-4o;第二,低估了用戶會(huì)對(duì)一個(gè)模型有如此強(qiáng)的情感依戀。真正的挑戰(zhàn),不在于產(chǎn)品本身的升級(jí),而是人們對(duì)模型「人格」的強(qiáng)烈感受。
這兩點(diǎn)失誤,讓Nick認(rèn)為應(yīng)當(dāng)更認(rèn)真地思考,如何在如此龐大的用戶基礎(chǔ)上進(jìn)行產(chǎn)品升級(jí)和管理。
Nick表示,OpenAI已快速修正了這兩點(diǎn)錯(cuò)誤。
一是將原有模型重新提供給ChatGPT付費(fèi)用戶;二是對(duì)GPT-5的個(gè)性進(jìn)行更新,上線了「選擇你自己的性格」的能力。
8月13日,Altman發(fā)布了ChatGPT的更新信息,已經(jīng)將4o恢復(fù)為所有付費(fèi)用戶的默認(rèn)模型,他們可以在網(wǎng)頁設(shè)置中切換o3、4.1、GPT-5 Thinking mini等其他模型。
Altman稱在過去幾天學(xué)到的一點(diǎn),是真正認(rèn)識(shí)到:要打造一個(gè)能夠根據(jù)用戶需求定制更多模型個(gè)性的世界——解決方案,就是要讓更多用戶能夠自由定制ChatGPT的風(fēng)格。
Nick提到了一個(gè)原則,要努力去理解4o身上的一些原本沒有被足夠認(rèn)識(shí)或重視的東西,比如模型人格對(duì)用戶的情感價(jià)值。在這方面,GPT-5也要向4o看齊,變得更溫暖和友好一些。
實(shí)際上,Sam Altman已經(jīng)在GPT-5發(fā)布后表示,在過去大約一年,OpenAI就一直在密切關(guān)注用戶對(duì)GPT-4o的「依戀感」,但并沒有太主流的關(guān)注。
這次發(fā)布會(huì)風(fēng)波,引發(fā)了OpenAI對(duì)ChatGPT產(chǎn)品「模型人格」的重視,這也是一個(gè)很好的優(yōu)化契機(jī)。
放棄模型選擇
用一個(gè)模型適用所有用戶
放棄模型選擇,試圖用一個(gè)模型搞定所有用戶,是OpenAI在GPT-5發(fā)布上的另一個(gè)失誤。
這導(dǎo)致了OpenAI在發(fā)布GPT-5時(shí),沒有做分階段發(fā)布。
Alex:這個(gè)決定背后的動(dòng)機(jī)是什么?是成本因素嗎?
Nick:這絕對(duì)不是成本問題,而是為了追求簡(jiǎn)單,這也是ChatGPT做產(chǎn)品一貫的核心原則。
在Nick看來,讓用戶自己去搞清楚「用哪個(gè)模型回答哪個(gè)問題」,認(rèn)知負(fù)擔(dān)非常重。
而且在用戶調(diào)查中,Nick也反復(fù)從用戶那里聽到:他們希望得到的是一個(gè)「產(chǎn)品」,不是一堆「模型」。如果OpenAI能根據(jù)問題,為他們做出合適的選擇,他們會(huì)很喜歡。
Nick一直認(rèn)為,大多數(shù)用戶需要的是像macOS這樣的產(chǎn)品:
既能面向大部人做到簡(jiǎn)單易用;同時(shí),對(duì)于深度用戶,他們也可以進(jìn)設(shè)置、打開終端、把各種開關(guān)和參數(shù)都調(diào)起來。
同樣,Nick也希望將ChatGPT做成macOS式的產(chǎn)品:
Nick:對(duì)于普通用戶簡(jiǎn)單易用,重度用戶也能按自己喜好配置一切——包括選擇自己最喜歡的模型。
因此,面對(duì)重度用戶,ChatGPT一直是堅(jiān)持要保留所有舊模型的。
但這次的失誤之處在于:他們?cè)?億用戶基礎(chǔ)之上,對(duì)重度用戶的分布產(chǎn)生了誤判,低估了在其他一些套餐中也存在很多重度用戶——正是這些重度用戶對(duì)舊模型的「依戀感」,讓他們?cè)诰W(wǎng)上掀起了反對(duì)聲浪。
沒有讓用戶建立起「可預(yù)期性」
凡是成功的產(chǎn)品,都有一個(gè)成功的「預(yù)期管理」。
符合或者超越用戶預(yù)期,必會(huì)贏得用戶追捧;違背或忽視用戶預(yù)期,勢(shì)必令用戶唾棄。
GPT-4o的過早下線,就是踩到了違背「用戶預(yù)期」的紅線。
隨著GPT-5,以及未來GPT-6等一系列新模型的發(fā)布,舊模型何時(shí)「退休」也被提上日程。
Alex:OpenAI對(duì)此是否有已經(jīng)有了明確安排?
Nick表示,這點(diǎn)十分必要,而且OpenAI也在著手做這件事。但必須堅(jiān)持一個(gè)重要原則:給用戶一定的「可預(yù)期性」,尤其是在目前用戶基數(shù)的前提下,這樣做尤其重要。
Nick:關(guān)于用戶的「可預(yù)期性」,在企業(yè)版里OpenAI已經(jīng)這么做了。目前的做法,更像是將這一原則進(jìn)一步拓展。
這也是此次發(fā)布會(huì),OpenAI獲得的一個(gè)非常明確的經(jīng)驗(yàn)教訓(xùn)。
談到4o的「退休時(shí)間」,Nick表示,目前并沒有一個(gè)具體的時(shí)間表。
Nick:我們想先真正搞清楚4o擅長(zhǎng)的地方。如果沒有非要讓它下線的重大理由,我很樂意把它保留下來。
為了保持用戶的「可預(yù)期性」,Nick稱,未來4o真的要下線,一定會(huì)提前溝通。
所以,具體怎么做,取決于我們學(xué)到了什么。
Nick:我覺得這件事需要多去傾聽,這也是做 AI 非常獨(dú)特的一點(diǎn):你在發(fā)布之后會(huì)學(xué)到海量信息?;谶@些,我們會(huì)拿出正確的方案。
模型人格與「優(yōu)化哲學(xué)」
與其猜測(cè)4o何時(shí)下線,更讓Nick感興趣的問題是:
到底大家是喜歡4o本身,還是喜歡4o身上的某些具體特質(zhì)?
比如,假設(shè)用戶喜歡它「人格更有溫度」,OpenAI也會(huì)把這個(gè)特質(zhì)帶到GPT-5上。
Nick稱,OpenAI已經(jīng)認(rèn)識(shí)到持續(xù)迭代模型人格的重要性,并通過一個(gè)叫「Model Behavior」的團(tuán)隊(duì)來推動(dòng)這項(xiàng)工作。
此外,還會(huì)通過Model Spec(模型行為規(guī)范文檔),來幫助開發(fā)者和研究人員理解和審視模型行為,明確某些行為是設(shè)計(jì)上的有意為之,還是潛在的bug。
Nick:在未來幾周甚至幾個(gè)月內(nèi),還將持續(xù)迭代GPT-5的「感覺」和「行為」。這次GPT-5的發(fā)布,也為繼續(xù)做這件事提供了一個(gè)好時(shí)機(jī)。
Alex Heath提到了這次4o下線后,用戶在Reddit上的驚人反應(yīng):
「有人說,我一夜之間失去了朋友。這是我唯一的朋友;感覺像有人去世了;我不敢跟GPT-5說話,因?yàn)楦杏X像是在「出軌」;我感覺丟了那個(gè)很有同理心的同事……」
Alex:用戶的反應(yīng)為OpenAI帶來了什么影響?為什么之前沒有充分意識(shí)到,大家會(huì)有這么強(qiáng)烈的情感依戀?
Nick回答說,其實(shí)OpenAI內(nèi)部已經(jīng)關(guān)注這類現(xiàn)象有一段時(shí)間了。與此同時(shí),他們也一直在擔(dān)心:出現(xiàn)一個(gè)人們過度依賴AI的世界。
但讓Nick沒想到的是,人們會(huì)對(duì)某個(gè)「特定模型」產(chǎn)生這么強(qiáng)的感情——而不是對(duì)整個(gè)產(chǎn)品。
Nick:實(shí)際上,GPT-5已經(jīng)解決了很多大家對(duì)4o的建設(shè)性反饋,甚至在整體氛圍上也做了改進(jìn)。但很多網(wǎng)友對(duì)此并不認(rèn)賬。
Reddit上的評(píng)論,讓Nick覺得很有意思,它們顯示出用戶群體的極度「分化」:
Nick:有人特別愛4o,也有人強(qiáng)烈認(rèn)為GPT-5更好,大家對(duì)自己選擇的「熱情程度」非常驚人。
用戶的反饋,對(duì)Nick也有點(diǎn)「重新校準(zhǔn)」的意味。
Nick提到,他在一兩周前,曾寫過一篇博客,在里面花了不少篇幅講ChatGPT的「優(yōu)化哲學(xué)」。
他非常想強(qiáng)調(diào)的一點(diǎn)是:
Nick:我們的目標(biāo),不是讓用戶盡可能留在產(chǎn)品里;相反,而是要幫用戶解決長(zhǎng)期問題、達(dá)成長(zhǎng)期目標(biāo)。這在很多時(shí)候其實(shí)意味著「在產(chǎn)品里花更少時(shí)間」。
所以,當(dāng)Nick看到人們把GPT視作自己唯一而且最好的朋友時(shí),這并不是他想在ChatGPT里主動(dòng)營(yíng)造的東西。
相反,Nick將這種「過度停留」,視作一種副作用。
比如就在8月16日,OpenAI宣布會(huì)讓GPT-5由以前的過于正式,變?yōu)楦訙嘏陀押脮r(shí),也有網(wǎng)友反對(duì)讓GPT-5過度人格化。
如何衡量產(chǎn)品對(duì)用戶的價(jià)值,這是一個(gè)值得認(rèn)真對(duì)待和深入研究的問題,OpenAI也在這個(gè)問題上不斷探索。
如何讓7億用戶
可以毫不含糊地說YES
Alex Heath問了一個(gè)有關(guān)產(chǎn)品設(shè)計(jì)的靈魂問題:
Alex:如何平衡「產(chǎn)品目標(biāo)」與「用戶實(shí)際使用方式」之間的張力?
Nick說,當(dāng)你在7億用戶的規(guī)模上運(yùn)營(yíng),就不得不面對(duì)一個(gè)現(xiàn)實(shí):你可以有正確而純粹的目標(biāo),你也可以盡最大努力按照這些目標(biāo)來構(gòu)建產(chǎn)品。
在如何選擇上,Nick提到了一個(gè)重要原則——「真正對(duì)用戶有幫助」。
甚至,有時(shí)要說出用戶可能不愛聽的話。
基于這一原則,OpenAI也對(duì)產(chǎn)品做了一系列調(diào)整:
比如,OpenAI通過與多個(gè)國(guó)家和大量心理健康專業(yè)人士交流,理解當(dāng)人們過度使用產(chǎn)品,或者在不太健康的狀態(tài)下使用產(chǎn)品時(shí),該如何處理。
并以此修改模型行為,為模型上線了「過度使用提醒」,當(dāng)用戶以極端頻率使用ChatGPT時(shí),它會(huì)輕輕提醒你。
Nick提到了特別重要的一點(diǎn),也回應(yīng)了公眾對(duì)OpenAI是否會(huì)探索廣告模式的猜測(cè):
Nick:我們其實(shí)并沒有任何「讓你在產(chǎn)品里花更多時(shí)間」的特別動(dòng)機(jī);我們的商業(yè)模式非常簡(jiǎn)單:基礎(chǔ)產(chǎn)品免費(fèi),如果你喜歡更多功能,就訂閱。沒有第二層目的。
在這一原則下,Nick也提到了檢驗(yàn)好產(chǎn)品的標(biāo)準(zhǔn),這也是他們經(jīng)常給自己設(shè)的「思想實(shí)驗(yàn)」:
Nick:如果你認(rèn)識(shí)的人正經(jīng)歷困難,或許剛失戀,或許對(duì)人生感到迷?!銜?huì)不會(huì)真的、毫不猶豫、很有信心地推薦他/她使用ChatGPT?
Nick表示,對(duì)于OpenAI來說,這就是標(biāo)準(zhǔn)。他們會(huì)一直做到自己也有這種底氣為止,在此之前他們不會(huì)停下來。
當(dāng)然,Nick也坦言,有時(shí)這也是一道艱難的選擇題。
比如,當(dāng)有人向你尋求人生建議,或者陷入困境時(shí),你完全可以很輕松地把這些用例直接關(guān)掉,對(duì)用戶說:「抱歉,這個(gè)我?guī)筒涣四??!?/p>
這樣做的確是條「容易的出路」,但Nick和OpenAI想要選擇的,顯然是那條「難而正確的」道路,就是為那些沒有資源、沒人可聊的人,提供一個(gè)好的產(chǎn)品,做到讓用戶「可以毫不含糊地說 YES」的程度。
GPT-5發(fā)布
傷害ChatGPT了嗎
Alex:GPT-5對(duì)ChatGPT的使用有沒有傷害?你們內(nèi)部統(tǒng)計(jì)的總體數(shù)字是在上漲嗎?最重度用戶的使用是在下降嗎?
面對(duì)Alex Heath的提問,Nick對(duì)GPT-5的表現(xiàn)似乎很滿意:
Nick:使用和增長(zhǎng)看起來都很不錯(cuò),和我們的直覺也高度一致;我們?cè)诘?天看到API的調(diào)用量大幅增長(zhǎng)——也就是開發(fā)者在用GPT-5搭建東西;在ChatGPT里,我們也看到了非常積極的增長(zhǎng)。
用戶分層不同,也會(huì)影響到對(duì)產(chǎn)品的評(píng)價(jià),這也是為什么Nick提到,在為這么多不同的用戶構(gòu)建產(chǎn)品時(shí),你會(huì)有點(diǎn)困惑:
Nick:一方面,有一小撮重度用戶,我認(rèn)為他們對(duì)我們?nèi)绾瓮瞥鯣PT-5的反饋非常有道理;另一方面,還有大批更典型的普通用戶,對(duì)他們來說,這可能是第一次真正看到、接觸「推理模型」這一概念,以及它能帶來的火花。這也會(huì)體現(xiàn)在我們的數(shù)據(jù)里。
正如Reddit上兩級(jí)分化的用戶評(píng)論,GPT-5發(fā)布時(shí)間還很短,Nick并不太想下結(jié)論,但所有指標(biāo)都是偏正面的。
Nick認(rèn)為,除了看數(shù)據(jù)之外,還要「待在重度用戶所在的地方」,因?yàn)閿?shù)據(jù)可能不足以反映他們的情緒。
Alex Heath似乎不依不饒,問:
Alex:既然整體指標(biāo)不錯(cuò),為什么還要把4o帶回來?我推測(cè)托管就模型也會(huì)有成本。如果指標(biāo)沒受傷害,為什么要這么做?
Nick回答道,打造偉大產(chǎn)品的方式是「同時(shí)服務(wù)兩端」:
Nick:一端是普通用戶,比如我們的家人,他們可能離AI還比較遠(yuǎn);另一端是極端的重度用戶。二者之間「詭異的中間地帶」通常不是好位置。
這也是Nick以macOS類比ChatGPT的原因:他會(huì)參考這樣的產(chǎn)品是如何處理這一問題的。
Nick并不諱言,服務(wù)舊模型是有成本的。但他更希望能從長(zhǎng)遠(yuǎn)投入,打造一個(gè)出色的產(chǎn)品。過于盯著短期指標(biāo),通常是把一個(gè)產(chǎn)品帶向下坡路的方式。
Alex Heath提到了「模型選擇」的回歸,雖然他能感受到「切換模型」所造成的認(rèn)知負(fù)擔(dān),但仍為此高興。
對(duì)此,Nick回應(yīng)說,會(huì)為重度用戶,也就是那些可以理解模型,也愿意處理選擇模型這層復(fù)雜性的用戶提供「模型選擇」。
但對(duì)于普通用戶,則不必為「切換什么模式」費(fèi)心,他們可以直接問模型問題,或者讓它幫忙做事。
「我們會(huì)為90%的人保持簡(jiǎn)潔;然后為那群聲音更大的重度用戶提供他們想要的完整列表。這是一個(gè)兼顧兩邊的平衡方式?!筃ick說。
這也是應(yīng)對(duì)網(wǎng)友對(duì)GPT-5口碑兩極分化的好方法。
參考資料:
https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-interview
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.