你對OpenAI在8月7日上線的最新版本ChatGPT「GPT-5」有什么反應(yīng)?這家開發(fā)公司聲稱GPT-5的發(fā)布是能改變世界的重大發(fā)展,前期造勢了好幾個星期,還舉行高調(diào)的在線直播展示功能。然而,社交媒體用戶的反應(yīng)相對冷淡,許多人對于他們已習(xí)慣使用的好幾個重要模型被拿掉感到困惑與憤怒。
事后,首席執(zhí)行官奧特曼(Sam Altman)無意間揭露了為什么OpenAI對GPT-5市場反應(yīng)的預(yù)期,與現(xiàn)實之間有如此巨大的落差。
《Fast Company》科技記者史托克·沃克(Chris Stokel-Walker)指出,原因在于很多人并沒有把AI的功能發(fā)揮到極致。奧特曼在X(前推特)平臺的一則貼文中,解釋了為什么外界覺得OpenAI在“坑”付費的Plus用戶。這些人每月支付20美元來使用第二高等級版本的模型,結(jié)果OpenAI大幅降低了這些用戶使用聊天機器人的頻率上限。
奧特曼也在貼文中透露,GPT-5推出之前,只有1%免費用戶曾經(jīng)呼叫過像o3這類“推理模型”,付費用戶中也只有7%這么做。
所謂推理模型,是指在回答前會先「思考」問題的模型。
史托克·沃克比喻,不使用這些模型,就好比買了一輛車只用一、二檔,然后抱怨開起來不順,或參加益智節(jié)目時,每個問題都脫口回答第一個想到的答案。
許多用戶在與AI聊天機器人互動時,會優(yōu)先考慮速度與方便,而非答案質(zhì)量。這也是為什么那么多人對GPT-4o的消失感到惋惜。這個舊模型直到一波有組織的用戶發(fā)起行動后,才重新開放給付費用戶使用。
史托克·沃克強調(diào),向聊天機器人尋求解答時,比起速度,你應(yīng)該更在乎答案的質(zhì)量。就算稍微慢一點(而且通常只是慢一點點)卻非常正確,比快速但完全錯誤要好。
推理模型的設(shè)計,是在回答前投入更多運算資源來規(guī)劃、檢查與反覆推敲。
這種額外的思考流程,能在需要邏輯正確的任務(wù)上提升結(jié)果的質(zhì)量。缺點是比較慢、成本更高,因此服務(wù)商往往會先提供“不思考”版本,讓用戶需要透過下拉選單自行切換到其他選項。
而OpenAI過去那種讓人難以理解的模型命名法,也讓用戶很難分辨自己用的是“高思考能力”版GPT-5還是能力較低的版本。
GPT-5試圖解決這個問題。隨著GPT-5上線,ChatGPT會先分析你的提問,再自行決定要使用哪一個模型。這種做法好壞參半。如果你從來沒試過GPT-4o以外的模型,GPT-5自動挑選更強大的模型,可能會讓你獲得更好的回應(yīng)。但另一方面,如果你是會仔細(xì)挑選模型的人,當(dāng)GPT-5在某個特定情況下選了跟你不同的模型,可能會感到沮喪。為了照顧這類用戶,OpenAI允許你手動切換GPT-5跟速度較慢但能力更強的GPT-5 Thinking。至于懷念GPT-4o的人,也可以在ChatGPT 的設(shè)定中開啟“顯示舊版模型”(Show Legacy Models)來使用它。
如果嫌高階模型的推理速度太慢,你啟動AI模型后,可以先去做點別的事再回來看結(jié)果。但顯然,對一些人來說,這樣的等待還是太久。
即使是在GPT-5發(fā)布后,“旗艦版”GPT-5和提供“更完整答案”的GPT-5推理版之間的差別變得更明顯時,也只有四分之一的付費用戶會選擇要求更完整的答案。
這些隨口拋出的數(shù)據(jù),解答了史托克·沃克一直以來的疑問,那就是為什么使用過聊天機器人的美國人當(dāng)中,只有三分之一認(rèn)為它“極為有用”或“非常有用”(只有AI專家認(rèn)同比例的一半),而有五分之一的人認(rèn)為它完全沒用(是AI專家比例的兩倍)。答案現(xiàn)在更清楚了,那就是多數(shù)人用AI的方法錯了。他們在問聊天機器人一些艱深、復(fù)雜的問題時,不讓它停下來思考,就直接輸出答案。
史托克·沃克建議,如果你要使用聊天機器人,可以善用OpenAI為了避免用戶取消訂閱提供的更多模型存取權(quán)限,讓它“思考”,看看會不會得到更優(yōu)質(zhì)的結(jié)果,這才是使用生成式AI的正確方式。*
資料來源:Fast Company、tidbits
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.