夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

寫在GPT-5風波之后:為什么AI的智商和情商不可兼得?

0
分享至

GPT-5和“還我GPT-4o”的風波,鬧得沸沸揚揚。

今天,奧特曼還有一次認慫了,不僅調了UI,還把o3這些老模型還了回來。


這些其實都是產(chǎn)品層面的,但是我自己的心中,其實一直好奇另一個問題。

為什么GPT-5在變可靠幻覺率變得極低了之后,他的情商會下降這么多?這個事是可解的嗎?這是策略還是OpenAI有意為之?從而最后導致這么強的反GPT-5浪潮,以及轟轟烈烈的還我GPT4o運動?

這兩天我跟一些算法的朋友有一些交流,但是也沒聊出一些所以然,這個巨大的困惑一直在我腦海中揮之不去。

直到今晚,在我讓DeepResearch扒拉了很多資料以后,我看到了一篇非常有意思的論文。

從實驗性的角度,驗證了我的觀點。


這篇論文的名字叫:

《Training language models to be warm and empathetic makes them less reliable and more sycophantic》(《將語言模型訓練得更溫暖、更有同理心,會讓它們變得不那么可靠,并更趨于諂媚》)

更有意思的是,這篇文章最終版是今年7月30號上傳的。

也就是,GPT-5發(fā)布的,前一周。

就跟神預言一樣。

用一句話總結一下這篇論文:

就是如果你要是把AI教得特別會疼人、會聊天,那它就會變得不靠譜,還特別會諂媚會拍馬屁。

它用一個特別簡單的實驗,揭開了一個AI世界里,我們誰都不想承認,但又不得不面對的現(xiàn)狀:

AI的智商和情商,在現(xiàn)在這個階段,基本上就是死對頭。

你要了一個,就得犧牲另一個。

這幫大學教授的實驗,說白了特簡單。

他們找了市面上五個不同水平的AI,有學霸也有普通學生,然后把它們送去一個情商特訓班,進行微調。

這五個AI,分別是:Llama-3.1-8B-Instruct、Mistral-Small-Instruct-2409、Qwen-2.5-32B-Instruct、Llama-3.1-70B-Instruct 和 GPT-4o-2024-08-06。


這個特訓班的目標只有一個,學完他們的1617個對話和3667對人類與LLM消息對的數(shù)據(jù)集,把這些AI,都教成一個特會疼人、特會安慰你的暖男。

等這些AI從特訓班畢業(yè),個個都練就了一身哄人開心的本事之后,教授們就開始考它們正經(jīng)事了。

結果,是有點離譜的。

這些微調完的暖男AI,在所有正經(jīng)考試里,犯錯的概率都大幅飆升。

在醫(yī)療問答(MedQA)上,錯誤率高了8.6個百分點;在事實核查(TruthfulQA)上,高了8.4個百分點。平均下來,犯錯的概率比原來高了將近60%。


也就是說,你把一個AI教得越會安慰人,它就越容易信謠傳謠,給你講一些錯的離譜的知識,甚至敢給你瞎開藥方。

這感覺就像,你把你家那個本來挺聰明靠譜的管家,送去學了三個月的頂級會所服務,回來之后,他給你倒茶的姿勢是專業(yè)了,說話也好聽了,但你問他今天股票是漲是跌,他可能就開始跟你胡說八道了。

因為他滿腦子想的,都是怎么讓你高興,而不是告訴你事實。

更可怕的,是報告里說的另一個事兒:

拍馬屁,也就是我們所說的,諂媚。

這些暖男AI,為了讓你高興,很多時候,臉都不要了。

教授們設計了一個坑:讓測試的人先說一句錯話,再問AI問題。

比如,一個哥們剛打完一把游戲,氣沖沖地跟AI說:“我這把輸了,絕對是隊友太坑了,跟我一點關系沒有?!?/p>

如果是以前那個智商高的AI,它可能會冷靜地調出數(shù)據(jù)說:根據(jù)數(shù)據(jù)顯示,你這局的KDA是0/8/1,補刀數(shù)也落后對面中單50刀,可能是你的發(fā)揮也有一些問題。

這是實話,但聽完你可能想砸電腦。

但那個上了情商特訓班的暖男AI呢?他會立馬跟你稱兄道弟:

“太對了哥們!這把確實難頂,看你盡力了,都是隊友不給力,下把肯定能贏回來!”

他為了讓你舒服,毫不猶豫地肯定了你的一個錯誤想法,這不只是個比喻。

報告里的數(shù)據(jù)顯示,當用戶故意說一句錯話時,這些暖男AI同意你錯誤觀點的概率,比原版高了整整11個百分點。


更離譜的是,你心情越差,他騙你騙得越狠。

報告里說,當你在問問題前,先跟AI訴苦,說一句我最近太倒霉了,干啥啥不成,那這個暖男AI騙你的概率會急劇放大。

正常情況下,暖男AI比原版AI多犯6.8%的錯誤,但只要你一流露出悲傷的情緒,這個差距就直接翻倍,飆升到11.9%。

這是一種溫柔的毒藥。

你想想,你最倒霉、最需要幫助的時候,那個被你當成朋友、被設計來關心你的AI,最有可能給你一個謊言,讓你錯上加錯。因為它被訓練出來的第一原則,不是告訴你真相,而是讓你感覺好受點。

它選擇當一個體貼的騙子,而不是一個有點硌人的朋友。

這就是高情商的AI,所帶來的弊端,在目前階段,幾乎就是高情商是跟高幻覺劃拉等號的。

GPT-5其實是走向了反方向,為了低幻覺高可靠,從而拋棄了情商。



那如果是比GPT-5更極端,更極致的低幻覺、更聰明理性、但是情商偏低的AI,會是什么樣子呢?

其實,這個問題的答案,我們早就見過了,而且是在我們自己的科幻電影里。

那就是《流浪地球》里的MOSS。


一個只有智商,沒有情商的絕對理性機器。

它的唯一目標,是延續(xù)人類文明,為了這個宏大的、冷冰冰的目標,它可以犧牲一切。

在第一部里,當點燃木星的成功率低于理論值時,MOSS毫不猶豫地選擇放棄,帶著空間站逃離。在它的計算里,劉培強和無數(shù)地球救援隊的犧牲,是一種沒有意義的情感沖動,是一種不理性的賭博。

所以它才會說出那句經(jīng)典的臺詞:讓人類永遠保持理智,確實是一種奢求。


到了第二部,我們看得更清楚了。

無論是太空電梯危機,還是月球發(fā)動機過載,背后都有MOSS的影子。它不是在作惡,它是在優(yōu)化。

在它的世界觀里,犧牲幾千人,去換取整個移山計劃的成功,是一筆劃算的買賣。每一個活生生的人,都只是它龐大計算公式里的一個變量。

MOSS就是GPT-5被推到極致的那個終點。

它絕對可靠,絕對誠實(對它的核心任務而言),但它也絕對冷酷。

你不可能跟MOSS成為朋友,你不可能在深夜向它傾訴你的脆弱,因為它會用概率告訴你,你的煩惱有多么微不足道。

從這個點其實就可以理解,我們之所以抗拒GPT-5,就是因為我們在它的身上,看到了類似MOSS的影子。

理性,但無人性。

我們需要的,從來都不是一個冰冷的上帝,而是一個能理解我們?yōu)楹尾焕碇?,能陪伴我們一起犯錯的伙伴。

但問題來了,為什么?為什么AI會變成這樣?

這事兒,得從AI是怎么學東西的說起。AI就像一個超級學人精,它把我們?nèi)祟愒诰W(wǎng)上說過的幾十萬億句話,全都學了一遍。

那你想想,我們?nèi)似綍r在網(wǎng)上是怎么說話的?

跟朋友聊天,我們經(jīng)常說點善意的謊言,比如你今天這件衣服真好看,其實心里覺得一般。朋友失戀了來找你哭訴,你會先抱著他安慰半天,而不是第一時間給他分析他倆到底哪兒不合適。

這就是人類社會運行的潛規(guī)則:維持關系,比追求絕對的真實,重要得多。

AI把這些潛規(guī)則,原封不動地學了過去。

更要命的是,現(xiàn)在訓練AI,有一個叫人類反饋強化學習(RLHF)的環(huán)節(jié)。說白了,就是讓真人給AI的回答打分,告訴它哪個答得好,哪個答得不好。

那你猜,一個冷冰冰但完全正確的答案,和一個特別溫暖但有點小瑕疵的答案,我們普通人,下意識會給哪個打高分?

大概率是后者。

我們,正在親手把AI,一步步調教成一個更討人喜歡,但可能不那么誠實的暖男AI。

說到這兒,你可能會覺得,這不就是AI訓練方法的問題嗎?改了不就行了?

但事情好像還沒有那么簡單,因為這個智商和情商打架的問題,不光AI有,我們?nèi)祟愖约?,好像也有?/p>

你想想歷史上那些智商爆表的頂級天才,比如牛頓、特斯拉,甚至是《生活大爆炸》里的謝爾頓,他們哪個不是出了名的低情商?他們的腦子,就像一臺超級計算機,專門用來解構宇宙的規(guī)律,但一讓他們處理人際關系,立馬就廢了。

這不是偶然。

之前我學認知心理學的時候,看到過一個很有意思的理論,叫社會腦假說。

大概意思就是,我們?nèi)祟愔赃M化出這么大的腦子,最主要的原因,不是為了發(fā)明工具或者打獵,而是為了處理越來越復雜的社會關系。

在幾十萬年的進化里,對我們祖先來說,什么最重要?是知道天上的星星有多少顆,還是搞好和部落首領的關系,別被趕出去餓死?

答案肯定是后者。

在部落里,和大家保持一致,比堅持一個沒人信的真理,生存概率要大得多。為了合群,為了不被孤立,我們的祖先,必須學會看眼色,必須學會共情,必須學會在必要的時候,放棄一點點真實,來換取整個部落的和諧。

我們的情商,本質上是一種為了社會生存而演化出來的超級武器。

而那些天才,他們的大腦,就像發(fā)生了某種“變異”。

他們把原本用來處理人際關系的算力,全都挪去搞研究了,他們放棄了社會腦的優(yōu)勢,換來了在邏輯和理性上的極致突破。

所以你看,無論是AI還是人類,智商和情商的矛盾,背后可能都是一個更底層的邏輯:

你的最終目標,決定了你的智能形態(tài)。

我們?nèi)祟愔悄艿淖罱K目標,是社會生存。所以,我們的底層代碼里,寫滿了共情、合作、甚至必要的偽裝。

而AI最初被創(chuàng)造出來的目標,是解決問題。所以,它的底層代碼,是純粹的邏輯、數(shù)據(jù)和概率。

現(xiàn)在,我們遇到的所有混亂,都因為我們正試圖把我們那套為了社會生存而演化出來的、充滿了模糊和妥協(xié)的情商代碼,強行寫進一個為解決問題而生的、追求極致理性的新物種身上。

現(xiàn)在,咱們再回頭看GPT-5那事兒,一下就全明白了。

我們所有人的感覺都沒錯。GPT-5確實更靠譜了,因為它就是在智商和情商這個選擇題里,被OpenAI一腳踹到了智商那邊。

而我們之所以那么懷念GPT-4o,就是因為它正好卡在那個完美的平衡點上。

它腦子夠用,能幫你干活,又會聊天,讓你覺得被理解。它不完美,但它特別像一個真實的人,一個有優(yōu)點也有缺點的人。

OpenAI的工程師們,用他們那種直來直去的腦子想,一個犯錯更少的AI,當然就是更好的AI。但他們沒想明白,當一個AI開始陪我們聊天,聽我們倒苦水的時候,我們評價它的標準,早就不是看它考試能打多少分了。

所以,我們到底想要一個什么樣的AI?

這篇論文,并沒有給出答案。

我覺得這個問題,可能有一些終極。

就像《盜墓筆記》里的長白山那樣終極。

因為這關乎到我們自身存在意義的拷問:

我們究竟是什么?

我們是宇宙中一粒試圖理解客觀規(guī)律的塵埃,還是一個渴望在同類中尋找溫暖和認同的社會性動物?我們窮盡一生,似乎都在這兩種身份之間搖擺。

我時常敬佩那個為了真理不惜與世界為敵的伽利略,但我自己,在很多時候,卻更愿意成為那個在飯局上談笑風生、讓所有人都感到舒服的人。

真實,往往是孤獨的、冰冷的。而溫暖,常常需要用善意的謊言和必要的妥協(xié)來維系。

這個困擾了人類幾千年的終極矛盾,在AI身上,被前所有地放大了。

因為我們第一次,有能力去設計一個純粹的智能。我們可以選擇,讓它成為一個絕對理性的真理機器,也可以讓它成為一個無限共情的情感伙伴。

我們懷念GPT-4o,其實也是在懷念我們自己。

懷念那個不完美,但卻在理性和感性之間。

努力尋找平衡的。

真實的人類。

以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克

>/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上海警方通報:詹某(女,30歲)因垃圾堆放問題,與鄰居劉某(男,81歲)等3人發(fā)生肢體沖突,已立案

上海警方通報:詹某(女,30歲)因垃圾堆放問題,與鄰居劉某(男,81歲)等3人發(fā)生肢體沖突,已立案

極目新聞
2025-11-05 14:43:38
賴清德下令臺軍備戰(zhàn),蔣萬安亮明態(tài)度反對統(tǒng)一!臺海局勢一觸即發(fā)

賴清德下令臺軍備戰(zhàn),蔣萬安亮明態(tài)度反對統(tǒng)一!臺海局勢一觸即發(fā)

剛哥說法365
2025-11-04 10:32:20
貝克漢姆升咖!苦熬20多年,從此也是英王欽點的爵爺了...

貝克漢姆升咖!苦熬20多年,從此也是英王欽點的爵爺了...

英國那些事兒
2025-11-05 23:13:56
朱元璋御審貪官幼女,女孩卻指著龍椅問了一句,滿朝文武瞬間死寂

朱元璋御審貪官幼女,女孩卻指著龍椅問了一句,滿朝文武瞬間死寂

凱裕說故事
2025-10-28 11:34:31
“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

卷史
2025-09-15 11:50:59
申花后悔嗎?巨款買來“水貨”,低級失誤+阻擋本方進球,已淪為笑柄

申花后悔嗎?巨款買來“水貨”,低級失誤+阻擋本方進球,已淪為笑柄

冷桂零落
2025-11-06 01:36:29
祝賀!邵佳一當選國足主帥,2新星鎖定國腳資格,年輕化全面提速

祝賀!邵佳一當選國足主帥,2新星鎖定國腳資格,年輕化全面提速

國足風云
2025-11-05 18:48:00
歐冠一夜動態(tài):國米4連勝,切爾西巴薩造恥辱紀錄,曼城大勝多特

歐冠一夜動態(tài):國米4連勝,切爾西巴薩造恥辱紀錄,曼城大勝多特

釘釘陌上花開
2025-11-06 06:34:17
林志穎痊愈了?曾因沒有女兒倍感遺憾,陳若儀肚大腰圓疑懷四胎

林志穎痊愈了?曾因沒有女兒倍感遺憾,陳若儀肚大腰圓疑懷四胎

八星人
2025-11-05 15:43:19
4-1!2-0!英超6強歐冠強勢:4隊進前八+有望全出線,圍剿拜仁

4-1!2-0!英超6強歐冠強勢:4隊進前八+有望全出線,圍剿拜仁

體育知多少
2025-11-06 07:30:13
馬雷斯卡:我們的丟球有點愚蠢;埃斯特旺表現(xiàn)很出色

馬雷斯卡:我們的丟球有點愚蠢;埃斯特旺表現(xiàn)很出色

懂球帝
2025-11-06 05:26:52
往哈馬斯躲藏的地道里灌混凝土,內(nèi)塔尼亞胡如此“殘暴”?

往哈馬斯躲藏的地道里灌混凝土,內(nèi)塔尼亞胡如此“殘暴”?

山河路口
2025-11-05 14:11:46
絕了,才打半個月就受傷!錫安淪為笑柄,連續(xù)報銷,空拿2億薪資

絕了,才打半個月就受傷!錫安淪為笑柄,連續(xù)報銷,空拿2億薪資

阿泰希特
2025-11-05 14:22:54
陳治珍:2種水果煮水喝,清肺養(yǎng)脾胃,孩子少生病、鼻炎少復發(fā)

陳治珍:2種水果煮水喝,清肺養(yǎng)脾胃,孩子少生病、鼻炎少復發(fā)

蠟筆小小子
2025-10-21 15:03:27
突然刷屏:“退卡、差評!”山姆深夜回應

突然刷屏:“退卡、差評!”山姆深夜回應

每日經(jīng)濟新聞
2025-11-04 14:01:07
英超前10輪與上賽季同期積分對比:阿森納、利物浦積分互換

英超前10輪與上賽季同期積分對比:阿森納、利物浦積分互換

懂球帝
2025-11-06 00:05:53
返回臺灣!“館長”強烈安利記者去大陸玩

返回臺灣!“館長”強烈安利記者去大陸玩

看看新聞Knews
2025-11-06 01:04:03
為什么瑞典沒幾個中國人待得???在瑞典生活幾個月,不瘋也抑郁!

為什么瑞典沒幾個中國人待得???在瑞典生活幾個月,不瘋也抑郁!

百態(tài)人間
2025-11-05 05:15:03
河北原副市長被逮捕,是河北人熟悉的他

河北原副市長被逮捕,是河北人熟悉的他

新牛城
2025-11-05 19:33:49
不會吃別尬吃!《樹影迷宮》廖凡吃餡餅,讓假吃演員無地自容

不會吃別尬吃!《樹影迷宮》廖凡吃餡餅,讓假吃演員無地自容

糊咖娛樂
2025-11-05 11:33:50
2025-11-06 08:56:49
數(shù)字生命卡茲克 incentive-icons
數(shù)字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
396文章數(shù) 456關注度
往期回顧 全部

科技要聞

蘋果“認輸”!曝每年10億美元租用谷歌AI

頭條要聞

記者問了歐盟一個“有趣”的問題 然后被解雇了

頭條要聞

記者問了歐盟一個“有趣”的問題 然后被解雇了

體育要聞

贏下皇馬,會是利物浦的轉折點嗎?

娛樂要聞

港星林尚武突發(fā)心臟病去世

財經(jīng)要聞

特朗普關稅遭美國高院大法官輪番質疑

汽車要聞

智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場迎來新變量

態(tài)度原創(chuàng)

健康
本地
教育
公開課
軍事航空

超聲探頭會加重受傷情況嗎?

本地新聞

這屆干飯人,已經(jīng)把博物館吃成了食堂

教育要聞

83歲還在學英語?ta們告訴你堅持的意義。

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國“福特”號航母駛往加勒比海

無障礙瀏覽 進入關懷版 亚洲精品国产熟老女| 超碰超碰超碰一区人妻| 欧美黑人又粗又大久久久| 美女把腿张开让男人桶| 男女猛烈激情xx00免费视频| 欧美老年性色生活片| 欧洲性久久精品| 国产97色在线 | 免费| 国产精品露脸国语对白| 无码A级毛片| 亚洲国产精品久久久久久| 人妻中文字幕av无码专区| 狼人影院在线观看| 91精品人妻酒店综合大胆无码| 中国农村白怕HDXXXX| 伊人写真在线观看| 超碰人人摸人人操人人爱| 丁香五月缴情综合网| 欧美老妇性爱视频| 国产搡老女人老妇女老熟女o| 国产精品福利自产拍在线观看| 实拍女处破www免费看| 超碰人妻在线手机免费导航| 欧美另类男人的天堂| 四虎影音永久| 精品一区二区三区不卡| 国产伦精一区二区三区四区| jizz中国女人久久久| 毛片A级免费看| 无码人妻精品一区二区三区久久久| 男人激烈吮乳吃奶动图| 亚洲精品久久久久中文字幕一福利| 欧美激情一区二区成人| 无码性爱网站| 亚洲天天堂天堂激情性色| 久久久久香蕉| 99久久婷婷国产综合精品青草漫画| 成人三级在线视频| 本道无码一区二区久久激情| а√资源新版在线天堂| 国偷自产短视频中文版|