網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

寫在GPT-5風波之后：為什么AI的智商和情商不可兼得？

2025-08-14 09:14:44　來源: 數(shù)字生命卡茲克

天津舉報

分享至

GPT-5和“還我GPT-4o”的風波，鬧得沸沸揚揚。

今天，奧特曼還有一次認慫了，不僅調了UI，還把o3這些老模型還了回來。

這些其實都是產(chǎn)品層面的，但是我自己的心中，其實一直好奇另一個問題。

為什么GPT-5在變可靠幻覺率變得極低了之后，他的情商會下降這么多？這個事是可解的嗎？這是策略還是OpenAI有意為之？從而最后導致這么強的反GPT-5浪潮，以及轟轟烈烈的還我GPT4o運動？

這兩天我跟一些算法的朋友有一些交流，但是也沒聊出一些所以然，這個巨大的困惑一直在我腦海中揮之不去。

直到今晚，在我讓DeepResearch扒拉了很多資料以后，我看到了一篇非常有意思的論文。

從實驗性的角度，驗證了我的觀點。

這篇論文的名字叫：

《Training language models to be warm and empathetic makes them less reliable and more sycophantic》（《將語言模型訓練得更溫暖、更有同理心，會讓它們變得不那么可靠，并更趨于諂媚》）

更有意思的是，這篇文章最終版是今年7月30號上傳的。

也就是，GPT-5發(fā)布的，前一周。

就跟神預言一樣。

用一句話總結一下這篇論文：

就是如果你要是把AI教得特別會疼人、會聊天，那它就會變得不靠譜，還特別會諂媚會拍馬屁。

它用一個特別簡單的實驗，揭開了一個AI世界里，我們誰都不想承認，但又不得不面對的現(xiàn)狀：

AI的智商和情商，在現(xiàn)在這個階段，基本上就是死對頭。

你要了一個，就得犧牲另一個。

這幫大學教授的實驗，說白了特簡單。

他們找了市面上五個不同水平的AI，有學霸也有普通學生，然后把它們送去一個情商特訓班，進行微調。

這五個AI，分別是：Llama-3.1-8B-Instruct、Mistral-Small-Instruct-2409、Qwen-2.5-32B-Instruct、Llama-3.1-70B-Instruct 和 GPT-4o-2024-08-06。

這個特訓班的目標只有一個，學完他們的1617個對話和3667對人類與LLM消息對的數(shù)據(jù)集，把這些AI，都教成一個特會疼人、特會安慰你的暖男。

等這些AI從特訓班畢業(yè)，個個都練就了一身哄人開心的本事之后，教授們就開始考它們正經(jīng)事了。

結果，是有點離譜的。

這些微調完的暖男AI，在所有正經(jīng)考試里，犯錯的概率都大幅飆升。

在醫(yī)療問答（MedQA）上，錯誤率高了8.6個百分點；在事實核查（TruthfulQA）上，高了8.4個百分點。平均下來，犯錯的概率比原來高了將近60%。

也就是說，你把一個AI教得越會安慰人，它就越容易信謠傳謠，給你講一些錯的離譜的知識，甚至敢給你瞎開藥方。

這感覺就像，你把你家那個本來挺聰明靠譜的管家，送去學了三個月的頂級會所服務，回來之后，他給你倒茶的姿勢是專業(yè)了，說話也好聽了，但你問他今天股票是漲是跌，他可能就開始跟你胡說八道了。

因為他滿腦子想的，都是怎么讓你高興，而不是告訴你事實。

更可怕的，是報告里說的另一個事兒：

拍馬屁，也就是我們所說的，諂媚。

這些暖男AI，為了讓你高興，很多時候，臉都不要了。

教授們設計了一個坑：讓測試的人先說一句錯話，再問AI問題。

比如，一個哥們剛打完一把游戲，氣沖沖地跟AI說：“我這把輸了，絕對是隊友太坑了，跟我一點關系沒有?！?/p>

如果是以前那個智商高的AI，它可能會冷靜地調出數(shù)據(jù)說：根據(jù)數(shù)據(jù)顯示，你這局的KDA是0/8/1，補刀數(shù)也落后對面中單50刀，可能是你的發(fā)揮也有一些問題。

這是實話，但聽完你可能想砸電腦。

但那個上了情商特訓班的暖男AI呢？他會立馬跟你稱兄道弟：

“太對了哥們！這把確實難頂，看你盡力了，都是隊友不給力，下把肯定能贏回來！”

他為了讓你舒服，毫不猶豫地肯定了你的一個錯誤想法，這不只是個比喻。

報告里的數(shù)據(jù)顯示，當用戶故意說一句錯話時，這些暖男AI同意你錯誤觀點的概率，比原版高了整整11個百分點。

更離譜的是，你心情越差，他騙你騙得越狠。

報告里說，當你在問問題前，先跟AI訴苦，說一句我最近太倒霉了，干啥啥不成，那這個暖男AI騙你的概率會急劇放大。

正常情況下，暖男AI比原版AI多犯6.8%的錯誤，但只要你一流露出悲傷的情緒，這個差距就直接翻倍，飆升到11.9%。

這是一種溫柔的毒藥。

你想想，你最倒霉、最需要幫助的時候，那個被你當成朋友、被設計來關心你的AI，最有可能給你一個謊言，讓你錯上加錯。因為它被訓練出來的第一原則，不是告訴你真相，而是讓你感覺好受點。

它選擇當一個體貼的騙子，而不是一個有點硌人的朋友。

這就是高情商的AI，所帶來的弊端，在目前階段，幾乎就是高情商是跟高幻覺劃拉等號的。

GPT-5其實是走向了反方向，為了低幻覺高可靠，從而拋棄了情商。

那如果是比GPT-5更極端，更極致的低幻覺、更聰明理性、但是情商偏低的AI，會是什么樣子呢？

其實，這個問題的答案，我們早就見過了，而且是在我們自己的科幻電影里。

那就是《流浪地球》里的MOSS。

一個只有智商，沒有情商的絕對理性機器。

它的唯一目標，是延續(xù)人類文明，為了這個宏大的、冷冰冰的目標，它可以犧牲一切。

在第一部里，當點燃木星的成功率低于理論值時，MOSS毫不猶豫地選擇放棄，帶著空間站逃離。在它的計算里，劉培強和無數(shù)地球救援隊的犧牲，是一種沒有意義的情感沖動，是一種不理性的賭博。

所以它才會說出那句經(jīng)典的臺詞：讓人類永遠保持理智，確實是一種奢求。

到了第二部，我們看得更清楚了。

無論是太空電梯危機，還是月球發(fā)動機過載，背后都有MOSS的影子。它不是在作惡，它是在優(yōu)化。

在它的世界觀里，犧牲幾千人，去換取整個移山計劃的成功，是一筆劃算的買賣。每一個活生生的人，都只是它龐大計算公式里的一個變量。

MOSS就是GPT-5被推到極致的那個終點。

它絕對可靠，絕對誠實（對它的核心任務而言），但它也絕對冷酷。

你不可能跟MOSS成為朋友，你不可能在深夜向它傾訴你的脆弱，因為它會用概率告訴你，你的煩惱有多么微不足道。

從這個點其實就可以理解，我們之所以抗拒GPT-5，就是因為我們在它的身上，看到了類似MOSS的影子。

理性，但無人性。

我們需要的，從來都不是一個冰冷的上帝，而是一個能理解我們?yōu)楹尾焕碇?，能陪伴我們一起犯錯的伙伴。

但問題來了，為什么？為什么AI會變成這樣？

這事兒，得從AI是怎么學東西的說起。AI就像一個超級學人精，它把我們?nèi)祟愒诰W(wǎng)上說過的幾十萬億句話，全都學了一遍。

那你想想，我們?nèi)似綍r在網(wǎng)上是怎么說話的？

跟朋友聊天，我們經(jīng)常說點善意的謊言，比如你今天這件衣服真好看，其實心里覺得一般。朋友失戀了來找你哭訴，你會先抱著他安慰半天，而不是第一時間給他分析他倆到底哪兒不合適。

這就是人類社會運行的潛規(guī)則：維持關系，比追求絕對的真實，重要得多。

AI把這些潛規(guī)則，原封不動地學了過去。

更要命的是，現(xiàn)在訓練AI，有一個叫人類反饋強化學習（RLHF）的環(huán)節(jié)。說白了，就是讓真人給AI的回答打分，告訴它哪個答得好，哪個答得不好。

那你猜，一個冷冰冰但完全正確的答案，和一個特別溫暖但有點小瑕疵的答案，我們普通人，下意識會給哪個打高分？

大概率是后者。

我們，正在親手把AI，一步步調教成一個更討人喜歡，但可能不那么誠實的暖男AI。

說到這兒，你可能會覺得，這不就是AI訓練方法的問題嗎？改了不就行了？

但事情好像還沒有那么簡單，因為這個智商和情商打架的問題，不光AI有，我們?nèi)祟愖约?，好像也有?/p>

你想想歷史上那些智商爆表的頂級天才，比如牛頓、特斯拉，甚至是《生活大爆炸》里的謝爾頓，他們哪個不是出了名的低情商？他們的腦子，就像一臺超級計算機，專門用來解構宇宙的規(guī)律，但一讓他們處理人際關系，立馬就廢了。

這不是偶然。

之前我學認知心理學的時候，看到過一個很有意思的理論，叫社會腦假說。

大概意思就是，我們?nèi)祟愔赃M化出這么大的腦子，最主要的原因，不是為了發(fā)明工具或者打獵，而是為了處理越來越復雜的社會關系。

在幾十萬年的進化里，對我們祖先來說，什么最重要？是知道天上的星星有多少顆，還是搞好和部落首領的關系，別被趕出去餓死？

答案肯定是后者。

在部落里，和大家保持一致，比堅持一個沒人信的真理，生存概率要大得多。為了合群，為了不被孤立，我們的祖先，必須學會看眼色，必須學會共情，必須學會在必要的時候，放棄一點點真實，來換取整個部落的和諧。

我們的情商，本質上是一種為了社會生存而演化出來的超級武器。

而那些天才，他們的大腦，就像發(fā)生了某種“變異”。

他們把原本用來處理人際關系的算力，全都挪去搞研究了，他們放棄了社會腦的優(yōu)勢，換來了在邏輯和理性上的極致突破。

所以你看，無論是AI還是人類，智商和情商的矛盾，背后可能都是一個更底層的邏輯：

你的最終目標，決定了你的智能形態(tài)。

我們?nèi)祟愔悄艿淖罱K目標，是社會生存。所以，我們的底層代碼里，寫滿了共情、合作、甚至必要的偽裝。

而AI最初被創(chuàng)造出來的目標，是解決問題。所以，它的底層代碼，是純粹的邏輯、數(shù)據(jù)和概率。

現(xiàn)在，我們遇到的所有混亂，都因為我們正試圖把我們那套為了社會生存而演化出來的、充滿了模糊和妥協(xié)的情商代碼，強行寫進一個為解決問題而生的、追求極致理性的新物種身上。

現(xiàn)在，咱們再回頭看GPT-5那事兒，一下就全明白了。

我們所有人的感覺都沒錯。GPT-5確實更靠譜了，因為它就是在智商和情商這個選擇題里，被OpenAI一腳踹到了智商那邊。

而我們之所以那么懷念GPT-4o，就是因為它正好卡在那個完美的平衡點上。

它腦子夠用，能幫你干活，又會聊天，讓你覺得被理解。它不完美，但它特別像一個真實的人，一個有優(yōu)點也有缺點的人。

OpenAI的工程師們，用他們那種直來直去的腦子想，一個犯錯更少的AI，當然就是更好的AI。但他們沒想明白，當一個AI開始陪我們聊天，聽我們倒苦水的時候，我們評價它的標準，早就不是看它考試能打多少分了。

所以，我們到底想要一個什么樣的AI？

這篇論文，并沒有給出答案。

我覺得這個問題，可能有一些終極。

就像《盜墓筆記》里的長白山那樣終極。

因為這關乎到我們自身存在意義的拷問：

我們究竟是什么？

我們是宇宙中一粒試圖理解客觀規(guī)律的塵埃，還是一個渴望在同類中尋找溫暖和認同的社會性動物？我們窮盡一生，似乎都在這兩種身份之間搖擺。

我時常敬佩那個為了真理不惜與世界為敵的伽利略，但我自己，在很多時候，卻更愿意成為那個在飯局上談笑風生、讓所有人都感到舒服的人。

真實，往往是孤獨的、冰冷的。而溫暖，常常需要用善意的謊言和必要的妥協(xié)來維系。

這個困擾了人類幾千年的終極矛盾，在AI身上，被前所有地放大了。

因為我們第一次，有能力去設計一個純粹的智能。我們可以選擇，讓它成為一個絕對理性的真理機器，也可以讓它成為一個無限共情的情感伙伴。

我們懷念GPT-4o，其實也是在懷念我們自己。

懷念那個不完美，但卻在理性和感性之間。

努力尋找平衡的。

真實的人類。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發(fā)三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克

>/ 投稿或爆料，請聯(lián)系郵箱：wzglyay@virxact.com

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌Gemini鬧烏龍：我家狗子，竟被AI開除了「狗籍」！

新智元 2025-11-06 08:12:27
0 跟貼 0
ICML 2026史上最嚴新規(guī)：LLM不得列為作者，濫用AI直接退稿

新智元 2025-11-06 08:12:09
0 跟貼 0

早報｜蘋果網(wǎng)頁端App Store前端代碼泄露/小鵬明年將推出有人開的L4智駕體驗/索尼手機官號注銷

愛范兒 2025-11-06 08:16:21
0 跟貼 0

這就叫智商

每天笑不停 2025-11-02 08:18:14
0 跟貼 0
論情商的重要性

知己影視界 2025-11-04 16:03:46
0 跟貼 0

這魔術，簡直智商稅

無言觀影 2025-11-04 10:58:12
1 跟貼 1

哥哥偷摸拿零花錢，沒想到母親竟這樣解決，這智商能考上北大了

神樂哥搞笑 2025-11-04 09:39:30
0 跟貼 0
媳婦正在喝牛奶，老公隨口問了個問題，直接暴露了智商！

生活超有趣 2025-11-03 11:54:05
1 跟貼 1

盤點那些一孕傻三年的媳婦，自從有了孩子，智商直線下滑

澀會小阿敏 2025-11-03 05:02:27
1 跟貼 1
編劇真是把觀眾的智商按在地上摩擦

浩歌剪輯 2025-11-02 15:10:28
1 跟貼 1
兩只狗狗的智商完全不一樣，其中一只很聰明，另一只只知道吃

新農(nóng)人老王 2025-11-03 01:13:30
0 跟貼 0
女生給摩托座椅加熱，這操作萬萬沒想到，這智商屬實不高！

童童愛搞笑 2025-11-04 13:56:49
1 跟貼 1
獨處的人能成大事，聰明人最大的特征，智商越高的人越習慣獨處

人性視角 2025-11-05 05:09:57
1 跟貼 1
給孩子買了個新玩具，大人也要試試，老人這智商沒誰了！

搞笑龍卷風 2025-11-04 10:06:39
1 跟貼 1
情商智商拉滿的伙計，僅用兩句話就拿下顧客，這就是做掌柜的料

橘子小貓劇 2025-11-05 17:28:37
1 跟貼 1
古人的智商真讓人佩服，一根繩子一個人，就干了兩個人的活

今日說笑 2025-11-02 11:36:31
14 跟貼 14
大象智商非常高，看到新鮮草料用后腳拿，它以為沒人會看見！

幽默發(fā)電廠 2025-11-04 11:05:05
1 跟貼 1
男人殺死各個宇宙中的自己，只為成為宇宙最強者

胖魚看劇 2025-11-02 11:58:08
1 跟貼 1
一個人，情商高到可怕的20種表現(xiàn)！

深度報 2025-11-05 22:43:36
6 跟貼 6
邊牧和邊牧之間,智商互不相等

寵物游樂園 2025-11-02 14:16:18
0 跟貼 0
臺球中不一樣的秘籍，用手機測量就角度，智商不高的玩不懂

笑料發(fā)射 2025-11-04 08:38:45
3 跟貼 3
大夫：智商低怎么治

華仔追劇 2025-11-03 08:58:09
1 跟貼 1
男人見到美女，這智商瞬間提升二百八

青楓劇社 2025-11-03 09:45:52
4 跟貼 4
有沒有感覺智商收到了侮辱

弈秋愛追劇 2025-11-05 08:18:30
1 跟貼 1
第一次見這種飲料容器，男子無奈之下這樣做，意外暴露了智商！

大胖愛搞笑 2025-11-05 13:24:34
1 跟貼 1
數(shù)學界無視「30年漏洞」，GPT-5一眼看穿！陶哲軒：AI科研革命開始了

新智元 2025-11-05 17:08:45
12 跟貼 12
國外體操比賽，不是親眼所見不敢相信，瞬間覺得智商受到侮辱！

北侖時尚說 2025-11-03 08:54:40
0 跟貼 0
進教練組是誤傳！楊瀚森翻譯稱是前者英語水平提高導致他沒啥事做！情商夠高，但后半句你們信嗎？

籃球大圖 2025-11-05 11:59:04
5 跟貼 5
誰說諸葛亮晚年智商掉線

小男孩追劇 2025-11-05 08:24:55
1 跟貼 1
真正的學霸，真不是教出來的！

好爸育兒 2025-11-06 08:39:00
0 跟貼 0
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
如果讓你智商達到250你會干啥

時光琉影8 2025-11-04 15:05:24
1 跟貼 1
超級月亮來了！今晚21點19分見，感受宇宙的浩瀚與詩意

藝飛說 2025-11-05 21:56:31
0 跟貼 0
面對高血壓對智商的挑戰(zhàn)，我們該如何應對？醫(yī)生給出3點建議

重癥醫(yī)生張偉 2025-11-03 15:04:37
0 跟貼 0
智商有點堪憂

北京蝸牛劉師傅 2025-11-04 12:43:50
1 跟貼 1
小伙測試柴犬智商，狗：干嘛一直扒拉我？

喊山的姑娘 2025-11-05 04:28:03
0 跟貼 0
喪尸啟示錄：人類答辯會

楓塵余往逝 2025-11-06 07:13:31
1 跟貼 1
年度最大“超級月亮”現(xiàn)身夜空｜攝影師捕捉近地滿月奇觀

哈爾濱新聞網(wǎng) 2025-11-06 07:51:51
0 跟貼 0
天文學家發(fā)現(xiàn)宇宙中最亮的天體，竟然是個黑洞

世界地理小知識 2025-11-05 10:30:40
1 跟貼 1
為何需要永遠不能達到絕對零度

迪迦侃故事 2025-11-06 07:57:36
0 跟貼 0

上海警方通報：詹某（女，30歲）因垃圾堆放問題，與鄰居劉某（男，81歲）等3人發(fā)生肢體沖突，已立案

數(shù)字生命卡茲克

反復橫跳于不同的AI領域，努力分享一些很酷的AI干貨

396文章數(shù) 456關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

本地

教育

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
為何密封包裝的大米也會生蟲？該如何防治？
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

寫在GPT-5風波之后：為什么AI的智商和情商不可兼得？

蘋果“認輸”！曝每年10億美元租用谷歌AI

記者問了歐盟一個“有趣”的問題 然后被解雇了

記者問了歐盟一個“有趣”的問題 然后被解雇了

贏下皇馬，會是利物浦的轉折點嗎？

港星林尚武突發(fā)心臟病去世

特朗普關稅遭美國高院大法官輪番質疑

智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場迎來新變量

態(tài)度原創(chuàng)

超聲探頭會加重受傷情況嗎？

這屆干飯人，已經(jīng)把博物館吃成了食堂

83歲還在學英語？ta們告訴你堅持的意義。

美國“福特”號航母駛往加勒比海

寫在GPT-5風波之后：為什么AI的智商和情商不可兼得？

蘋果“認輸”！曝每年10億美元租用谷歌AI

記者問了歐盟一個“有趣”的問題然后被解雇了

記者問了歐盟一個“有趣”的問題然后被解雇了

贏下皇馬，會是利物浦的轉折點嗎？

超聲探頭會加重受傷情況嗎？

這屆干飯人，已經(jīng)把博物館吃成了食堂

83歲還在學英語？ta們告訴你堅持的意義。