網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

為什么大模型要騙你？

2025-09-22 21:23:30　來源: 象先志

廣東舉報

分享至

本文開始前，「象先志」先問大家三個問題，大家可以一起思考下

1. 1. AI為什么要騙你？

2. 2. 幻覺是大語言模型的bug還是feature？

3. 3. 為什么AI總是一本正經(jīng)地胡說八道？

OpenAI前段時間發(fā)了篇論文，題目叫《Why language models hallucinate》，解釋為什么大語言模型會產(chǎn)生幻覺?！赶笙戎尽箷冉榻B下論文內(nèi)容，然后「象先志」再聊聊對這個問題一些不一樣的看法。

稍微有點硬核，希望大家耐心看到最后。這篇論文的基本結(jié)論，是大模型產(chǎn)生幻覺，原因是開發(fā)人員在訓(xùn)練它的時候鼓勵它這么做。就是說大模型天性是好的，是跟錯了人，后面路才走歪的。

為什么這么說呢？在訓(xùn)練大模型的時候，廠商內(nèi)部會跑很多的測試，來評價和校準(zhǔn)大模型的好壞。這些測試只看準(zhǔn)確率，不看錯誤率，所以哪怕模型不知道答案是什么，它還是會傾向猜一個答案。就跟我們考試的時候，哪怕不會做，答題卡上也要涂滿是一個道理。

要解決這個問題，那就對癥下藥嘛，論文作者呼吁大家要改變評測基準(zhǔn)，不要再搞那套基于準(zhǔn)確率的評估方法了，要鼓勵大模型承認自己的無知，而不是一本正經(jīng)的瞎咧咧。

論文主要說的就是這事，「象先志」想邏輯大家應(yīng)該很容易理解。坦白講，雖然說論文是OpenAI發(fā)的，但「象先志」覺得沒有什么新東西。當(dāng)然OpenAI出來發(fā)有個好處，人家行業(yè)地位擺著這，出來吼兩嗓子，有助于從業(yè)者更快地認識到問題，然后去針對性地解決。

聊完論文，「象先志」再聊下對模型幻覺問題的理解?！赶笙戎尽拐J為語言模型本質(zhì)上沒有幻覺不幻覺的概念，它們只是基于已有的信息，去預(yù)測下一個token。你訓(xùn)練數(shù)據(jù)里是什么樣的概率分布，它就會盡量去擬合這個分布，僅此而已。不管你怎樣去調(diào)整模型評估的方式方法，它其實仍然是在迎合新的評價指標(biāo)。

比如說，原來答錯不扣分，現(xiàn)在答錯要扣分，那模型肯定更謹(jǐn)慎，不確定的事實，不知道的答案，它就更多承認自己不確定或者不知道。

但這樣還是存在兩個問題。

第一，模型仍然是沒有事實和非事實的概念區(qū)分，它不是因為這個東西是幻覺，它才不輸出；它是因為這個輸出會扣分，它才不輸出。

這就引出了第二個問題。按照這個理解角度，要減少模型的幻覺，就是要合理設(shè)置模型的評估模式，去盡可能引導(dǎo)模型的輸出跟人類認知上的事實陳述重合。

這顯然是一種治標(biāo)不治本的方式，因為模型的輸出結(jié)果跟人類認為的事實是兩個語言集合，我們現(xiàn)在等于沒辦法，直接瞄準(zhǔn)后面這個集合做優(yōu)化，所以只能退而求其次，對前一個集合做間接的限制。

但這樣搞有多大效果？上限在哪里？都是不知道的。

打個比方吧。人發(fā)燒是因為身體內(nèi)的免疫系統(tǒng)在劇烈反應(yīng)，這個反應(yīng)是有一個根本的誘發(fā)因素的，比如說病毒感染。那現(xiàn)在要解決發(fā)燒的問題，一種辦法是直接對病毒做處理，上一些抗病毒的藥物，病毒解決了，身體自然就不發(fā)燒了。

還有一種辦法是什么呢？就是把體溫當(dāng)做優(yōu)化指標(biāo)，用藥物把免疫反應(yīng)按下去，或者在頭上敷冰塊，反正要達到降體溫的目的。

現(xiàn)在OpenAI提的解決方案就類似于后者。這個方法有沒有用？當(dāng)然有用，就像人如果一直發(fā)燒發(fā)高燒，腦子就燒壞掉了，先把體溫降下來、緩解癥狀，是治療步驟中必要的環(huán)節(jié)。

OpenAI新的GPT-5的確也比之前模型要好很多，幻覺癥狀有明顯的緩解。但這能不能解決根本問題呢？我覺得很難，你最后還是需要找到發(fā)燒的原因才行。

只不過跟生病不一樣，人發(fā)燒是有客觀原因的，可能受限于醫(yī)學(xué)發(fā)展程度醫(yī)生找不到，但我們知道這個原因是客觀存在的。而語言模型的幻覺問題有可能是與生俱來的，發(fā)燒就是它身體正常新陳代謝的一部分，你解決不了。沒那個能力，知道吧？

順便說一句，剛才「象先志」又被AI給騙了?！赶笙戎尽乖儐柨聺崼@得過幾個世界冠軍時，ChatGPT非常篤定地回答，“截止2025年9月，柯潔共獲得9個世界冠軍，還列出了是哪幾次以及哪一年?！?/strong>

本來以為是GPT語料被污染了，因為年初LG杯決賽時柯潔因不服裁判棄賽，隨后把微博簽名改為“九冠王”。但「象先志」定睛一看，發(fā)現(xiàn)情況并沒有那么復(fù)雜，因為ChatGPT回答里并沒有列出2025年的LG杯。

九冠的柯潔，只是它單純的幻覺。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

大模型碰到真難題了，測了500道，o3 Pro僅通過15%

機器之心Pro 2025-09-15 10:45:10
1 跟貼 1

柯潔奪冠大哭！豪取棋圣戰(zhàn)3連冠，他的傳奇還未落幕！

史襉的生活科普 2025-10-04 02:25:11
1 跟貼 1

AI花17小時寫了篇30頁論文！自主選題，包含實驗，還符合APA格式

量子位 2025-10-04 12:17:53
18 跟貼 18

你認為柯潔能在AI時代重回巔峰嗎

王老師聊圍棋 2025-10-05 06:53:05
2 跟貼 2

具身智能狂飆，安全卻嚴(yán)重滯后？首個安全可信EAI框架與路線圖！

機器之心Pro 2025-09-17 10:53:27
0 跟貼 0

李飛飛一年前究竟說了啥？怎么又火了

量子位 2025-09-11 14:27:04
0 跟貼 0

傳奇還未落幕!柯潔2比1勝屠曉宇掩面哭泣

重慶熱點 2025-09-30 18:12:42
0 跟貼 0

1.5B模型新SOTA，RL訓(xùn)練新解法打破「簡單題過擬合、難題學(xué)不動」

機器之心Pro 2025-10-04 20:47:58
0 跟貼 0

Insta360最新全景綜述：全景視覺的挑戰(zhàn)、方法與未來

機器之心Pro 2025-10-04 20:54:38
1 跟貼 1

老公發(fā)燒了，媳婦竟想出這種辦法降溫，不料效果立竿見影！

啾啾愛搞笑 2025-10-01 14:29:16
1 跟貼 1

嗓子疼、咳嗽、發(fā)燒，不花錢幫您緩解癥狀！

醫(yī)路向前巍子 2025-10-04 17:07:00
8 跟貼 8

聽我說啊老舅，精神科也治發(fā)燒

三貓看電影 2025-10-04 10:21:09
3 跟貼 3

身體出現(xiàn)這六種癥狀，一定趕快去醫(yī)院，都是身體的暗示！

萌趣速拍 2025-10-04 08:36:43
1 跟貼 1

論文模擬新型戰(zhàn)略運輸機，載重是運20的兩倍

我是李小七23 2025-10-03 01:44:14
0 跟貼 0

身體出現(xiàn)這些癥狀，趕緊去檢查，這是身體發(fā)出的緊急信號！

歡樂笑作坊 2025-10-03 10:32:31
1 跟貼 1

業(yè)界首個高質(zhì)量原生3D組件生成模型來了！來自騰訊混元團隊

量子位 2025-09-27 12:56:41
3 跟貼 3

她，正式加入頂尖985大學(xué)！曾任華為諾亞方舟實驗室主任研究員

雙一流高校 2025-10-04 20:02:39
0 跟貼 0

從胃炎到康復(fù)：僅需換一種飲食，我的胃黏膜修復(fù)之路！

平潭美食探索家 2025-10-05 10:35:25
1 跟貼 1

頂刊論文里驚現(xiàn)雙馬尾涂鴉小人，碩博生：隨手一畫都上了頂刊，我還在被審稿人刁難

生物學(xué)霸 2025-10-03 17:10:19
2 跟貼 2

身體發(fā)出這個聲音，是肝在“求救”！很多人不以為然，白白拖成癌

資說 2025-10-05 10:02:19
1 跟貼 1

夏天感冒小科普

達醫(yī)曉護 2025-10-04 21:01:19
5 跟貼 5

男子結(jié)節(jié)息肉慕名求醫(yī)，6大不適癥狀全消

馮春祥 2025-09-30 18:43:16
0 跟貼 0

血糖報告單怎么看？這4個指標(biāo)一定要重視！

藥師方健 2025-10-04 19:34:16
0 跟貼 0

行業(yè)大模型+智能小助！朗瑪信息“39AI醫(yī)生”構(gòu)建醫(yī)療新圖景

知知貴陽 2025-10-04 20:41:58
2 跟貼 2

脊髓炎有什么癥狀嗎

江南凜冬雪 2025-10-05 11:07:35
0 跟貼 0

梅杰綜合征不是怪?。∠d調(diào)元湯：氣血失和才是幕后推手

孤鶩立秋影獨檺 2025-10-05 10:31:46
0 跟貼 0

螞蟻數(shù)科AI技術(shù)負責(zé)人：未來要靠智能體原生大模型

機器之心Pro 2025-08-04 15:47:29
0 跟貼 0

寶寶打疫苗后發(fā)燒，家長需做好這幾點！

印鈔票的兒科印醫(yī)生 2025-10-02 00:10:26
0 跟貼 0

十一將至：你的準(zhǔn)備，配得上你的期待嗎？

科學(xué)伙伴 2025-09-30 22:25:16
0 跟貼 0

孩子被侵犯后的接觸矛盾癥狀，寶媽一定要學(xué)會！

孩子們的安全官爸爸 2025-10-03 19:30:00
0 跟貼 0

冠軍榮耀時刻！王楚欽林詩棟男雙奪冠，大頭收獲本屆中國大滿貫第二冠！

咪咕體育 2025-10-04 21:22:10
6 跟貼 6

牛彈琴：日本大變局開始中方回應(yīng)中有一個詞意味深長

現(xiàn)代快報 2025-10-05 08:10:03
4295 跟貼 4295

在現(xiàn)任與前任之間反復(fù)橫跳，邏輯更及其精彩！卻口口聲聲為了孩子

時光慢遞員 2025-10-04 08:56:32
1 跟貼 1

史上最強殲20模型，跑起來那刻，一群人直接驚呆

崖柏愛生活 2025-10-01 16:52:53
0 跟貼 0

女子畫眼線，居然是利用一個彎刀模型畫上去的

老詞的游泳喝茶日記 2025-10-04 13:47:38
1 跟貼 1

江蘇蘇州初中數(shù)學(xué)競賽題目考察零零模型的應(yīng)用

三樂大掌柜 2025-10-04 12:32:17
1 跟貼 1

高血脂的四個指標(biāo)，有何區(qū)別？

藥師方健 2025-10-02 22:48:21
12 跟貼 12

高血壓患者, 若沒有下面這5個癥狀, 你可以放心了

告白手工 2025-10-01 02:12:56
0 跟貼 0

我就喜歡你不喜歡我，這追愛邏輯也是沒誰了

兔八哥影視 2025-10-02 01:11:22
1 跟貼 1

售罄、約滿，多地景區(qū)緊急提醒！有的一天涌入44萬人

哈爾濱廣播電視臺 2025-10-02 07:59:46
1580 跟貼 1580

70歲米雪國慶跑步素顏狀態(tài)驚艷網(wǎng)民手臂肌肉線條清晰可見
廣西阿妹香香
2025-10-04 19:17:25

不是玄學(xué)！明日八月十五中秋，最旺自己的5件事，別忘了告訴家人
書中自有顏如玉
2025-10-05 11:28:13

陳俊菘一戰(zhàn)成名！國乒教練組立即為他更換陪練，此人大有來頭
十點街球體育
2025-10-04 23:10:13

吳艷妮穿緊身三角褲太窄被批“露骨”，到底礙了誰的眼？
傲嬌的馬甲線
2025-09-17 18:06:44

王朔：適當(dāng)?shù)膹妱?，你才會被尊重；適當(dāng)?shù)木芙^，你才不會被欺負
清風(fēng)拂心
2025-09-11 16:15:09

霍英東二姨太96歲去世：住百平高層領(lǐng)生活費，葬禮低調(diào)卻贏盡尊重
熱風(fēng)追逐者
2025-09-26 19:05:15

36歲瞿秋白慷慨赴死，建國后毛主席卻說：以后少紀(jì)念他！有何隱情
浩舞默畫
2025-09-05 08:26:07

女游客被海陵島一燒烤店“上課了”，發(fā)視頻曝光后，店家愿退三倍
小彭聊社會
2025-10-04 12:37:39

怪不得我們這個時候報道殲16驅(qū)逐五代機，原來美日澳有大動作了！
阿龍聊軍事
2025-10-04 14:30:24

澳大利亞慌了，中國不買美元計價的鐵礦了，總理喊話中國求訂單
愛下廚的阿釃
2025-10-04 10:32:39

邱貽可為何缺席場外指導(dǎo)？孫穎莎說出真相！球迷：馬琳去哪了？
最愛乒乓球
2025-10-05 07:47:42

1979年，葉飛調(diào)任海軍政委，要一人做幫手，中央：行，但有個條件
史閣
2025-10-05 07:35:13

《沉默的榮耀》藏最深的竟是阿菊！朱楓吳石接頭，昌誠才知她多狠
小娛樂悠悠
2025-10-05 00:01:38

范仲淹的智慧：家族財富傳承，從來不是留錢，而是建體系
金沛的國學(xué)筆記
2025-10-04 14:12:48

65年毛主席在武漢接見韓先楚，期間問：洪學(xué)智哪去了？好久沒見他
微野談寫作
2025-10-03 23:10:07

收手吧“資本家的丑孩子”，沒顏值沒演技，請不要出來禍害觀眾！
老呶侃史
2025-08-06 11:01:37

山東泰山丟球權(quán)24次，韓鵬指出最大“水貨”并非洛佩斯。
吳蛛旅行ing
2025-10-05 09:07:19

馬科斯緊急對中國“交底”，美國密謀政變，絕不讓南海局勢改變
天氣觀察站
2025-10-05 11:01:46

“陪睡上位、知三當(dāng)三、風(fēng)流成性”，44歲的宋佳究竟是什么樣的人
混沌錄
2025-09-18 21:23:05

稻盛和夫：錢沒了可以再掙，工作沒了可以再找，朋友沒了可以再交
清風(fēng)拂心
2025-09-13 13:15:04

2025-10-05 12:43:00