夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI罕見發(fā)論文:我們找到了AI幻覺的罪魁禍?zhǔn)?/h1>
0
分享至



機(jī)器之心報道

編輯:Panda

AI 最臭名昭著的 Bug 是什么?不是代碼崩潰,而是「幻覺」—— 模型自信地編造事實(shí),讓你真假難辨。這個根本性挑戰(zhàn),是阻礙我們完全信任 AI 的關(guān)鍵障礙。

大模型會有幻覺,這幾乎已經(jīng)成為一個常識,讓每一個嚴(yán)肅使用大模型的人都不得不謹(jǐn)慎小心。OpenAI 也指出:「ChatGPT 也會產(chǎn)生幻覺。GPT-5 的幻覺明顯更少,尤其是在執(zhí)行推理時,但幻覺仍然會發(fā)生。幻覺仍然是所有大型語言模型面臨的一大根本挑戰(zhàn)。」

盡管現(xiàn)在學(xué)術(shù)界已經(jīng)提出了各種各樣用來降低模型幻覺的方法,但目前尚未出現(xiàn)能徹底「根治」模型幻覺的良方。

那么,大模型究竟為什么會出現(xiàn)幻覺呢?今天,OpenAI 罕見發(fā)表論文,系統(tǒng)性地揭示了幻覺的根源。

首先,定義幻覺。OpenAI 給出的簡單定義是:「模型自信地生成不真實(shí)答案的情況?!?/p>

至于原因,簡單來說就是:標(biāo)準(zhǔn)的訓(xùn)練和評估程序更傾向于對猜測進(jìn)行獎勵,而不是在模型勇于承認(rèn)不確定時給予獎勵



  • 論文標(biāo)題:Why Language Models Hallucinate
  • 論文地址:https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf

下面我們就來具體看看 OpenAI 究竟發(fā)現(xiàn)了什么。

什么是幻覺?

幻覺是語言模型生成的看似合理但卻錯誤的陳述。

即使看似簡單的問題,它們也可能以出人意料的方式出現(xiàn)。OpenAI 舉了個例子,當(dāng)向不同的廣泛使用的聊天機(jī)器人詢問 Adam Tauman Kalai(論文一作)的博士論文標(biāo)題時,它們自信地給出了三個不同的答案,但沒有一個是正確的。



當(dāng)詢問他的生日時,它給出了三個不同的日期,同樣都是錯誤的。



為了測試而學(xué)習(xí)

OpenAI 表示,幻覺持續(xù)存在,部分原因是當(dāng)前的評估方法設(shè)置了錯誤的激勵機(jī)制。雖然評估本身不會直接導(dǎo)致幻覺,但大多數(shù)評估模型性能的方式會鼓勵模型進(jìn)行猜測,而不是誠實(shí)地面對不確定性。

可以把它想象成一個多項選擇題測試。如果你不知道答案,但隨意猜測,你可能會很幸運(yùn)地猜對。留空則必定得零分。同樣,當(dāng)模型僅根據(jù)準(zhǔn)確度(即完全答對問題的百分比)進(jìn)行評分時,它們會被鼓勵進(jìn)行猜測,而不是承認(rèn)「我不知道」。

再舉一個例子,假設(shè)一個語言模型被問及某人的生日,但它不知道。如果它猜測「9 月 10 日」,那么它有 1/365 的概率猜對。說「我不知道」則必定得零分。在數(shù)千道測試題中,猜測型模型最終在記分牌上的表現(xiàn)要優(yōu)于謹(jǐn)慎且承認(rèn)不確定的模型。

對于只有一個「正確答案」的問題,可以考慮三類答案:準(zhǔn)確答案、錯誤答案以及模型不愿冒險猜測的棄權(quán)答案。

OpenAI 表示,棄權(quán)答案是謙遜(humility)指標(biāo)的一部分,而謙遜是 OpenAI 的核心價值觀之一。

大多數(shù)分?jǐn)?shù)指標(biāo)會根據(jù)準(zhǔn)確度對模型進(jìn)行優(yōu)先排序,但錯誤答案比棄權(quán)答案更糟糕。OpenAI 的模型規(guī)范指出,指出不確定性或要求澄清會更好,而不是自信地提供可能不正確的信息

以 GPT5 系統(tǒng)卡中的 SimpleQA 評估為例。



在準(zhǔn)確度方面,更早期的 OpenAI o4-mini 模型表現(xiàn)略好。然而,其錯誤率(即幻覺率)明顯較高。在不確定的情況下進(jìn)行策略性猜測可以提高準(zhǔn)確度,但也會增加錯誤和幻覺。

在對數(shù)十次評估的結(jié)果進(jìn)行平均時,大多數(shù)基準(zhǔn)測試都會剔除準(zhǔn)確度指標(biāo),但這會導(dǎo)致對錯之間的錯誤二分法。



在像 SimpleQA 這樣的簡單評估中,一些模型的準(zhǔn)確度接近 100%,從而消除了幻覺。然而,在更具挑戰(zhàn)性的評估和實(shí)際使用中,準(zhǔn)確度會固定在 100% 以下,因為有些問題的答案由于各種原因(例如信息不可用、小型模型的思維能力有限或需要澄清的歧義)而無法確定。

盡管如此,僅以準(zhǔn)確度為衡量標(biāo)準(zhǔn)的評估指標(biāo)仍然占據(jù)著排行榜和模型卡的主導(dǎo)地位,這就會鼓勵開發(fā)者構(gòu)建能夠猜測而不是退縮的模型。

正因為此,即使模型變得更加先進(jìn),它們?nèi)匀粫a(chǎn)生幻覺。原因之一便是它們傾向于自信地給出錯誤答案,而不是承認(rèn)不確定。

更好的評估方法

對此,OpenAI 指出了一個簡單的解決辦法:對自信錯誤(confidential error)的懲罰力度大于對不確定性的懲罰力度,并對恰當(dāng)表達(dá)不確定性的行為給予部分加分。

這個想法并不新鮮。一些標(biāo)準(zhǔn)化測試長期以來一直使用對錯誤答案進(jìn)行負(fù)面評分或?qū)α艨諉栴}給予部分加分的方法來阻止盲猜。一些研究團(tuán)隊也探索了考慮不確定性和校準(zhǔn)的評估方法。

但 OpenAI 表示,僅僅增加一些新的不確定性感知測試是不夠的。廣泛使用的、基于準(zhǔn)確度的評估方法需要更新,使其評分能夠阻止猜測。

如果主要評估指標(biāo)依然繼續(xù)為模型幸運(yùn)的猜測給予獎勵,模型就會繼續(xù)學(xué)習(xí)猜測。修改評估指標(biāo)可以擴(kuò)大降低幻覺技術(shù)的采用范圍,包括新開發(fā)的和先前研究的技術(shù)。

幻覺是如何從下一個詞預(yù)測中產(chǎn)生的

前面已經(jīng)討論過為什么幻覺如此難以擺脫,但這些高度具體的事實(shí)性錯誤究竟從何而來?

畢竟,大型預(yù)訓(xùn)練模型很少出現(xiàn)其他類型的錯誤,例如拼寫錯誤和括號不匹配。

OpenAI 表示,區(qū)別必定在于數(shù)據(jù)中存在哪些模式。

語言模型首先通過預(yù)訓(xùn)練進(jìn)行學(xué)習(xí),這是一個預(yù)測海量文本中下一個詞的過程。

與傳統(tǒng)的機(jī)器學(xué)習(xí)問題不同,每個語句沒有「真 / 假」標(biāo)簽。該模型只看到流暢語言的正面示例,并且必須去近似整體分布。

當(dāng)沒有任何被標(biāo)注為無效的示例時,區(qū)分有效語句和無效語句會更加困難。但即使有標(biāo)簽,一些錯誤也是不可避免的。

為了理解原因,可以考慮一個更簡單的類比。在圖像識別中,如果數(shù)百萬張貓狗照片被標(biāo)記為「貓」或「狗」,算法可以學(xué)會可靠地對它們進(jìn)行分類。但想象一下,如果用寵物的生日來標(biāo)記每張寵物照片。由于生日本質(zhì)上是隨機(jī)的,無論算法多么先進(jìn),這項任務(wù)總是會產(chǎn)生錯誤。

同樣的原則也適用于預(yù)訓(xùn)練。拼寫和括號遵循一致的模式,因此這些錯誤會隨著規(guī)模的擴(kuò)大而消失。但像寵物的生日這樣任意的低頻事實(shí),無法僅憑模式預(yù)測,因此會導(dǎo)致幻覺。

OpenAI 的分析解釋了哪些類型的幻覺會由下一個詞預(yù)測產(chǎn)生。理想情況下,預(yù)訓(xùn)練后的后續(xù)階段應(yīng)該能夠消除這些幻覺,但由于上一節(jié)中描述的原因,這并未完全實(shí)現(xiàn)。

總結(jié)

OpenAI 表示:「我們希望本文中的統(tǒng)計學(xué)視角能夠闡明幻覺的本質(zhì),并駁斥一些常見的誤解」:

有人宣稱:幻覺可以通過提高準(zhǔn)確度來消除,因為 100% 準(zhǔn)確的模型永遠(yuǎn)不會產(chǎn)生幻覺。

發(fā)現(xiàn):準(zhǔn)確度永遠(yuǎn)不會達(dá)到 100%,因為無論模型規(guī)模、搜索和推理能力如何,有些現(xiàn)實(shí)世界的問題本質(zhì)上是無法回答的。

有人宣稱:幻覺是不可避免的。

發(fā)現(xiàn):幻覺并非不可避免,因為語言模型在不確定時可以放棄回答。

有人宣稱:避免幻覺需要一定程度的智能,而這只有大型模型才能實(shí)現(xiàn)。

發(fā)現(xiàn):小型模型更容易了解自身的局限性。例如,當(dāng)被要求回答毛利語問題時,一個不懂毛利語的小型模型可以直接回答「我不知道」,而一個認(rèn)識一些毛利語的模型則必須確定其置信度。正如論文中所討論的,「校準(zhǔn)」所需的計算量遠(yuǎn)小于保持準(zhǔn)確。

有人宣稱:幻覺是現(xiàn)代語言模型的一個神秘缺陷。

發(fā)現(xiàn):我們可以理解幻覺產(chǎn)生以及在評估中獲得獎勵的統(tǒng)計學(xué)機(jī)制。

有人宣稱:要測量幻覺,我們只需要一個好的幻覺評估。

發(fā)現(xiàn):已有研究者發(fā)表了一些幻覺評估。然而,一個好的幻覺評估與數(shù)百種傳統(tǒng)的基于準(zhǔn)確度的評估相比幾乎沒有效果,這些評估會懲罰謙遜并獎勵猜測。相反,所有主要的評估指標(biāo)都需要重新設(shè)計,以獎勵不確定性的表達(dá)。

OpenAI 表示:「我們最新的模型幻覺率更低,并且我們將繼續(xù)努力,進(jìn)一步降低語言模型輸出的置信錯誤率。」

順帶一提,據(jù) TechCrunch 報道,OpenAI 正在重組其模型行為(Model Behavior)團(tuán)隊,這是一支規(guī)模雖小但頗具影響力的研究人員團(tuán)隊,他們決定著該公司的 AI 模型與人互動的方式?,F(xiàn)在,該團(tuán)隊將向 OpenAI 的后期訓(xùn)練主管 Max Schwarzer 匯報。

而該團(tuán)隊的創(chuàng)始負(fù)責(zé)人 Joanne Jang 則將在公司啟動一個新項目,名為 oai Labs。據(jù)她的推文介紹:「這是一個以研究為導(dǎo)向的團(tuán)隊,專注于發(fā)明和設(shè)計人們與 AI 協(xié)作的新界面原型?!?/p>



https://openai.com/index/why-language-models-hallucinate/

https://techcrunch.com/2025/09/05/openai-reorganizes-research-team-behind-chatgpts-personality/

https://x.com/joannejang/status/1964107648296767820

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
疫情時的“明星醫(yī)生”鐘南山、李蘭娟、高福院士現(xiàn)身,意味著什么

疫情時的“明星醫(yī)生”鐘南山、李蘭娟、高福院士現(xiàn)身,意味著什么

李昕言溫度空間
2025-09-08 17:05:33
伊朗請求加快執(zhí)行中伊25年協(xié)議

伊朗請求加快執(zhí)行中伊25年協(xié)議

華山穹劍
2025-09-08 20:34:37
小學(xué)生“畫下媽媽睡姿”走紅,畫面過于寫實(shí),老師不得不打滿分

小學(xué)生“畫下媽媽睡姿”走紅,畫面過于寫實(shí),老師不得不打滿分

熙熙說教
2025-08-24 21:20:14
普京對26國下戰(zhàn)書,不到48小時,俄軍810架無人機(jī),狂炸11小時

普京對26國下戰(zhàn)書,不到48小時,俄軍810架無人機(jī),狂炸11小時

南權(quán)先生
2025-09-08 14:45:03
突然爆發(fā)!多股漲停

突然爆發(fā)!多股漲停

中國基金報
2025-09-09 11:23:08
丑成這樣,是不是有點(diǎn)過分了???

丑成這樣,是不是有點(diǎn)過分了???

陳天宇
2025-09-08 11:32:09
17分大勝!拒絕18分逆轉(zhuǎn)!歐洲杯最大黑馬誕生,老詹盛贊東契奇

17分大勝!拒絕18分逆轉(zhuǎn)!歐洲杯最大黑馬誕生,老詹盛贊東契奇

世界體育圈
2025-09-08 12:00:54
撈女實(shí)錘!深圳相親點(diǎn)3726元,男方提前逃單,女子結(jié)單時兩眼一黑

撈女實(shí)錘!深圳相親點(diǎn)3726元,男方提前逃單,女子結(jié)單時兩眼一黑

公子麥少
2025-09-06 15:27:54
中方禁止入境后,不到24小時,石平太郎說了2句話,態(tài)度很囂張

中方禁止入境后,不到24小時,石平太郎說了2句話,態(tài)度很囂張

趣文說娛
2025-09-09 11:36:20
A股:今日行情不對勁,大幅縮量普跌!不用猜了,主力在儲蓄洗盤

A股:今日行情不對勁,大幅縮量普跌!不用猜了,主力在儲蓄洗盤

虎哥閑聊
2025-09-09 11:42:02
離譜!意大利隊進(jìn)了7個球+最終5-4險勝 加圖索犯1錯誤:我太愚蠢

離譜!意大利隊進(jìn)了7個球+最終5-4險勝 加圖索犯1錯誤:我太愚蠢

風(fēng)過鄉(xiāng)
2025-09-09 06:49:18
新研究:急性心梗后吃丹參滴丸,可保護(hù)心功能,顯著降低心衰風(fēng)險

新研究:急性心梗后吃丹參滴丸,可保護(hù)心功能,顯著降低心衰風(fēng)險

李藥師談健康
2025-09-08 10:22:15
朝鮮領(lǐng)導(dǎo)人停留了5天4夜,中方給出高規(guī)格禮遇

朝鮮領(lǐng)導(dǎo)人停留了5天4夜,中方給出高規(guī)格禮遇

帝王崛起
2025-09-09 10:20:19
豫西高鐵4月開工!河南3年建成南北通道,230公里改寫出行格局?

豫西高鐵4月開工!河南3年建成南北通道,230公里改寫出行格局?

元爸體育
2025-09-09 09:07:06
陳小群9億資金被悶殺?真相來了!AI量化閃崩的原因找到了

陳小群9億資金被悶殺?真相來了!AI量化閃崩的原因找到了

金石隨筆
2025-09-09 00:23:57
重磅消息!韓國:對中國3人以上團(tuán)體游客試行免簽,最長可停留15天【附出入境旅游行業(yè)市場分析】

重磅消息!韓國:對中國3人以上團(tuán)體游客試行免簽,最長可停留15天【附出入境旅游行業(yè)市場分析】

前瞻網(wǎng)
2025-09-08 16:08:09
細(xì)思極恐!曝金昊什么都招了,瑤瑤身上疑似檢出鎮(zhèn)定劑成分,冷血

細(xì)思極恐!曝金昊什么都招了,瑤瑤身上疑似檢出鎮(zhèn)定劑成分,冷血

吃瓜盟主
2025-09-02 21:19:38
意大利最新研究:“威尼斯之獅”使用的部分銅礦石來自中國,原型或是唐代鎮(zhèn)墓獸,由馬可·波羅運(yùn)回后改造

意大利最新研究:“威尼斯之獅”使用的部分銅礦石來自中國,原型或是唐代鎮(zhèn)墓獸,由馬可·波羅運(yùn)回后改造

極目新聞
2025-09-04 21:53:28
輕易得到的最珍惜?為何俄羅斯每年都高調(diào)紀(jì)念《璦琿條約》簽訂?

輕易得到的最珍惜?為何俄羅斯每年都高調(diào)紀(jì)念《璦琿條約》簽訂?

靜夜史君
2025-09-06 23:55:43
烏克蘭悔斷腸!當(dāng)年售華三架 “廢鐵” 今成中國大國重器

烏克蘭悔斷腸!當(dāng)年售華三架 “廢鐵” 今成中國大國重器

大喵吃魚
2025-09-05 23:09:39
2025-09-09 13:00:49

機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11257文章數(shù) 142444關(guān)注度
往期回顧 全部

科技要聞

王騰辟謠:我沒有竊取公司機(jī)密,收人錢財

頭條要聞

夫妻在合租房生養(yǎng)娃遭室友投訴要求搬離 網(wǎng)友吵翻了

頭條要聞

夫妻在合租房生養(yǎng)娃遭室友投訴要求搬離 網(wǎng)友吵翻了

體育要聞

二十年,屬于詹姆斯和中國球迷的雙向奔赴

娛樂要聞

許凱待播劇還能播嗎?

財經(jīng)要聞

桂浩明:牛還在

汽車要聞

國內(nèi)售價272.8萬起 新款保時捷911 Turbo S首發(fā)

態(tài)度原創(chuàng)

游戲
房產(chǎn)
親子
本地
教育

亞馬遜《戰(zhàn)神》真人劇集進(jìn)入制作階段!明年3月開拍

房產(chǎn)要聞

實(shí)力寵粉,再奪三冠王!廣佛新世界以「莊園生活」重構(gòu)灣區(qū)人居答案

親子要聞

人類幼崽給朋友喂飯 一秒切換操心與委屈臉 網(wǎng)友:該喂還得喂 該哭還得哭

本地新聞

食味印象 | 夜未央 在自由時光邂逅煙火氣

教育要聞

頭發(fā)一周剪了兩次,“不行,還要剪”!中學(xué)生頭發(fā)到底要短到什么程度

無障礙瀏覽 進(jìn)入關(guān)懷版 在哪里可以看免费毛片| 日产一二三区别免费必看| 国产成人亚洲综合青青| taijiu太久.av| 欧美大胆性生话| 开心五月婷婷中文| 亚洲国产激情一区二区三区| 日日澡夜夜爽| 成人拍拍拍无遮挡免费视频| 中文字幕人妻无码精品| 秋霞人妻无码中文字幕| 成人黄色在线免费观看视频| 白浆视频在线观看| 日韩一区二区不卡黄色伦理电影 | 国偷自产一区二区免费视频 | 日日噜噜噜夜夜爽爽狠狠视频| 一本无码人妻在中文字幕免费| 偷拍区清纯另类丝袜美腿| 毛片免费观看完整版| 欧美乱伦一区二区三区四区免费福利 | 风流少妇无码AV| 日韩大片高清播放器| 国产精品扒开腿做爽爽爽视频| 日韩成人一区二区二十六区| 九色PORNY精品| 少妇内射兰兰久久| 中国国模一区| 亚洲男人的天堂一区二区| 女人自慰喷水全过程免费观看 | 隔着超薄丝袜进入的片| 日本高清 7 4 7 4 7 4精品| 国产 精品 99| 熟女水柔国产精品区| jiujiure| 国产又大又粗无套免费看| 中国少妇被黑人xxxxx| 日韩无码丝袜人妻视频| 国产一区精品视频| 亚洲成av人片在线观看无码不卡 | 波多野结衣连续高潮20次| 国产精品岛国久久久久久久久 |