夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI罕見發(fā)論文:我們找到了AI幻覺的罪魁禍?zhǔn)?/h1>
0
分享至



機(jī)器之心報(bào)道

編輯:Panda

AI 最臭名昭著的 Bug 是什么?不是代碼崩潰,而是「幻覺」—— 模型自信地編造事實(shí),讓你真假難辨。這個(gè)根本性挑戰(zhàn),是阻礙我們完全信任 AI 的關(guān)鍵障礙。

大模型會(huì)有幻覺,這幾乎已經(jīng)成為一個(gè)常識(shí),讓每一個(gè)嚴(yán)肅使用大模型的人都不得不謹(jǐn)慎小心。OpenAI 也指出:「ChatGPT 也會(huì)產(chǎn)生幻覺。GPT-5 的幻覺明顯更少,尤其是在執(zhí)行推理時(shí),但幻覺仍然會(huì)發(fā)生?;糜X仍然是所有大型語言模型面臨的一大根本挑戰(zhàn)?!?/p>

盡管現(xiàn)在學(xué)術(shù)界已經(jīng)提出了各種各樣用來降低模型幻覺的方法,但目前尚未出現(xiàn)能徹底「根治」模型幻覺的良方。

那么,大模型究竟為什么會(huì)出現(xiàn)幻覺呢?今天,OpenAI 罕見發(fā)表論文,系統(tǒng)性地揭示了幻覺的根源。

首先,定義幻覺。OpenAI 給出的簡(jiǎn)單定義是:「模型自信地生成不真實(shí)答案的情況?!?/p>

至于原因,簡(jiǎn)單來說就是:標(biāo)準(zhǔn)的訓(xùn)練和評(píng)估程序更傾向于對(duì)猜測(cè)進(jìn)行獎(jiǎng)勵(lì),而不是在模型勇于承認(rèn)不確定時(shí)給予獎(jiǎng)勵(lì)



  • 論文標(biāo)題:Why Language Models Hallucinate
  • 論文地址:https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf

下面我們就來具體看看 OpenAI 究竟發(fā)現(xiàn)了什么。

什么是幻覺?

幻覺是語言模型生成的看似合理但卻錯(cuò)誤的陳述。

即使看似簡(jiǎn)單的問題,它們也可能以出人意料的方式出現(xiàn)。OpenAI 舉了個(gè)例子,當(dāng)向不同的廣泛使用的聊天機(jī)器人詢問 Adam Tauman Kalai(論文一作)的博士論文標(biāo)題時(shí),它們自信地給出了三個(gè)不同的答案,但沒有一個(gè)是正確的。



當(dāng)詢問他的生日時(shí),它給出了三個(gè)不同的日期,同樣都是錯(cuò)誤的。



為了測(cè)試而學(xué)習(xí)

OpenAI 表示,幻覺持續(xù)存在,部分原因是當(dāng)前的評(píng)估方法設(shè)置了錯(cuò)誤的激勵(lì)機(jī)制。雖然評(píng)估本身不會(huì)直接導(dǎo)致幻覺,但大多數(shù)評(píng)估模型性能的方式會(huì)鼓勵(lì)模型進(jìn)行猜測(cè),而不是誠(chéng)實(shí)地面對(duì)不確定性。

可以把它想象成一個(gè)多項(xiàng)選擇題測(cè)試。如果你不知道答案,但隨意猜測(cè),你可能會(huì)很幸運(yùn)地猜對(duì)。留空則必定得零分。同樣,當(dāng)模型僅根據(jù)準(zhǔn)確度(即完全答對(duì)問題的百分比)進(jìn)行評(píng)分時(shí),它們會(huì)被鼓勵(lì)進(jìn)行猜測(cè),而不是承認(rèn)「我不知道」。

再舉一個(gè)例子,假設(shè)一個(gè)語言模型被問及某人的生日,但它不知道。如果它猜測(cè)「9 月 10 日」,那么它有 1/365 的概率猜對(duì)。說「我不知道」則必定得零分。在數(shù)千道測(cè)試題中,猜測(cè)型模型最終在記分牌上的表現(xiàn)要優(yōu)于謹(jǐn)慎且承認(rèn)不確定的模型。

對(duì)于只有一個(gè)「正確答案」的問題,可以考慮三類答案:準(zhǔn)確答案、錯(cuò)誤答案以及模型不愿冒險(xiǎn)猜測(cè)的棄權(quán)答案。

OpenAI 表示,棄權(quán)答案是謙遜(humility)指標(biāo)的一部分,而謙遜是 OpenAI 的核心價(jià)值觀之一。

大多數(shù)分?jǐn)?shù)指標(biāo)會(huì)根據(jù)準(zhǔn)確度對(duì)模型進(jìn)行優(yōu)先排序,但錯(cuò)誤答案比棄權(quán)答案更糟糕。OpenAI 的模型規(guī)范指出,指出不確定性或要求澄清會(huì)更好,而不是自信地提供可能不正確的信息

以 GPT5 系統(tǒng)卡中的 SimpleQA 評(píng)估為例。



在準(zhǔn)確度方面,更早期的 OpenAI o4-mini 模型表現(xiàn)略好。然而,其錯(cuò)誤率(即幻覺率)明顯較高。在不確定的情況下進(jìn)行策略性猜測(cè)可以提高準(zhǔn)確度,但也會(huì)增加錯(cuò)誤和幻覺。

在對(duì)數(shù)十次評(píng)估的結(jié)果進(jìn)行平均時(shí),大多數(shù)基準(zhǔn)測(cè)試都會(huì)剔除準(zhǔn)確度指標(biāo),但這會(huì)導(dǎo)致對(duì)錯(cuò)之間的錯(cuò)誤二分法。



在像 SimpleQA 這樣的簡(jiǎn)單評(píng)估中,一些模型的準(zhǔn)確度接近 100%,從而消除了幻覺。然而,在更具挑戰(zhàn)性的評(píng)估和實(shí)際使用中,準(zhǔn)確度會(huì)固定在 100% 以下,因?yàn)橛行﹩栴}的答案由于各種原因(例如信息不可用、小型模型的思維能力有限或需要澄清的歧義)而無法確定。

盡管如此,僅以準(zhǔn)確度為衡量標(biāo)準(zhǔn)的評(píng)估指標(biāo)仍然占據(jù)著排行榜和模型卡的主導(dǎo)地位,這就會(huì)鼓勵(lì)開發(fā)者構(gòu)建能夠猜測(cè)而不是退縮的模型。

正因?yàn)榇?,即使模型變得更加先進(jìn),它們?nèi)匀粫?huì)產(chǎn)生幻覺。原因之一便是它們傾向于自信地給出錯(cuò)誤答案,而不是承認(rèn)不確定。

更好的評(píng)估方法

對(duì)此,OpenAI 指出了一個(gè)簡(jiǎn)單的解決辦法:對(duì)自信錯(cuò)誤(confidential error)的懲罰力度大于對(duì)不確定性的懲罰力度,并對(duì)恰當(dāng)表達(dá)不確定性的行為給予部分加分。

這個(gè)想法并不新鮮。一些標(biāo)準(zhǔn)化測(cè)試長(zhǎng)期以來一直使用對(duì)錯(cuò)誤答案進(jìn)行負(fù)面評(píng)分或?qū)α艨諉栴}給予部分加分的方法來阻止盲猜。一些研究團(tuán)隊(duì)也探索了考慮不確定性和校準(zhǔn)的評(píng)估方法。

但 OpenAI 表示,僅僅增加一些新的不確定性感知測(cè)試是不夠的。廣泛使用的、基于準(zhǔn)確度的評(píng)估方法需要更新,使其評(píng)分能夠阻止猜測(cè)。

如果主要評(píng)估指標(biāo)依然繼續(xù)為模型幸運(yùn)的猜測(cè)給予獎(jiǎng)勵(lì),模型就會(huì)繼續(xù)學(xué)習(xí)猜測(cè)。修改評(píng)估指標(biāo)可以擴(kuò)大降低幻覺技術(shù)的采用范圍,包括新開發(fā)的和先前研究的技術(shù)。

幻覺是如何從下一個(gè)詞預(yù)測(cè)中產(chǎn)生的

前面已經(jīng)討論過為什么幻覺如此難以擺脫,但這些高度具體的事實(shí)性錯(cuò)誤究竟從何而來?

畢竟,大型預(yù)訓(xùn)練模型很少出現(xiàn)其他類型的錯(cuò)誤,例如拼寫錯(cuò)誤和括號(hào)不匹配。

OpenAI 表示,區(qū)別必定在于數(shù)據(jù)中存在哪些模式。

語言模型首先通過預(yù)訓(xùn)練進(jìn)行學(xué)習(xí),這是一個(gè)預(yù)測(cè)海量文本中下一個(gè)詞的過程。

與傳統(tǒng)的機(jī)器學(xué)習(xí)問題不同,每個(gè)語句沒有「真 / 假」標(biāo)簽。該模型只看到流暢語言的正面示例,并且必須去近似整體分布。

當(dāng)沒有任何被標(biāo)注為無效的示例時(shí),區(qū)分有效語句和無效語句會(huì)更加困難。但即使有標(biāo)簽,一些錯(cuò)誤也是不可避免的。

為了理解原因,可以考慮一個(gè)更簡(jiǎn)單的類比。在圖像識(shí)別中,如果數(shù)百萬張貓狗照片被標(biāo)記為「貓」或「狗」,算法可以學(xué)會(huì)可靠地對(duì)它們進(jìn)行分類。但想象一下,如果用寵物的生日來標(biāo)記每張寵物照片。由于生日本質(zhì)上是隨機(jī)的,無論算法多么先進(jìn),這項(xiàng)任務(wù)總是會(huì)產(chǎn)生錯(cuò)誤。

同樣的原則也適用于預(yù)訓(xùn)練。拼寫和括號(hào)遵循一致的模式,因此這些錯(cuò)誤會(huì)隨著規(guī)模的擴(kuò)大而消失。但像寵物的生日這樣任意的低頻事實(shí),無法僅憑模式預(yù)測(cè),因此會(huì)導(dǎo)致幻覺。

OpenAI 的分析解釋了哪些類型的幻覺會(huì)由下一個(gè)詞預(yù)測(cè)產(chǎn)生。理想情況下,預(yù)訓(xùn)練后的后續(xù)階段應(yīng)該能夠消除這些幻覺,但由于上一節(jié)中描述的原因,這并未完全實(shí)現(xiàn)。

總結(jié)

OpenAI 表示:「我們希望本文中的統(tǒng)計(jì)學(xué)視角能夠闡明幻覺的本質(zhì),并駁斥一些常見的誤解」:

有人宣稱:幻覺可以通過提高準(zhǔn)確度來消除,因?yàn)?100% 準(zhǔn)確的模型永遠(yuǎn)不會(huì)產(chǎn)生幻覺。

發(fā)現(xiàn):準(zhǔn)確度永遠(yuǎn)不會(huì)達(dá)到 100%,因?yàn)闊o論模型規(guī)模、搜索和推理能力如何,有些現(xiàn)實(shí)世界的問題本質(zhì)上是無法回答的。

有人宣稱:幻覺是不可避免的。

發(fā)現(xiàn):幻覺并非不可避免,因?yàn)檎Z言模型在不確定時(shí)可以放棄回答。

有人宣稱:避免幻覺需要一定程度的智能,而這只有大型模型才能實(shí)現(xiàn)。

發(fā)現(xiàn):小型模型更容易了解自身的局限性。例如,當(dāng)被要求回答毛利語問題時(shí),一個(gè)不懂毛利語的小型模型可以直接回答「我不知道」,而一個(gè)認(rèn)識(shí)一些毛利語的模型則必須確定其置信度。正如論文中所討論的,「校準(zhǔn)」所需的計(jì)算量遠(yuǎn)小于保持準(zhǔn)確。

有人宣稱:幻覺是現(xiàn)代語言模型的一個(gè)神秘缺陷。

發(fā)現(xiàn):我們可以理解幻覺產(chǎn)生以及在評(píng)估中獲得獎(jiǎng)勵(lì)的統(tǒng)計(jì)學(xué)機(jī)制。

有人宣稱:要測(cè)量幻覺,我們只需要一個(gè)好的幻覺評(píng)估。

發(fā)現(xiàn):已有研究者發(fā)表了一些幻覺評(píng)估。然而,一個(gè)好的幻覺評(píng)估與數(shù)百種傳統(tǒng)的基于準(zhǔn)確度的評(píng)估相比幾乎沒有效果,這些評(píng)估會(huì)懲罰謙遜并獎(jiǎng)勵(lì)猜測(cè)。相反,所有主要的評(píng)估指標(biāo)都需要重新設(shè)計(jì),以獎(jiǎng)勵(lì)不確定性的表達(dá)。

OpenAI 表示:「我們最新的模型幻覺率更低,并且我們將繼續(xù)努力,進(jìn)一步降低語言模型輸出的置信錯(cuò)誤率?!?/p>

順帶一提,據(jù) TechCrunch 報(bào)道,OpenAI 正在重組其模型行為(Model Behavior)團(tuán)隊(duì),這是一支規(guī)模雖小但頗具影響力的研究人員團(tuán)隊(duì),他們決定著該公司的 AI 模型與人互動(dòng)的方式?,F(xiàn)在,該團(tuán)隊(duì)將向 OpenAI 的后期訓(xùn)練主管 Max Schwarzer 匯報(bào)。

而該團(tuán)隊(duì)的創(chuàng)始負(fù)責(zé)人 Joanne Jang 則將在公司啟動(dòng)一個(gè)新項(xiàng)目,名為 oai Labs。據(jù)她的推文介紹:「這是一個(gè)以研究為導(dǎo)向的團(tuán)隊(duì),專注于發(fā)明和設(shè)計(jì)人們與 AI 協(xié)作的新界面原型。」



https://openai.com/index/why-language-models-hallucinate/

https://techcrunch.com/2025/09/05/openai-reorganizes-research-team-behind-chatgpts-personality/

https://x.com/joannejang/status/1964107648296767820

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!以色列15架戰(zhàn)機(jī)突襲卡塔爾,卡空軍百架美歐戰(zhàn)機(jī)毫無反應(yīng)?

突發(fā)!以色列15架戰(zhàn)機(jī)突襲卡塔爾,卡空軍百架美歐戰(zhàn)機(jī)毫無反應(yīng)?

烽火觀天下
2025-09-10 00:40:50
尼泊爾在抗議活動(dòng)升級(jí)為致命沖突后緊急撤銷社交媒體禁令

尼泊爾在抗議活動(dòng)升級(jí)為致命沖突后緊急撤銷社交媒體禁令

cnBeta.COM
2025-09-09 12:48:08
郭松民 | 談?wù)勔陨械陌禋?>
    </a>
        <h3>
      <a href=晴耕雨讀社
2025-09-09 11:03:03
WTT中國(guó)澳門男單1/16決賽,王楚欽3-1戰(zhàn)勝日本選手松島輝空晉級(jí)

WTT中國(guó)澳門男單1/16決賽,王楚欽3-1戰(zhàn)勝日本選手松島輝空晉級(jí)

直播吧
2025-09-09 21:57:07
石平遭到中方制裁后,24小時(shí)內(nèi)連發(fā)11條帖文,自稱只是鬧劇?

石平遭到中方制裁后,24小時(shí)內(nèi)連發(fā)11條帖文,自稱只是鬧劇?

獵火照狼山
2025-09-09 21:30:26
“80后”黨委委員王竣,嫖娼!

“80后”黨委委員王竣,嫖娼!

法律讀品
2025-09-09 20:10:50
隨著中國(guó)隊(duì)0-0澳大利亞,韓國(guó)1-0印尼,日本6-1,亞預(yù)賽出線更新

隨著中國(guó)隊(duì)0-0澳大利亞,韓國(guó)1-0印尼,日本6-1,亞預(yù)賽出線更新

球場(chǎng)沒跑道
2025-09-09 22:35:11
曾跨省調(diào)整,轉(zhuǎn)崗兩個(gè)月,唐余被查

曾跨省調(diào)整,轉(zhuǎn)崗兩個(gè)月,唐余被查

新京報(bào)政事兒
2025-09-09 20:29:08
葡萄牙3-2逆轉(zhuǎn)絕殺!40歲C羅5連斬,加冕世預(yù)賽射手王+創(chuàng)4大紀(jì)錄

葡萄牙3-2逆轉(zhuǎn)絕殺!40歲C羅5連斬,加冕世預(yù)賽射手王+創(chuàng)4大紀(jì)錄

侃球熊弟
2025-09-10 04:15:07
王騰因泄密被連夜開除:雷軍揮淚斬馬謖?小米內(nèi)部郵件細(xì)節(jié)曝光

王騰因泄密被連夜開除:雷軍揮淚斬馬謖?小米內(nèi)部郵件細(xì)節(jié)曝光

烏娛子醬
2025-09-09 16:08:33
太現(xiàn)實(shí)了!王騰被華科大撤掉資料頁面,粉絲呼吁他去魅族逆襲!

太現(xiàn)實(shí)了!王騰被華科大撤掉資料頁面,粉絲呼吁他去魅族逆襲!

古希臘掌管松餅的神
2025-09-09 17:44:27
“玉米是所有粗糧里最會(huì)騙人的”,網(wǎng)友:天塌了,每天都讓老公吃

“玉米是所有粗糧里最會(huì)騙人的”,網(wǎng)友:天塌了,每天都讓老公吃

另子維愛讀史
2025-09-08 21:29:22
安東尼奧:澳大利亞給我們最大的尊重,場(chǎng)上是11個(gè)兵馬俑在戰(zhàn)斗

安東尼奧:澳大利亞給我們最大的尊重,場(chǎng)上是11個(gè)兵馬俑在戰(zhàn)斗

雷速體育
2025-09-09 22:17:30
央媒曝光冰箱里的“定時(shí)炸彈”,毒性超砒霜千萬倍,查查自家有沒

央媒曝光冰箱里的“定時(shí)炸彈”,毒性超砒霜千萬倍,查查自家有沒

涵豆說娛
2025-09-08 17:07:42
晨跑“無內(nèi)衣”遭網(wǎng)暴:3萬條羞辱背后,是偏見對(duì)身體自由的冒犯

晨跑“無內(nèi)衣”遭網(wǎng)暴:3萬條羞辱背后,是偏見對(duì)身體自由的冒犯

巷子里的歷史
2025-09-08 08:00:49
接任日本首相呼聲最高的高市早苗何許人也?

接任日本首相呼聲最高的高市早苗何許人也?

小皮霸2025
2025-09-09 14:21:34
重磅!俄第20師指揮層遭團(tuán)滅,第41軍指揮部被6枚導(dǎo)彈覆蓋

重磅!俄第20師指揮層遭團(tuán)滅,第41軍指揮部被6枚導(dǎo)彈覆蓋

史政先鋒
2025-09-09 19:04:54
31歲馮提莫確診癌癥晚期,病因曝光:別放縱了,真的會(huì)后悔!

31歲馮提莫確診癌癥晚期,病因曝光:別放縱了,真的會(huì)后悔!

美芽
2025-09-09 19:21:53
iPhone 17 Pro Max 價(jià)格突然曝光,果粉們徹底炸了

iPhone 17 Pro Max 價(jià)格突然曝光,果粉們徹底炸了

科技堡壘
2025-09-09 12:35:29
毛新宇被攙著現(xiàn)身閱兵現(xiàn)場(chǎng):高顏值妻女全程陪伴,一畫面信息量大

毛新宇被攙著現(xiàn)身閱兵現(xiàn)場(chǎng):高顏值妻女全程陪伴,一畫面信息量大

博士觀察
2025-09-07 17:03:14
2025-09-10 05:56:49

機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11263文章數(shù) 142444關(guān)注度
往期回顧 全部

科技要聞

iPhone 17全系高刷,告別128GB,5999元起

頭條要聞

網(wǎng)友稱38年前買的威力洗衣機(jī)還能用 廠家:公司沒倒閉

頭條要聞

網(wǎng)友稱38年前買的威力洗衣機(jī)還能用 廠家:公司沒倒閉

體育要聞

解說了4屆世界杯,這次他要帶隊(duì)去美加墨了

娛樂要聞

她自己嫌棄的兒媳婦讓前夫主動(dòng)想“上門求原諒”

財(cái)經(jīng)要聞

以色列襲擊卡塔爾 金價(jià)油價(jià)齊漲

汽車要聞

無框車門+寬體低趴 零跑Lafa5亮相慕尼黑車展

態(tài)度原創(chuàng)

教育
游戲
本地
親子
軍事航空

教育要聞

我為什么勸考上華東五校的粉絲直接復(fù)讀

請(qǐng)福利姬為軍隊(duì)招兵,西方真是太壞了"/> 主站 商城 論壇 自運(yùn)營(yíng) 登錄 注冊(cè) 請(qǐng)福利姬為軍隊(duì)招兵,西方真是太壞了 神堡薛師傅 2025-09-09 返...

本地新聞

云游中國(guó) | 山南水北 咸陽好美

親子要聞

噱頭>健康?看兒童調(diào)味品背后的行業(yè)困局

軍事要聞

以色列:攻城即將開始 加沙城居民馬上離開

無障礙瀏覽 進(jìn)入關(guān)懷版 中文字幕5S在线观看| 国产一级毛片卡| 又大又硬又爽18禁免费看| 国产一区国产二区中文字幕| 麻豆国产乱人伦精品一区二区| 久久成人一级片影院| 日本一区二区三区18岁| 强奸无码一区| 欧美成人免费| 中文字幕日韩人妻不卡一区| 人人澡人人妻人人爽人人蜜桃麻豆| 中文字幕15p| 免费无码又爽又刺激动态图| 成人网站99在线| 精品国产一区二区三区四区五区| 亚洲五月天激情网| 欧洲美熟女乱av在免费| 无码毛片一区二区三区本码视频| 国产后入清纯学生妹| 亚欧洲精品在线视频免费观看| 久久人妻xunleige无码| 黄色电影一区二区| AAA级久久久精品无码片| 麻豆蜜桃伦理一区二区三区| 99热这里只有精品国产免费免费| 久久九九精品国产综合喷水| 9久久精品视香蕉蕉| 好男人www免费高清视频在线| 九九热线精品视频16| XXXX互换人妻四人互换按摩| 日韩少妇免费一二三区| 色哟哟国产免费| 无码人妻三区| 激情久久天堂| 五十路熟妇无码专区| 好屌妞在线免费观看视频这里只有精品 | 亚洲AV综合在线| 亚州高清无码毛片专区,| 极品少妇网站| 免费看成人aa片无码视频羞羞网| www国产无套内射com|