你有沒(méi)有過(guò)這種經(jīng)歷?問(wèn)AI“XX名人的代表作”,它列得頭頭是道,結(jié)果一半是編的;讓它寫(xiě)份專業(yè)報(bào)告,引用的“權(quán)威數(shù)據(jù)”根本查無(wú)此據(jù)。
這就是AI的“幻覺(jué)”,明明在胡說(shuō),卻自信得像個(gè)專家,直到OpenAI那篇《語(yǔ)言模型為什么會(huì)產(chǎn)生幻覺(jué)》的論文出來(lái),我才恍然大悟:這事兒,遠(yuǎn)比我們想的復(fù)雜。
咱先掰扯清楚:AI為啥會(huì)“睜眼說(shuō)瞎話”?答案特扎心,這是它的“出廠設(shè)置”,生成式AI的本質(zhì),就是“猜下一個(gè)詞”:根據(jù)上下文,算哪個(gè)詞出現(xiàn)的概率高,就接哪個(gè)。
它判斷一句話對(duì)不對(duì),不靠邏輯,靠“眼熟”,只要句子符合它從海量數(shù)據(jù)里學(xué)來(lái)的統(tǒng)計(jì)規(guī)律,就覺(jué)得是對(duì)的。
就拿“萬(wàn)里無(wú)云的天空飄著朵朵白云”來(lái)說(shuō),人類一聽(tīng)就知道矛盾,AI卻只懂算概率:“萬(wàn)里無(wú)云”和“飄著白云”放一起的概率太低,所以不對(duì),它根本不懂“邏輯”,只認(rèn)“概率”。
可概率這東西,從來(lái)不是100%靠譜啊,數(shù)據(jù)太少它得瞎猜,概念太復(fù)雜它理解不了,訓(xùn)練數(shù)據(jù)本身就有錯(cuò),這些都會(huì)讓它判斷失誤。
而一旦判斷錯(cuò)了,生成內(nèi)容自然就成了“幻覺(jué)” ,OpenAI說(shuō)得明明白白:幻覺(jué)不是意外,是概率天性里的必然!
按理說(shuō),知道AI會(huì)錯(cuò),咱該教它“不確定就別說(shuō)”吧?可事實(shí)恰恰相反,是我們?cè)诒扑昂f(shuō)”。
現(xiàn)在衡量AI能力的考試,全是“答對(duì)得分,答錯(cuò)不扣分”,這不就和咱們考試蒙答案一個(gè)理兒?jiǎn)幔糠凑蓪?duì)了賺,蒙錯(cuò)了不虧,為啥不試試?
OpenAI給的例子太真實(shí)了:O4-mini準(zhǔn)確率24%,錯(cuò)誤率卻高達(dá)75%,棄權(quán)率才1%,而GPT-5-thinking-mini準(zhǔn)確率22%,錯(cuò)誤率只有26%,棄權(quán)率卻有52%。
說(shuō)白了,O4-mini就是敢蒙,才顯得“正確率高”,可幻覺(jué)也多啊。
還有Deepseek-R1,訓(xùn)練時(shí)要求必須寫(xiě)推理過(guò)程,答對(duì)才加分,答錯(cuò)不扣分,結(jié)果它的幻覺(jué)率一直居高不下,原來(lái)是我們的獎(jiǎng)勵(lì)機(jī)制,在變相鼓勵(lì)A(yù)I“與其閉嘴,不如蒙一把”。
既然幻覺(jué)躲不開(kāi),又被我們“鼓勵(lì)”得更泛濫,就沒(méi)招了嗎?有但不是求“零幻覺(jué)”,而是讓AI“該說(shuō)才說(shuō)”。
OpenAI給的方向特實(shí)在:改獎(jiǎng)勵(lì)機(jī)制,別再搞“答對(duì)得1分,答錯(cuò)得0分”了,得改成“答對(duì)加分,答錯(cuò)扣分,棄權(quán)不扣分”。
這樣一來(lái),AI碰到?jīng)]把握的題,就不敢隨便蒙了,只會(huì)乖乖說(shuō)“我不知道”。
這就像給AI戴了個(gè)“概率口罩”:有十足把握時(shí),它能侃侃而談,沒(méi)把握時(shí),就閉上嘴不誤導(dǎo)人,比起追求永遠(yuǎn)正確的“神話”,讓AI學(xué)會(huì)“知之為知之,不知為不知”,才是真的有用!
看完這篇論文,我總算不怪AI“騙人”了,它本就不懂“真”與“假”,只懂“概率”與“得分”,幻覺(jué)不是AI的錯(cuò),是我們沒(méi)教它“誠(chéng)實(shí)”的重要性。
以后再被AI忽悠,咱也別光生氣:想想它是不是又在“蒙答案”了?而那些讓AI“說(shuō)不知道”的產(chǎn)品,才是真的懂行。
說(shuō)不定用不了多久,AI就能既聰明又靠譜,再也不是那個(gè)“一本正經(jīng)胡說(shuō)八道”的家伙了,咱等著瞧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.