夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

讓AI算24點(diǎn),它堅(jiān)持說(shuō)25-12=24!大模型的回答為什么不能相信?

0
分享至

“孩子解不出‘24點(diǎn)’,讓AI大模型幫忙,結(jié)果大模型給出‘2.6×5=24’的結(jié)果!孩子讓大模型重新解題,沒(méi)想到結(jié)果依舊奇葩,變成了‘25-12=24’!”最近發(fā)生的一件小事,讓市民成女士對(duì)AI大模型的“解題思路”哭笑不得,“都說(shuō)大模型不可全信,這次我有了切身的體會(huì)?!?/p>



某AI大模型做“24點(diǎn)”的結(jié)果

一段時(shí)間以來(lái),部分網(wǎng)民利用AI大模型造假的消息時(shí)有發(fā)生,相關(guān)行為被依法查處。但部分網(wǎng)民不清楚的是,大模型因?yàn)椤癆I幻覺(jué)”,本身就會(huì)給出錯(cuò)誤的答案。如果凡事都問(wèn)AI大模型,很可能被誤導(dǎo)

大模型做錯(cuò)小學(xué)數(shù)學(xué)題

大模型真的解不了小學(xué)數(shù)學(xué)題?

記者將成女士女兒的題目交給多個(gè)通用大模型:“根據(jù)小學(xué)數(shù)學(xué)知識(shí),用5、5、5、12算‘24點(diǎn)’”,結(jié)果讓人頗意外——

大模型A的答案是(12-5÷5)×2=24。這個(gè)算式本身就不符合題目要求,而且算式的結(jié)果是22,完全不對(duì)。


大模型A上演了“一本正經(jīng)的胡說(shuō)八道”

大模型B的答案是(5+5)×12÷5=24。算式和答案都正確,但在提供解題思路時(shí),大模型說(shuō)算式“(5+5)÷5×12”不對(duì),可這兩個(gè)算式都正確。


大模型B在“思考”過(guò)程中,將正確的解答判斷為錯(cuò)誤

大模型C的答案是(12×(5 + 5))÷5=24??傮w正確,但根據(jù)書(shū)寫(xiě)規(guī)范,算式多了一個(gè)括號(hào),應(yīng)當(dāng)是12×(5 + 5)÷5。


大模型C的解答書(shū)寫(xiě)不規(guī)范

記者又換了幾道小學(xué)數(shù)學(xué)題,發(fā)現(xiàn)大模型解題時(shí),可謂“洋相百出”。例如,有一道題是“不改變1、2、3、4、5這幾個(gè)數(shù)字的次序,在它們間添加四則運(yùn)算符號(hào)以及括號(hào),使結(jié)果等于1,且運(yùn)算過(guò)程中不能出現(xiàn)小數(shù)、負(fù)數(shù)”。大模型給了兩個(gè)答案,分別是“(1×2×3+4) ÷5=1”和“(5+4) ÷3-(2-1)=1”。不難發(fā)現(xiàn),兩個(gè)解答都是錯(cuò)誤的,而且答案二還改變了數(shù)字順序,不符合題目要求。


大模型完全沒(méi)有發(fā)現(xiàn)它給出的答案是錯(cuò)誤的

接著,記者問(wèn)大模型,如果增加一個(gè)數(shù)字6,即在1、2、3、4、5、6中添加四則運(yùn)算符號(hào)以及括號(hào),使結(jié)果等于1,答案是什么?某大模型給出兩個(gè)答案,一是“(1+2+3+4)-(5+6)=1”,另一個(gè)是“1×(2+3+4)-(5+6)=1”,全都不正確。當(dāng)記者用對(duì)話體“嘲笑”大模型“5+6=9”時(shí),大模型竟然回復(fù)“這次5+6=9總算沒(méi)算錯(cuò)!看來(lái)我今天終于把腦子‘重啟’成功了”。


大模型一錯(cuò)再錯(cuò)

可見(jiàn),看似能理解“人”說(shuō)話、無(wú)所不知的AI大模型,其實(shí)有嚴(yán)重缺陷

大模型并不完全理解“人”

為什么大模型不能完成小學(xué)數(shù)學(xué)題?

最主要的原因是AI幻覺(jué)。簡(jiǎn)單來(lái)說(shuō),就是大模型并非完全理解了“人”的提問(wèn),而是通過(guò)算法邏輯給出它認(rèn)為正確的答案;有些時(shí)候,部分大模型為了“討好”提問(wèn)者,還會(huì)虛構(gòu)信息或強(qiáng)詞奪理。

專業(yè)人士指出,數(shù)學(xué)計(jì)算與邏輯推理是AI幻覺(jué)的高發(fā)場(chǎng)景。在計(jì)算過(guò)程中,大模型還可能因?yàn)檫z漏數(shù)字,得出不僅錯(cuò)誤并違背常識(shí)的答案。

例如,有用戶向某大模型詢問(wèn)“雞兔同籠”問(wèn)題,題干是“籠中雞兔共30只,腳88只,求雞兔各有幾只”。大模型用方程解題,將算式“2X+4 (30-X)=88”展開(kāi)為“2X+120-X=88”,遺漏系數(shù) 4,得出“雞-32只、兔62只”的荒謬答案。

值得關(guān)注的是,數(shù)學(xué)題引發(fā)的AI幻覺(jué)或許只是給出錯(cuò)誤答案,而在信息服務(wù)上的AI幻覺(jué)很可能誤事并擾亂社會(huì)秩序。

例如,外省市曾出現(xiàn)網(wǎng)民使用AI大模型生成“汽車尾號(hào)限行”“公共事業(yè)費(fèi)漲價(jià)”等假消息,AI大模型無(wú)法辨別真?zhèn)危瑢⑦@些假消息抓取,成為其數(shù)據(jù)庫(kù)的一部分。這就導(dǎo)致其他網(wǎng)民在查詢相關(guān)信息時(shí),AI大模型以訛傳訛,傳播假消息。

AI幻覺(jué)風(fēng)險(xiǎn)在專業(yè)領(lǐng)域也有破壞性。在北京市通州區(qū)人民法院審結(jié)的一起商事糾紛中,原告代理人直接將AI生成的司法案例作為訴訟依據(jù)。相關(guān)案例看似與案件高度契合,但經(jīng)法官核實(shí),案號(hào)對(duì)應(yīng)的真實(shí)案件與AI描述完全不符,最終該代理意見(jiàn)被駁回,代理人也因用虛假信息擾亂司法秩序受到批評(píng)。

此外,不少專業(yè)人士在了解行業(yè)發(fā)展趨勢(shì)時(shí),會(huì)發(fā)現(xiàn)AI大模型能提供大量的行業(yè)發(fā)展數(shù)據(jù)、調(diào)研報(bào)告,并宣稱它們出自官方或權(quán)威機(jī)構(gòu)。但進(jìn)一步核查會(huì)發(fā)現(xiàn),這些數(shù)據(jù)、報(bào)告都是AI幻覺(jué)的結(jié)果——AI大模型為了迎合提問(wèn)者而杜撰。如果相信這些數(shù)據(jù)、報(bào)告,很可能誤導(dǎo)后期決策。

警惕AI幻覺(jué),這些方法有效

客觀地說(shuō),AI大模型確實(shí)為人們提供了搜索信息、掌握知識(shí)的新途徑。但是,現(xiàn)有的技術(shù)發(fā)展還沒(méi)有辦法完全避免AI幻覺(jué)。那么,怎樣避免被AI幻覺(jué)誤導(dǎo)呢?有幾個(gè)行之有效的好辦法。

首先,追問(wèn)AI大模型,要求大模型提供引用信息的出處。對(duì)于AI給出的關(guān)鍵結(jié)論,如政策條款、數(shù)據(jù)報(bào)告、案例細(xì)節(jié)等,明確要求其標(biāo)注信息來(lái)源,包括具體文件名稱、發(fā)布機(jī)構(gòu)、發(fā)布時(shí)間及官方鏈接。如果AI大模型用“信息來(lái)源于公開(kāi)網(wǎng)絡(luò)”“綜合整理多方資料”等模糊表述回應(yīng),或回避具體出處,基本可以判定信息存疑。

例如,在咨詢某項(xiàng)政策時(shí),可以追問(wèn)AI大模型“政策出處”“官方報(bào)道在哪里”“文件編號(hào)或發(fā)布日期”等,查看追問(wèn)答案,篩除不可靠信息。

其次,求證信息時(shí),不能“問(wèn)AI要答案”,而是“找官方要真相”。

“官方”包括各種政府機(jī)構(gòu)的官方公眾號(hào)、權(quán)威媒體的公眾號(hào)等,而非信息分發(fā)平臺(tái)、短視頻平臺(tái)上的“自媒體號(hào)”。比如,如果關(guān)心時(shí)事政策,可以查詢政府機(jī)構(gòu)或主流媒體的公眾號(hào)。

核查一些“二手信息”或“舊聞”時(shí),可以使用官方公眾號(hào)的“搜索功能”。大部分公眾號(hào)都有“搜索”功能,通常在公眾號(hào)主頁(yè)右上角或帶有“放大鏡”圖標(biāo),輸入信息的關(guān)鍵詞,就能從公眾號(hào)已有信息中匹配對(duì)應(yīng)內(nèi)容。


可以通過(guò)權(quán)威機(jī)構(gòu)公眾號(hào)的“搜索”功能核查信息

其三,交叉核對(duì)不同的官方信源,排除單一信息偏差。如果涉及重要決策,建議交叉核對(duì)兩三個(gè)權(quán)威信源,確保信息無(wú)偏差。比如,想核實(shí)“研究生報(bào)考某導(dǎo)師的研究方向”,除了查看高校官方公眾號(hào)、網(wǎng)頁(yè)發(fā)布的導(dǎo)師介紹外,也可以查詢教育類官方媒體公眾號(hào),核對(duì)信息,避免被AI編造的“導(dǎo)師虛假言論”誤導(dǎo)。

其四,使用AI大模型檢索官方信息發(fā)布渠道。在不確定具體官方平臺(tái)時(shí),可以讓AI提供與需求相關(guān)的官方渠道清單。

比如,想知道“如何查詢個(gè)人個(gè)稅繳納記錄”的答案,可以讓AI大模型列出“國(guó)家稅務(wù)總局官網(wǎng)”“當(dāng)?shù)囟悇?wù)局官方公眾號(hào)”“個(gè)稅 APP”等正規(guī)渠道,再自行登錄查詢。如果AI大模型推薦的渠道包含非官方平臺(tái),如商業(yè)資訊網(wǎng)站、個(gè)人運(yùn)營(yíng)的“稅務(wù)咨詢號(hào)”,要提高警惕,不可輕信。

最后,如果發(fā)現(xiàn)某條信息官方暫無(wú)報(bào)道,那么,比詢問(wèn)AI大模型“有沒(méi)有”更穩(wěn)妥的方式是“等待權(quán)威發(fā)布”。因?yàn)樵贏I大模型的“知識(shí)庫(kù)”或者說(shuō)數(shù)據(jù)庫(kù)中,既有官方信息,也有小道消息,不少信息來(lái)自自媒體的“自說(shuō)自話”甚至“胡編亂造”。當(dāng)網(wǎng)民有需求時(shí),AI大模型會(huì)將這些消息提供給提問(wèn)者,或者自動(dòng)捏造不實(shí)信息。所以,等待權(quán)威報(bào)道遠(yuǎn)好于問(wèn)AI“要答案”。

總之,可以把AI作為工具檢索信息,但不要全盤(pán)相信它給出的結(jié)果。

微信編輯:何夕

還原事實(shí),洞悉真相。

歡迎關(guān)注,留言舉報(bào)!

除了辟謠,這里還關(guān)注網(wǎng)絡(luò)熱點(diǎn),及時(shí)回應(yīng)網(wǎng)友關(guān)切,追蹤事件進(jìn)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
重磅!日本兩大機(jī)場(chǎng)對(duì)華航線將暫時(shí)“歸零”!

重磅!日本兩大機(jī)場(chǎng)對(duì)華航線將暫時(shí)“歸零”!

日本窗
2025-12-30 16:21:16
永州已奪冠3天 美女老板靜悄悄:承諾送車疑變口嗨 108萬(wàn)也是假的

永州已奪冠3天 美女老板靜悄悄:承諾送車疑變口嗨 108萬(wàn)也是假的

風(fēng)過(guò)鄉(xiāng)
2025-12-30 07:43:09
陳克明面條被明粉抵制,河南衛(wèi)視“萬(wàn)馬踏青”節(jié)目被清粉舉報(bào)刪除

陳克明面條被明粉抵制,河南衛(wèi)視“萬(wàn)馬踏青”節(jié)目被清粉舉報(bào)刪除

歷史總在押韻
2025-12-30 16:36:54
普京遇襲!特朗普憤怒!莫斯科天空癱瘓!戰(zhàn)爭(zhēng)目標(biāo)擴(kuò)大!

普京遇襲!特朗普憤怒!莫斯科天空癱瘓!戰(zhàn)爭(zhēng)目標(biāo)擴(kuò)大!

漢唐智庫(kù)
2025-12-30 09:37:04
武漢一拆遷辦主任涉嫌侵吞4300萬(wàn)被判緩刑:錢(qián)被幕后領(lǐng)導(dǎo)分了!

武漢一拆遷辦主任涉嫌侵吞4300萬(wàn)被判緩刑:錢(qián)被幕后領(lǐng)導(dǎo)分了!

兵叔評(píng)說(shuō)
2025-12-30 13:00:58
體制內(nèi)“近親繁殖”,現(xiàn)階段無(wú)解

體制內(nèi)“近親繁殖”,現(xiàn)階段無(wú)解

冰川思想庫(kù)
2025-12-30 11:38:23
“玩具店主買(mǎi)賣槍支案”檢方撤訴后,兩當(dāng)事人申請(qǐng)國(guó)賠53萬(wàn)余元

“玩具店主買(mǎi)賣槍支案”檢方撤訴后,兩當(dāng)事人申請(qǐng)國(guó)賠53萬(wàn)余元

澎湃新聞
2025-12-30 16:38:26
媒體們賣力宣傳俄羅斯游,老藝術(shù)家們的腳步卻停留在了洛杉磯

媒體們賣力宣傳俄羅斯游,老藝術(shù)家們的腳步卻停留在了洛杉磯

林中木白
2025-12-30 12:25:50
不要買(mǎi)!一級(jí)致癌物超標(biāo)9000倍,成本最低僅1元,央視曝光

不要買(mǎi)!一級(jí)致癌物超標(biāo)9000倍,成本最低僅1元,央視曝光

另子維愛(ài)讀史
2025-12-30 20:42:23
6國(guó)宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底 咱媽動(dòng)真格了

6國(guó)宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底 咱媽動(dòng)真格了

花花娛界
2025-12-30 20:11:35
1499元飛天茅臺(tái)登陸i茅臺(tái),元旦起開(kāi)放申購(gòu)

1499元飛天茅臺(tái)登陸i茅臺(tái),元旦起開(kāi)放申購(gòu)

觀察者網(wǎng)
2025-12-30 19:52:16
初中畢業(yè)裝貴婦,8萬(wàn)退休金是編的,別墅是租的,就是帶貨的

初中畢業(yè)裝貴婦,8萬(wàn)退休金是編的,別墅是租的,就是帶貨的

西樓知趣雜談
2025-12-30 13:16:05
伊朗要出大問(wèn)題了,貨幣里亞爾暴跌至145萬(wàn)兌1美元

伊朗要出大問(wèn)題了,貨幣里亞爾暴跌至145萬(wàn)兌1美元

金召點(diǎn)評(píng)
2025-12-30 07:55:02
解放軍無(wú)人機(jī)視角俯瞰臺(tái)灣省

解放軍無(wú)人機(jī)視角俯瞰臺(tái)灣省

澎湃新聞
2025-12-30 23:15:06
36歲網(wǎng)紅“卡車西施”雪天行車不幸遇難!家里有植物人父親和兩孩

36歲網(wǎng)紅“卡車西施”雪天行車不幸遇難!家里有植物人父親和兩孩

火山詩(shī)話
2025-12-30 13:28:04
“退貨羽絨服口袋現(xiàn)機(jī)票”引爭(zhēng)議!買(mǎi)家遭網(wǎng)暴喊冤:衣服疑二次銷售,自己只穿過(guò)一次,已報(bào)警!銷售方稱視頻系供貨廠家發(fā)布

“退貨羽絨服口袋現(xiàn)機(jī)票”引爭(zhēng)議!買(mǎi)家遭網(wǎng)暴喊冤:衣服疑二次銷售,自己只穿過(guò)一次,已報(bào)警!銷售方稱視頻系供貨廠家發(fā)布

每日經(jīng)濟(jì)新聞
2025-12-30 16:18:06
5步解鎖WPS永久免費(fèi)使用,不充會(huì)員,所有功能全開(kāi)無(wú)限制

5步解鎖WPS永久免費(fèi)使用,不充會(huì)員,所有功能全開(kāi)無(wú)限制

時(shí)尚的弄潮
2025-12-30 15:23:20
奔馳高管回應(yīng)邁巴赫轎車冰雪測(cè)試失控打滑:方向盤(pán)被人為加大角度并延遲回正

奔馳高管回應(yīng)邁巴赫轎車冰雪測(cè)試失控打滑:方向盤(pán)被人為加大角度并延遲回正

金融界
2025-12-30 14:36:26
美女老板跑路!刪光所有視頻 承諾永州奪冠就送車 鐵了心反悔耍賴

美女老板跑路!刪光所有視頻 承諾永州奪冠就送車 鐵了心反悔耍賴

念洲
2025-12-30 20:21:50
2026央視跨年晚會(huì)正式官宣!最被期待明星排名出爐,周深僅排第4

2026央視跨年晚會(huì)正式官宣!最被期待明星排名出爐,周深僅排第4

洲洲影視娛評(píng)
2025-12-30 17:11:13
2025-12-31 02:28:49
網(wǎng)絡(luò)辟謠 incentive-icons
網(wǎng)絡(luò)辟謠
上海市網(wǎng)信辦、解放日?qǐng)?bào)出品
4840文章數(shù) 37116關(guān)注度
往期回顧 全部

科技要聞

估值150億的智元,開(kāi)始批量"制造"小獨(dú)角獸

頭條要聞

轟-6K飛行員:已到達(dá)任務(wù)空域?qū)棞?zhǔn)備完畢 可以發(fā)射

頭條要聞

轟-6K飛行員:已到達(dá)任務(wù)空域?qū)棞?zhǔn)備完畢 可以發(fā)射

體育要聞

聯(lián)盟第一人倒下了!掘金還有底牌嗎?

娛樂(lè)要聞

林俊杰女友被扒 父親涉經(jīng)濟(jì)案卷款13億?

財(cái)經(jīng)要聞

朱光耀:美關(guān)稅政策正使WTO名存實(shí)亡

汽車要聞

標(biāo)配華為乾崑ADS 4 Pro 華境S明年上半年上市

態(tài)度原創(chuàng)

健康
教育
旅游
時(shí)尚
數(shù)碼

這些新療法,讓化療不再那么痛苦

教育要聞

清華附中集團(tuán)再擴(kuò)軍!背后的升學(xué)信號(hào)看懂了么

旅游要聞

元旦假期!忻州這些景區(qū)、場(chǎng)館開(kāi)放時(shí)間有變

在這里,我們拍到了雪原上的一抹瑞紅

數(shù)碼要聞

天使吉米推出RITA主動(dòng)降噪Hi-Fi頭戴式耳機(jī),399元

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产激情av| 久久久久久久久毛片精品| 日本少妇不卡| 女同久久精品国产99国| 国产一区二区三区皇色网站 | 色伊人亚洲综合网站| 亚洲人妻精品中文字幕| 好紧好湿夹太紧了好爽| 天天影视色欲综合网| 国产成人久久777777| 亚洲美女偷拍 久久| 色一伊人区二区亚洲最大| 色欲精品久久人妻av无码| 亚洲午夜成人av电影| 中国少妇伦子伦视频播放| 丁香婷婷六月| 人妻在线无码一区二区三区| 欧美国产一区二区| 波多野结衣电影网站免费观看视频 | 亚洲国产在一区二区三区| 性丰满白嫩白嫩的HD124| 中文字幕日韩有码国产| 99视频精品全部在线观看| 久热这里只有精品蜜臀av| 麻麻张开腿让我爽了一夜| 影音先锋色站| 动漫精品一区二区三区在线| 好紧啊好疼啊进去视频| 精品国产午夜| 无码人妻不卡一区二区| 成人无码特黄特黄AV片在线| 城中村发廊在线快餐| 无人视频免费看wwwvideoscom| 久久精品私人影院免费看| 爆乳熟妇一区二区三区蜜臀Av| 亚洲AV日韩AV南美| 韩国三级丰满40少妇高潮| 精品一线二线三线无人区| 日韩一卡2卡3卡4卡乱码免费网| 蜜臀久久99精品久久久久免费| 国产激情无码一区二区三区|