夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI幻覺(jué)論文混進(jìn)高分評(píng)審,數(shù)千篇投稿或存學(xué)術(shù)瑕疵

0
分享至

距離 OpenReview 因代碼漏洞導(dǎo)致審稿人身份大規(guī)模泄露的“開(kāi)盒事件”僅僅過(guò)去不到兩周,ICLR 又翻車(chē)了。

前兩天,AI 內(nèi)容檢測(cè)機(jī)構(gòu) GPTZero 發(fā)布的最新調(diào)查報(bào)告顯示,在隨機(jī)抽取的 300 篇 ICLR 2026 投稿論文中,超過(guò) 50 篇論文被檢測(cè)出存在明顯的 AI 幻覺(jué)問(wèn)題。這些問(wèn)題涵蓋了偽造參考文獻(xiàn)、捏造不存在的作者以及編造實(shí)驗(yàn)數(shù)據(jù),其中部分論文在同行評(píng)審階段甚至獲得了均分 8.0 的高分評(píng)價(jià)。


圖 | 部分問(wèn)題論文(來(lái)源:GPTZero)

然而,就在今年 8 月 27 日,ICLR 組委會(huì)曾正式發(fā)布針對(duì) LLM 使用的嚴(yán)格規(guī)范,明確要求作者對(duì)論文中由 AI 生成的任何內(nèi)容負(fù)責(zé),并嚴(yán)厲禁止偽造數(shù)據(jù)或誤導(dǎo)性陳述。這項(xiàng)政策本意是為當(dāng)下過(guò)熱的 AI 輔助研究設(shè)立一道防火墻。


(來(lái)源:X)

但現(xiàn)實(shí)表明,這道墻有些不堪一擊了。

GPTZero 的創(chuàng)始人 Alex Cui 及其團(tuán)隊(duì)對(duì) ICLR 2026 的投稿進(jìn)行了小范圍抽樣核查。調(diào)查結(jié)果顯示,在被抽檢的 300 篇論文中,有 16% 的樣本包含了無(wú)法在現(xiàn)實(shí)世界中驗(yàn)證的引文或數(shù)據(jù)。按照 ICLR 本屆會(huì)議近 2 萬(wàn)篇的投稿總量推算,可能有數(shù)千篇包含嚴(yán)重學(xué)術(shù)瑕疵的論文正混跡于評(píng)審流程之中。更令人擔(dān)憂(yōu)的是,這些本應(yīng)在初審階段就被“直接拒稿”(Desk Reject)的問(wèn)題論文,不僅未被系統(tǒng)攔截,反而順利進(jìn)入了同行評(píng)審環(huán)節(jié),部分甚至獲得了極高的評(píng)價(jià)。

在被曝光的具體案例中,一篇題為 TamperTok 的投稿論文引發(fā)了廣泛關(guān)注。該論文在評(píng)審系統(tǒng)中獲得了均分 8.0 的成績(jī)。在 ICLR 的評(píng)分體系中,這一分?jǐn)?shù)通常意味著論文具備沖擊 Oral(口頭報(bào)告)或 Spotlight(特別關(guān)注)資格的潛力,代表了投稿中前 1.8% 的頂尖水平。

然而,GPTZero 的檢測(cè)工具發(fā)現(xiàn),該論文在參考文獻(xiàn)部分存在嚴(yán)重的幻覺(jué)現(xiàn)象。作者引用了一篇據(jù)稱(chēng)發(fā)表于 NeurIPS 2023(神經(jīng)信息處理系統(tǒng)大會(huì))的論文,雖然引用的論文標(biāo)題與年份在現(xiàn)實(shí)中確實(shí)存在,但作者名單卻被完全篡改。原本的真實(shí)作者團(tuán)隊(duì)被替換為一組完全不相關(guān)的人名。


圖 | 原作者名單(來(lái)源:arXiv)


圖 | 幻覺(jué)論文作者名單(來(lái)源:Openreview)

這是典型的 AI 幻覺(jué)特征: 模型在概率預(yù)測(cè)中拼湊出了看似合理但實(shí)則虛構(gòu)的信息。令人遺憾的是,負(fù)責(zé)評(píng)審該論文的四位審稿人均未發(fā)現(xiàn)這一明顯硬傷,一致給出了高分推薦。

類(lèi)似的作者幻覺(jué)還出現(xiàn)在一篇名為 MixtureVitae 的均分 8.0 論文中。與直接篡改全部作者不同,這篇論文在引用時(shí)采用了“真假參半”的策略。它在引用列表中保留了被引論文的前三位真實(shí)作者,后面幾位作者的名字要么是完全虛構(gòu),要么是只拼對(duì)了一半。這種混合了真實(shí)信息與虛構(gòu)信息的手段具有極強(qiáng)的欺騙性,極易逃過(guò)審稿人的常規(guī)檢查。


圖 | 問(wèn)題論文引用文獻(xiàn)作者 (來(lái)源:OpenReview)


圖 | 原論文作者(來(lái)源:arXiv)

除了上述試圖通過(guò)“高仿真”手段蒙混過(guò)關(guān)的案例外,調(diào)查還發(fā)現(xiàn)了一些近乎荒誕的低級(jí)錯(cuò)誤,例如一篇 6 分論文引用完全不存在的文獻(xiàn)。


圖 | GPTZero 檢測(cè)出引用無(wú)效文獻(xiàn)(來(lái)源:GPTZero)

此外,一篇名為《Safe-LLM》的投稿論文更是令人哭笑不得,明明正在參與 ICLR 2026 的評(píng)審,但其頁(yè)眉位置赫然標(biāo)注著“Published at ICLR 2025”。


(來(lái)源: OpenReview)

在另一篇名為 IMPQ 的論文中,障眼法則高明一些:該論文在引用時(shí)提供了一個(gè)真實(shí)存在的 arXiv ID。如果審稿人僅是機(jī)械地驗(yàn)證鏈接的有效性,會(huì)發(fā)現(xiàn)該 ID 確實(shí)指向一個(gè)有效的 arXiv 頁(yè)面。


圖 | IMPQ 參考文獻(xiàn)引用(來(lái)源:OpenReview)


圖 | 論文 arXiv 鏈接指向頁(yè)面(來(lái)源:arXiv)

然而,一旦對(duì)比頁(yè)面內(nèi)容,就會(huì)發(fā)現(xiàn)該 ID 對(duì)應(yīng)的真實(shí)論文標(biāo)題、作者與投稿論文中引用的信息完全不符。這種“掛羊頭賣(mài)狗肉”的手法利用了審稿人在高強(qiáng)度工作負(fù)荷下可能產(chǎn)生的倦怠,比純粹的虛構(gòu)更難被發(fā)現(xiàn)。

此次 GPTZero 披露的 50 篇問(wèn)題論文,也是學(xué)術(shù)界評(píng)審目前面臨的重要問(wèn)題。

隨著大語(yǔ)言模型降低了論文寫(xiě)作的門(mén)檻,各大頂級(jí)會(huì)議的投稿量呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。ICLR 2026 共收到了 19,490 篇研究論文投稿,產(chǎn)生了超過(guò) 75,000 條評(píng)審意見(jiàn)。但合格的審稿人資源是有限的,無(wú)法匹配如此龐大的審核需求。供需失衡導(dǎo)致了評(píng)審質(zhì)量的稀釋?zhuān)踔脸霈F(xiàn)了“用 AI 對(duì)抗 AI”的惡性循環(huán)。

之前 OpenReview 的信息泄露就證明了這一點(diǎn):不僅稿子存在 AI 痕跡,大量審稿意見(jiàn)本身也是 AI 生成的。有數(shù)據(jù)顯示,約有 21% 的 ICLR 同行評(píng)審意見(jiàn)可能由人工智能生成,超過(guò)一半的評(píng)審帶有使用 AI 輔助的痕跡。

這種現(xiàn)象如果得不到遏制,真正具備創(chuàng)新價(jià)值的人類(lèi)研究成果就有可能被淹沒(méi)在由模型生成的冗余信息中。

同時(shí),ICLR 組委會(huì)在今年 8 月出臺(tái)的新規(guī)中曾強(qiáng)調(diào),作者必須對(duì) LLM 的使用進(jìn)行公開(kāi)披露,并對(duì)論文內(nèi)容的準(zhǔn)確性承擔(dān)最終責(zé)任,違規(guī)者將面臨拒稿等處罰。

可從目前的實(shí)際情況來(lái)看,單純依賴(lài)作者的道德自律和事后追責(zé)已經(jīng)難以形成約束。GPTZero 的檢測(cè)結(jié)果表明,現(xiàn)有的同行評(píng)審流程缺乏針對(duì) AI 幻覺(jué)的有效技術(shù)攔截手段。哪怕是最基礎(chǔ)的參考文獻(xiàn)核查,在面對(duì)數(shù)以萬(wàn)計(jì)的投稿時(shí)也成為了巨大的人力負(fù)擔(dān),導(dǎo)致大量顯而易見(jiàn)的錯(cuò)誤被遺漏。

https://gptzero.me/news/iclr-2026/

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
用拉菲漱口金磚墊腳,他貪了超11個(gè)億,為模特一夜花888萬(wàn)元

用拉菲漱口金磚墊腳,他貪了超11個(gè)億,為模特一夜花888萬(wàn)元

揚(yáng)平說(shuō)史
2025-11-03 19:33:10
26歲文科生任浙大博導(dǎo),刺痛誰(shuí)?6篇頂刊難敵大眾公平焦慮

26歲文科生任浙大博導(dǎo),刺痛誰(shuí)?6篇頂刊難敵大眾公平焦慮

教育人看世界
2025-12-09 12:42:22
487億巨虧炸穿地產(chǎn)圈!萬(wàn)科踩錯(cuò)關(guān)鍵一步,翻身希望藏在哪

487億巨虧炸穿地產(chǎn)圈!萬(wàn)科踩錯(cuò)關(guān)鍵一步,翻身希望藏在哪

快看張同學(xué)
2025-12-08 09:03:28
高市早苗想不通,中國(guó)突然甩出第二張王牌,特朗普只能裝聾作啞

高市早苗想不通,中國(guó)突然甩出第二張王牌,特朗普只能裝聾作啞

靚仔情感
2025-12-09 16:00:47
中場(chǎng)球星爆發(fā)!紅魔球迷終于等來(lái)“真核”回歸

中場(chǎng)球星爆發(fā)!紅魔球迷終于等來(lái)“真核”回歸

星耀國(guó)際足壇
2025-12-09 11:54:32
美防長(zhǎng)通知中國(guó),美國(guó)不做3件事,日本收到通牒,特朗普不留廢物

美防長(zhǎng)通知中國(guó),美國(guó)不做3件事,日本收到通牒,特朗普不留廢物

諦聽(tīng)骨語(yǔ)本尊
2025-12-09 16:33:01
已經(jīng)等了一個(gè)月了,中方還未審批通過(guò),日媒:15年前的危機(jī)或重演

已經(jīng)等了一個(gè)月了,中方還未審批通過(guò),日媒:15年前的危機(jī)或重演

蘭妮搞笑分享
2025-12-09 13:55:03
世界上最大的淡水珍珠來(lái)自中國(guó),清朝時(shí)期被荷蘭商人偷渡出境

世界上最大的淡水珍珠來(lái)自中國(guó),清朝時(shí)期被荷蘭商人偷渡出境

觸摸史跡
2025-11-19 10:46:56
23歲男中介帶看房9分鐘,女客戶(hù)報(bào)警稱(chēng)被強(qiáng)奸,6個(gè)G視頻揭露真相

23歲男中介帶看房9分鐘,女客戶(hù)報(bào)警稱(chēng)被強(qiáng)奸,6個(gè)G視頻揭露真相

懸案解密檔案
2025-05-09 17:03:55
正式官宣,45歲霍啟剛傳喜訊,令四大家族刮目相看,郭晶晶沒(méi)說(shuō)錯(cuò)

正式官宣,45歲霍啟剛傳喜訊,令四大家族刮目相看,郭晶晶沒(méi)說(shuō)錯(cuò)

一娛三分地
2025-12-09 15:40:12
出大事了,美戰(zhàn)機(jī)被導(dǎo)彈擊落,誰(shuí)干的?調(diào)查結(jié)果公布,英法俄失聲

出大事了,美戰(zhàn)機(jī)被導(dǎo)彈擊落,誰(shuí)干的?調(diào)查結(jié)果公布,英法俄失聲

青煙小先生
2025-12-06 19:49:07
2025年“演技最好”的7位男演員:于和偉第4,第1名當(dāng)之無(wú)愧

2025年“演技最好”的7位男演員:于和偉第4,第1名當(dāng)之無(wú)愧

洲洲影視娛評(píng)
2025-12-07 14:45:43
撇開(kāi)南京、蘇州、無(wú)錫不談,盤(pán)點(diǎn)江蘇省城建水平最好的5座城市

撇開(kāi)南京、蘇州、無(wú)錫不談,盤(pán)點(diǎn)江蘇省城建水平最好的5座城市

遼寧打工者談城市發(fā)展
2025-12-09 12:21:43
隔輩親能夸張到啥程度?網(wǎng)友:我又不是死了,不能直接愛(ài)?!

隔輩親能夸張到啥程度?網(wǎng)友:我又不是死了,不能直接愛(ài)?!

帶你感受人間冷暖
2025-12-08 00:10:10
摩爾線(xiàn)程:即將發(fā)布新一代GPU架構(gòu)

摩爾線(xiàn)程:即將發(fā)布新一代GPU架構(gòu)

澎湃新聞
2025-12-09 14:02:26
中國(guó)終于明白戰(zhàn)勝?lài)?guó)的優(yōu)勢(shì)! 美國(guó)已意識(shí)到:自己也被中國(guó)裝進(jìn)去了

中國(guó)終于明白戰(zhàn)勝?lài)?guó)的優(yōu)勢(shì)! 美國(guó)已意識(shí)到:自己也被中國(guó)裝進(jìn)去了

阿纂看事
2025-12-08 09:26:18
杜康酒回應(yīng)主播歧視成都:系試用期;河南足協(xié)人士:成都球迷先罵人

杜康酒回應(yīng)主播歧視成都:系試用期;河南足協(xié)人士:成都球迷先罵人

懂球帝
2025-12-08 18:34:08
分走劉鑾雄資產(chǎn),終成人生贏(yíng)家,如今卻開(kāi)賬號(hào)勾毛線(xiàn) 判若兩人

分走劉鑾雄資產(chǎn),終成人生贏(yíng)家,如今卻開(kāi)賬號(hào)勾毛線(xiàn) 判若兩人

以茶帶書(shū)
2025-11-19 23:13:35
全國(guó)最好的醫(yī)院排名,建議收藏!

全國(guó)最好的醫(yī)院排名,建議收藏!

霹靂炮
2025-11-24 22:55:34
胡歌帶田樸珺爬4200米財(cái)神山!田樸珺全程撒嬌,兩人互動(dòng)更像情侶

胡歌帶田樸珺爬4200米財(cái)神山!田樸珺全程撒嬌,兩人互動(dòng)更像情侶

好賢觀(guān)史記
2025-12-01 14:18:01
2025-12-09 17:31:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15963文章數(shù) 514359關(guān)注度
往期回顧 全部

科技要聞

H200是不是要讓中國(guó)“上癮”?

頭條要聞

新國(guó)標(biāo)實(shí)施后有電動(dòng)車(chē)店現(xiàn)"空柜" 店員:銷(xiāo)售幾乎停擺

頭條要聞

新國(guó)標(biāo)實(shí)施后有電動(dòng)車(chē)店現(xiàn)"空柜" 店員:銷(xiāo)售幾乎停擺

體育要聞

“蘇炳添時(shí)代”正式畫(huà)上句號(hào)

娛樂(lè)要聞

尖叫之夜劉宇寧打包餅干被嘲寒酸?

財(cái)經(jīng)要聞

縣城經(jīng)濟(jì)神話(huà),夢(mèng)醒時(shí)分

汽車(chē)要聞

2026款比亞迪夏到底改了什么?一句話(huà):更懂生活了

態(tài)度原創(chuàng)

時(shí)尚
教育
手機(jī)
房產(chǎn)
本地

毛衣這么選,顯瘦又時(shí)髦!

教育要聞

別再混淆!機(jī)械工程vs機(jī)械設(shè)計(jì)制造及其自動(dòng)化,一文說(shuō)清差異

手機(jī)要聞

海外牛人評(píng)年度最佳,小米17 Pro Max、OPPO Find X9 Pro上榜

房產(chǎn)要聞

年度王炸來(lái)了!央企TOP級(jí)頂豪落地三亞CBD,引爆富人圈!

本地新聞

云游安徽|一城活史,千年智慧守淮南

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 久久久久人人人人| 亚洲无码视频在线免费观看AA| 日韩高清无码不卡一区二区| 亚洲无亚洲人成网站9999| 亚洲自拍偷拍福利小视频| 欧美成aⅴ人高清免费观看| 国产在线精品欧美日韩电影| 蜜桃精品日韩一区二区三区| 日本免费视频| 日韩精品一区二区四季| 免费看日日夜夜操| 一区二区三区手机免费视频| 老熟女午夜一区二区三区 | 国产亚洲精品无码成人小说| 少妇人妻AV无码专区| 久久精品国产亚洲av不卡| 一本大道香蕉高清久久| 欧州三级视频| 国产精品久久久久久人妻无| 国产精品丝袜| 在线A毛片免费视频观看| 国产一区二区在线播放| 狠狠色噜噜狠狠狠狠奇米777| 伊人狼人影院| 亚洲欧美激情在线一区| 国产成人噜噜噜久久久久| 无码av孕妇专区| 亚洲婷婷视频| 一日本道伊人久久综合影| 亚洲乱伦中字| 亚洲AV无码麻豆成人| 无忧果冻av| 国产69精品久久久久9999APGF| 成在人线av无码免观看麻豆| 天堂一区二区三区四区| 久久羞羞色院精品全部免费| 2021精品亚洲中文字幕| 俄罗斯老熟妇性爽xxxx| 国产精品激情亚训一二三国产一区| 五月开心丁香婷婷| 丰满美女一级黄片|