網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

反擊AI論文！arXiv每年拒掉2%造假內(nèi)容，自動化工具加入審核

2025-08-14 15:35:48　來源: 量子位

北京舉報

分享至

鷺羽發(fā)自凹非寺
量子位 | 公眾號 QbitAI

AI生成論文泛濫成災(zāi)，arXiv平臺看不下去了——

緊急升級審核機制，用自動化工具來檢測AI生成內(nèi)容。

Nature最新發(fā)現(xiàn)，原來每年竟然都有2%的論文會因為AI使用被拒？！

比如像，bioRxiv和medRxiv每天都要拒絕十多篇公式化AI手稿，每個月就高達(dá)7000多份。

本來是方便快速分享成果的預(yù)印本平臺，現(xiàn)已成為了AI內(nèi)容的溫床。

一方面AI寫作泛濫成災(zāi)，另一方面又要確保不會誤傷到合理的AI英語潤色需求。

兩難之間，預(yù)印本平臺也是出手整頓了…….

不過這件事還得從一篇離譜的預(yù)印本論文說起。

AI生成內(nèi)容泛濫

這篇論文題目名為“自我實驗報告：夢境中生成式人工智能界面的出現(xiàn)”，7月發(fā)表在PsyArXiv上。

乍一看好像沒什么問題，直到“不幸”被一名心理學(xué)家點開了文檔。

嚯好家伙，整篇論文只有短短幾頁，署名還只有作者Jiazheng Liu一個人，也沒有注明隸屬機構(gòu)。

再仔細(xì)看看內(nèi)容呢，所描述的AI實驗更是脫離實際，基本可以蓋棺定論用了AI。

由于沒有明確聲明AI的使用情況，PsyArxiv也是立即下架刪除了這篇論文。

結(jié)果沒過多久，由于預(yù)印本審核不嚴(yán)，該作者再次在PsyArxiv上傳了標(biāo)題和摘要幾乎一模一樣的預(yù)印本。

另外作者還向Nature附了一封郵件，郵件內(nèi)容表示AI在該論文生成中發(fā)揮作用有限，只用于數(shù)學(xué)推導(dǎo)、符號計算、組裝和應(yīng)用現(xiàn)有數(shù)學(xué)工具、公式驗證以及另外八項任務(wù)。

他稱自己是常駐中國的獨立研究人員，沒有高等教育學(xué)位，唯一的工具還是臺二手智能手機……當(dāng)然，現(xiàn)在第二個版本也已被刪除。

不過這也只是眾多AI生成論文中的其中一篇，據(jù)arXiv估計，每年都有約2%的論文，因為涉及AI和專門批量造假學(xué)術(shù)論文的論文工廠，而被平臺拒之門外。

尤其是在ChatGPT推出后，這一比例還出現(xiàn)了大幅度增長的情況，LLM生成了arXiv上22%的計算機科學(xué)摘要以及約10%的bioRxiv生物學(xué)摘要。

在一些發(fā)表在生物醫(yī)學(xué)期刊的摘要中，AI生成也達(dá)到了14%。

PsyArXiv也對此發(fā)表了聲明，明確表示涉及AI生成的論文內(nèi)容有所增加，對于他們這類降低研究共享門檻的非盈利組織而言，越來越多諸如此類的內(nèi)容，只會讓讀者削弱對平臺共享內(nèi)容的信任程度。

篩選低質(zhì)量的內(nèi)容需要資源支持，且會降低論文提交后的處理速度，這與預(yù)印本平臺致力于讓科學(xué)家們更容易發(fā)表工作的初心相悖。

而與此同時，AI幻覺導(dǎo)致的虛假預(yù)印本也會帶來錯誤信息，誤導(dǎo)從事相關(guān)工作的科研人員。

如何能夠在保持快速審核的同時，確保質(zhì)量水平，現(xiàn)已成為預(yù)印本平臺共同的挑戰(zhàn)。

預(yù)印本平臺沒有坐以待斃

要知道，AI論文生成并不能全盤否定，許多研究人員會使用AI工具來提高清晰度或者總結(jié)數(shù)據(jù)，尤其是對于一些英語非母語的作者，他們需要AI協(xié)助完成潤色工作。

這是相當(dāng)合理的行為，并不存在論文欺詐，真正值得擔(dān)心的是那些完全由AI捏造方法、結(jié)果的論文內(nèi)容。

但二者之間其實相當(dāng)難以區(qū)分，一些預(yù)印本平臺，如PsyArXiv，會直接撤下被標(biāo)記為內(nèi)容存疑的論文，但還有一些平臺考慮到可能會誤傷，所以雖然也會將內(nèi)容標(biāo)記為“已撤回”，但在沒有明確法律要求的情況下，不會直接進(jìn)行刪除。

不過他們也沒有坐以待斃，現(xiàn)在會使用各種自動化工具和人工篩選程序來捕捉此類可疑內(nèi)容，如Research Square正在使用一款名為Geppetto的工具來檢測人工智能生成文本的痕跡。

arXiv也在試圖提高綜述性論文的發(fā)表標(biāo)準(zhǔn)，因為這類論文往往投稿數(shù)量巨大，且很多都是AI生成，這樣做的目的就是為了豐富個人履歷。

一直依賴人工篩選的openRxiv，現(xiàn)在也在尋求自動化工具使用，以進(jìn)一步識別AI生成內(nèi)容的特征。

當(dāng)前預(yù)印本平臺們都正在加急采取一系列反制措施，包括檢查異常用戶行為、在投稿流程中增設(shè)步驟、調(diào)整內(nèi)容公開可見的方式或時間，以阻止低質(zhì)量內(nèi)容進(jìn)入平臺。

但這無異于隔靴搔癢，預(yù)印本平臺在反擊的同時，AI也在不斷發(fā)展。

更有甚者，一些作者為了規(guī)避被自動化工具抓住AI使用痕跡，會在論文里加入提示詞，試圖欺騙自動評審。

也有專業(yè)的編輯表示，這對于預(yù)印本平臺來說相當(dāng)可怕，因為預(yù)印本其實本質(zhì)還是未經(jīng)人工審查的。

所以當(dāng)未來AI發(fā)展到，虛假與真實內(nèi)容之間已經(jīng)完全無法區(qū)分的時候，預(yù)印本平臺又將如何應(yīng)對呢？

參考鏈接：
[1]https://www.nature.com/articles/d41586-025-02469-y
[2]https://www.cos.io/blog/evaluating-ai-impact-on-open-research-infrastructure

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.