論文改了又改,重復(fù)率反而更高?多半是這3個原因在作怪
同一篇論文拿去查重,有時候會得出不同的結(jié)果,其實(shí)挺正常的。主要是因?yàn)椴橹叵到y(tǒng)本身就有很多不同的版本,而且每個版本背后的數(shù)據(jù)庫也不完全一樣,所以測出來結(jié)果有差異并不奇怪。這也是為什么我們一直提醒大家,自己提前查的時候,盡量選和學(xué)校一樣的系統(tǒng)、一樣的版本。
大部分同學(xué)很難一次就過,所以一般都會查好幾次。那為什么同一篇論文兩次查重結(jié)果會不一樣呢?有時候問客服,他們也未必能說得清楚。下面,小編就以PaperEE查重系統(tǒng)為例,來跟大家詳細(xì)聊聊這背后的幾個原因。
1. 你檢測的內(nèi)容有變動
很多同學(xué)在PaperEE上查完之后,發(fā)現(xiàn)重復(fù)率有點(diǎn)高,就會去修改,然后再查。但你可能沒注意到,哪怕只是改了一小部分內(nèi)容,系統(tǒng)重新解析論文時,章節(jié)劃分可能會變,重復(fù)計算的范圍也可能不同,結(jié)果自然就會有出入。說白了,查重系統(tǒng)看你的論文,不是一個字一個字孤立去對的,它會把文章切成一個個“小片段”來對比。你前面增增減減幾個字,就好像推倒了一塊多米諾骨牌,系統(tǒng)對整個文章結(jié)構(gòu)的劃分可能就跟著變了。比如你本來第三章里有一句是重復(fù)的,你把它改掉了,系統(tǒng)可能就會認(rèn)為你第三章的邊界發(fā)生了變化,轉(zhuǎn)而用新的方式去計算其他章節(jié)的重復(fù),這樣一來,之前沒標(biāo)紅的地方,第二次說不定就紅了,反之亦然。所以啊,有時候真不是系統(tǒng)出錯了,而是你動過的文章在系統(tǒng)眼里已經(jīng)成了“另一篇”結(jié)構(gòu)稍有不同的文章了。
2. 系統(tǒng)數(shù)據(jù)庫一直在更新
論文查重系統(tǒng)里的數(shù)據(jù)是聯(lián)網(wǎng)更新的,今天的數(shù)據(jù)和昨天的可能就不一樣。數(shù)據(jù)庫一變,查重的結(jié)果當(dāng)然也可能跟著變。這就好比你上周搜一個冷門概念,網(wǎng)上可能就那么幾篇文章提到,但過了幾天,突然有新的博客或論文發(fā)表了,也討論了這個概念。系統(tǒng)把這篇新文章收進(jìn)數(shù)據(jù)庫后,你再查,你論文里那句話可能就因?yàn)楦挛恼伦曹嚩慌袨橹貜?fù)。這個尤其是對于經(jīng)常引用的最新研究數(shù)據(jù)或熱點(diǎn)話題來說,特別明顯。
3. 查重算法也會升級
為了更貼近大家的寫作習(xí)慣和學(xué)術(shù)規(guī)范,論文查重系統(tǒng)會不定期更新算法。每次算法一升級,哪怕內(nèi)容完全一樣,測出來的結(jié)果也可能有細(xì)微差別。比如,早期的系統(tǒng)可能對連續(xù)7個字相同就標(biāo)紅,但現(xiàn)在大家寫作都精了,會刻意避開這種“字面重復(fù)”,所以系統(tǒng)也在進(jìn)化。它可能會變得更智能,開始關(guān)注“語義重復(fù)”,也就是意思一樣但換了個說法的情況;或者它調(diào)整了對引用格式的識別靈敏度,以前可能不判重的短引用,現(xiàn)在也給算進(jìn)去了。這些算法上的小修小補(bǔ),目的都是為了更精準(zhǔn)地識別真正的抄襲,但客觀上就會造成同一篇文章在不同時間點(diǎn)檢測,結(jié)果有細(xì)微的波動。 不過這種差異通常不會太大,一般不會影響你最后的通過。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.