論文查重應區別對待

　　一、查重軟體引發非議　　近年來，中國學術界的學術不端行為廣受詬病。且不說某些「聰明」的大學生抄襲論文，有關論文造假的報道已涉及多位專家學者，包括兩院院士。學術不端行為已蔓延到學界泰斗。為了有效遏制學術不端行為，中國學術界檢查論文重複率的軟體（以下簡稱「查重軟體」）登上了歷史舞台，充當起了論文裁判的角色。不知從何時起，高校用查重軟體來判斷學生畢業論文是否為抄襲之作，期刊也用查重軟體來評判稿件的真偽和優劣。中國學術界似乎找到了評判論文真偽和質量的「萬能鑰匙」。

　　然而，這「萬能鑰匙」也引起了不少非議。這些查重軟體能查文字的重複率，查不出論文的創新點；能夠識別文字描述，不能識別公式、圖表；作弊的學生隨便用些雕蟲小技就能順利通過查重檢測，等等。雖然不少大學教師包括名牌大學的教師對用查重軟體評判論文很有意見，私下議論時怨聲載道，但在痛斥學術不端的大環境與國家支持開發軟體來預防學術不端行為的大氣候下，加之公眾相信軟體技術的科學性，於是大家覺得議論查重軟體現存問題很不合時宜，懶得花時間將一堆意見整理成文字。不過還是有一些有識之士發出了心聲。沿著他們的足跡，我們也拋磚引玉地呼籲一下：論文查重應區別對待。只能查文字重複率、不能辨識論文創新點的查重軟體不用於建模類論文為好。

　　如果查重軟體只能檢測文字重複率，不能辨識論文創新點，那麼即使它是用計算機語言編寫的程序，其科學性也會受到懷疑。創新意味著新事物對舊事物的否定，應該是辯證的否定，而不是形而上學的否定。辯證的否定是新舊事物間聯繫的環節。新事物是從舊事物脫胎而來，與舊事物間有著必然的內在聯繫。新事物在否定舊事物根本性質的同時，會保留舊事物中的積極因素與合理成分，將其作為自身生存與發展的基礎。形而上學的否定是全盤拋棄，沒有保留和繼承。用計算機語言編寫的程序也是人為的產物，人工智慧可以相信但不能迷信。　　二、查重軟體使用現狀　　目前在查重軟體市場上，有幾款比較流行的學術不端檢測系統。查重的方法大體相同，簡言之，就是將被檢論文與已收錄在該檢測系統資料庫中的學位論文、期刊論文和會議論文的欄位進行比較，若被檢論文的文字部分有連續13個字相同就會被標成紅字。最後查重系統會出具針對被檢論文的檢測報告單，若被標紅文字的複製比占文章總字元數的比例超過論文擬收錄單位的容忍度上限，就一律不能通過或者發表。目前這些檢測系統或查重軟體主要能檢測文字重複率，而對公式、圖表等信息還無法實現重複率檢測。

　　正所謂「道高一尺、魔高一丈」。某些學生為了使自己抄襲的文章能通過查重軟體的檢測，只需上網輸入「論文查重通關秘籍」，就能搜到上百種對付論文查重的修改技巧。概括起來大體有以下幾類方法：一是調整原文段落與格式法。就是把大段落切分成若干小段落，並對小段落中的每句話進行同義句轉換。二是插入空格法。將文章中所有的字間插入空格，然後將空格字間距調到最小。因為查重的根據是以詞為基礎的，空格切斷了詞語，自然可蒙過查重系統。三是翻譯外文文獻的辦法。四是插入圖標網格的辦法。五是抄襲未被錄入查重系統資料庫的書籍文獻的辦法。還有其他辦法。極具諷刺意味的是，通過靈活運用上述方法，抄襲的文章絕大多數都能順利通過查重軟體的檢測。

　　再看看那些在網上進行論文重複率檢測交易的商家。相關檢測系統的賬號在網上的銷售價格，從1元至幾百元不等。買方在付款後就可得到一個登錄賬號，在指定網站登錄後便可自助檢測。一些售價較高的檢測系統，還會根據查重結果提出修改意見。不過，由於一次購買只能用一個系統檢測一次，很多畢業生為了讓他們抄襲的論文經化妝後更加「保險」地通過檢測系統查重，會選擇不同檢測系統多次查重。而經學校用這樣的檢測系統初次檢查沒能通過的論文，也需要在修改後反覆查重。於是，進行網上論文重複率檢測交易的商家在大學生畢業論文寫作季里賺得盆滿缽滿。讓人不禁要問：究竟誰是「查重政策」實施的真正受益者？千萬別好心辦了壞事，不但沒有制止住學術不端行為，反而給學生們增加了經濟負擔，最後肥了那些別有用心的商販。　　三、學術方面的質疑　　就學術本身而言，最重要的一個質疑是：如果查重軟體的人工智慧程度還只是停留在機械地檢測文字重複率、而察覺不到所研究問題的背景或假設條件已深刻變化，那麼，我們今後會不會在學術期刊上更多地看到善於文字遊戲的高談闊論？而那些潛心研究、沒有華麗辭藻、追求簡練準確、～針見血的表意，根據不同假設條件建立相應數理模型、通過推導論證得出政策建議的真論文是不是只能一次又一次地被查重軟體拒之門外呢？　　以經濟學中著名的交疊世代模型（簡稱OLG模型）為例，使用該模型的論文除包括引言、結語等部分外，建模論證部分主要包括以下四步：一是模型建立和設定。可細分為經濟環境的假設、個人效用最大化、企業利潤最大化、政府預算平衡、資本市場供求平衡等。二是推導動態均衡系統，尋求穩定條件。三是比較靜態分析。考察模型中所關注的各政策變數對經濟系統里內生變數的影響。四是數值實驗。對第三步不能確定影響方向的政策變數通過賦值模擬的方式來考察其對內生變數的影響方向和程度。嚴格按照上述程序規範創作的論文既條理清晰又高度凝練，能體現數理模型類論文所蘊含的「多一字有餘、少一字不足」的簡潔之美。然而，若用現有的查重軟體來檢測這類論文，在模型的建立、推導、求解、模擬等部分就會出現非常高的文字重複率，被查重軟體判別為抄襲。

　　建立數理模型研究不同的問題，如同用泡菜罈子泡製不同的蔬菜一樣。工具相同、輔料相同、程序相同，重複率雖然很高，但泡製的蔬菜不同，可以是白菜、蘿蔔、青椒等。用數理模型研究不同的問題，也類似於用鹵湯燉肉。工具相同、輔料相同、程序相同，雖然重複率很高，但鹵煮的肉不同，可以是豬肉、羊肉、牛肉等。查重軟體的開發者和使用者應該清楚這一點。四、結論

　　數理模型不過是研究工具。對模型的建立、推導、求解、模擬等過程的描述已經形成了相對規範的程序和簡要準確的語句。如果機械地要求文字重複率不得超過百分之多少，那麼作者只能將簡要準確的語句改成冗長的語句，而且描述還不一定準確。可見，對模型建立、推導、求解、模擬等過程的描述不應簡單地採取「軟體查重」方式來評判。　　對於建模類論文的引言和結語兩部分則可採用「軟體查重」方式來評判。因為引言部分通常陳述論文選題的重要意義、研究動機、社會需求、文獻回顧、論文任務、特色創新、重要發現等，不同論文的引言應該不同。結語部分通常總結論文已做工作、主要結果、社會價值、政策建議、不足與展望等，不同論文的結語也應該不同。所以，對建模類論文的引言和結語兩部分可利用「軟體查重」方式來評判。

　　綜上所述，對於使用相對固定格式和程序的數理模型研究問題的論文，「中國知網軟體查重」只適用於論文的引言和結語等定性分析部分，而不適用於模型的建立、推導、求解、模擬等建模論證部分。交疊世代模型就屬於這種數理模型。如果查重軟體只能檢測文字重複率、不能識別論文背景和假設條件的深刻變化、不能辨識論文創新之處，那麼這樣的查重軟體還是不要用於建模類論文為好。
推薦閱讀：