论文查重应区别对待

　　一、查重软体引发非议　　近年来，中国学术界的学术不端行为广受诟病。且不说某些「聪明」的大学生抄袭论文，有关论文造假的报道已涉及多位专家学者，包括两院院士。学术不端行为已蔓延到学界泰斗。为了有效遏制学术不端行为，中国学术界检查论文重复率的软体（以下简称「查重软体」）登上了历史舞台，充当起了论文裁判的角色。不知从何时起，高校用查重软体来判断学生毕业论文是否为抄袭之作，期刊也用查重软体来评判稿件的真伪和优劣。中国学术界似乎找到了评判论文真伪和质量的「万能钥匙」。

　　然而，这「万能钥匙」也引起了不少非议。这些查重软体能查文字的重复率，查不出论文的创新点；能够识别文字描述，不能识别公式、图表；作弊的学生随便用些雕虫小技就能顺利通过查重检测，等等。虽然不少大学教师包括名牌大学的教师对用查重软体评判论文很有意见，私下议论时怨声载道，但在痛斥学术不端的大环境与国家支持开发软体来预防学术不端行为的大气候下，加之公众相信软体技术的科学性，于是大家觉得议论查重软体现存问题很不合时宜，懒得花时间将一堆意见整理成文字。不过还是有一些有识之士发出了心声。沿著他们的足迹，我们也抛砖引玉地呼吁一下：论文查重应区别对待。只能查文字重复率、不能辨识论文创新点的查重软体不用于建模类论文为好。

　　如果查重软体只能检测文字重复率，不能辨识论文创新点，那么即使它是用计算机语言编写的程序，其科学性也会受到怀疑。创新意味著新事物对旧事物的否定，应该是辩证的否定，而不是形而上学的否定。辩证的否定是新旧事物间联系的环节。新事物是从旧事物脱胎而来，与旧事物间有著必然的内在联系。新事物在否定旧事物根本性质的同时，会保留旧事物中的积极因素与合理成分，将其作为自身生存与发展的基础。形而上学的否定是全盘抛弃，没有保留和继承。用计算机语言编写的程序也是人为的产物，人工智慧可以相信但不能迷信。　　二、查重软体使用现状　　目前在查重软体市场上，有几款比较流行的学术不端检测系统。查重的方法大体相同，简言之，就是将被检论文与已收录在该检测系统资料库中的学位论文、期刊论文和会议论文的栏位进行比较，若被检论文的文字部分有连续13个字相同就会被标成红字。最后查重系统会出具针对被检论文的检测报告单，若被标红文字的复制比占文章总字元数的比例超过论文拟收录单位的容忍度上限，就一律不能通过或者发表。目前这些检测系统或查重软体主要能检测文字重复率，而对公式、图表等信息还无法实现重复率检测。

　　正所谓「道高一尺、魔高一丈」。某些学生为了使自己抄袭的文章能通过查重软体的检测，只需上网输入「论文查重通关秘籍」，就能搜到上百种对付论文查重的修改技巧。概括起来大体有以下几类方法：一是调整原文段落与格式法。就是把大段落切分成若干小段落，并对小段落中的每句话进行同义句转换。二是插入空格法。将文章中所有的字间插入空格，然后将空格字间距调到最小。因为查重的根据是以词为基础的，空格切断了词语，自然可蒙过查重系统。三是翻译外文文献的办法。四是插入图标网格的办法。五是抄袭未被录入查重系统资料库的书籍文献的办法。还有其他办法。极具讽刺意味的是，通过灵活运用上述方法，抄袭的文章绝大多数都能顺利通过查重软体的检测。

　　再看看那些在网上进行论文重复率检测交易的商家。相关检测系统的账号在网上的销售价格，从1元至几百元不等。买方在付款后就可得到一个登录账号，在指定网站登录后便可自助检测。一些售价较高的检测系统，还会根据查重结果提出修改意见。不过，由于一次购买只能用一个系统检测一次，很多毕业生为了让他们抄袭的论文经化妆后更加「保险」地通过检测系统查重，会选择不同检测系统多次查重。而经学校用这样的检测系统初次检查没能通过的论文，也需要在修改后反复查重。于是，进行网上论文重复率检测交易的商家在大学生毕业论文写作季里赚得盆满钵满。让人不禁要问：究竟谁是「查重政策」实施的真正受益者？千万别好心办了坏事，不但没有制止住学术不端行为，反而给学生们增加了经济负担，最后肥了那些别有用心的商贩。　　三、学术方面的质疑　　就学术本身而言，最重要的一个质疑是：如果查重软体的人工智慧程度还只是停留在机械地检测文字重复率、而察觉不到所研究问题的背景或假设条件已深刻变化，那么，我们今后会不会在学术期刊上更多地看到善于文字游戏的高谈阔论？而那些潜心研究、没有华丽辞藻、追求简练准确、～针见血的表意，根据不同假设条件建立相应数理模型、通过推导论证得出政策建议的真论文是不是只能一次又一次地被查重软体拒之门外呢？　　以经济学中著名的交叠世代模型（简称OLG模型）为例，使用该模型的论文除包括引言、结语等部分外，建模论证部分主要包括以下四步：一是模型建立和设定。可细分为经济环境的假设、个人效用最大化、企业利润最大化、政府预算平衡、资本市场供求平衡等。二是推导动态均衡系统，寻求稳定条件。三是比较静态分析。考察模型中所关注的各政策变数对经济系统里内生变数的影响。四是数值实验。对第三步不能确定影响方向的政策变数通过赋值模拟的方式来考察其对内生变数的影响方向和程度。严格按照上述程序规范创作的论文既条理清晰又高度凝练，能体现数理模型类论文所蕴含的「多一字有余、少一字不足」的简洁之美。然而，若用现有的查重软体来检测这类论文，在模型的建立、推导、求解、模拟等部分就会出现非常高的文字重复率，被查重软体判别为抄袭。

　　建立数理模型研究不同的问题，如同用泡菜坛子泡制不同的蔬菜一样。工具相同、辅料相同、程序相同，重复率虽然很高，但泡制的蔬菜不同，可以是白菜、萝卜、青椒等。用数理模型研究不同的问题，也类似于用卤汤炖肉。工具相同、辅料相同、程序相同，虽然重复率很高，但卤煮的肉不同，可以是猪肉、羊肉、牛肉等。查重软体的开发者和使用者应该清楚这一点。四、结论

　　数理模型不过是研究工具。对模型的建立、推导、求解、模拟等过程的描述已经形成了相对规范的程序和简要准确的语句。如果机械地要求文字重复率不得超过百分之多少，那么作者只能将简要准确的语句改成冗长的语句，而且描述还不一定准确。可见，对模型建立、推导、求解、模拟等过程的描述不应简单地采取「软体查重」方式来评判。　　对于建模类论文的引言和结语两部分则可采用「软体查重」方式来评判。因为引言部分通常陈述论文选题的重要意义、研究动机、社会需求、文献回顾、论文任务、特色创新、重要发现等，不同论文的引言应该不同。结语部分通常总结论文已做工作、主要结果、社会价值、政策建议、不足与展望等，不同论文的结语也应该不同。所以，对建模类论文的引言和结语两部分可利用「软体查重」方式来评判。

　　综上所述，对于使用相对固定格式和程序的数理模型研究问题的论文，「中国知网软体查重」只适用于论文的引言和结语等定性分析部分，而不适用于模型的建立、推导、求解、模拟等建模论证部分。交叠世代模型就属于这种数理模型。如果查重软体只能检测文字重复率、不能识别论文背景和假设条件的深刻变化、不能辨识论文创新之处，那么这样的查重软体还是不要用于建模类论文为好。
推荐阅读：