对某医学杂志一期已发表论文再查重的分析
作者 :  张儒祥 唐萌

  [摘要]利用科技期刊学术不端文献检测系统(AMLC),对某医学杂志一期36篇论文进行出版后查重,61.1%的论文文字复制比小于25%,77.8%小于40%。进一步分析文字复制比大于25%的14篇论文,发现有7篇论文作者存在学术不端行为。因此,进行一次性论文查重是不够的,有必要增加论文出版前查重和出版六个月后查重,以及时发现学术不端论文并有所作为。
  [关键词]学术期刊 论文 出版 查重 学术不端行为
  [中图分类号]G237 [文献标识码] A [文章编号] 1009-5853 (2013) 02-0045-03
  1985年美国国会颁布第一部关于科学不端行为的条例,将科学不端行为定义为伪造(fabrication)、篡改(falsification)、抄袭(plagiarism)及其他科学界所不能接受的严重行为[1]。随后人们对此现象倍加关注并展开深入探讨,把不当署名、一稿多投、一个学术成果多篇发表等行为也明确定性为科学不端行为。2010年3月24日,《中国青年报》发表记者蒋昕捷的《一起医学研究者“连环抄袭门”》的报道,提出为防止学术不端论文,有必要对已发表论文进行出版后“随访”[2]。目前,科技期刊编辑部门基本上能够做到对投稿在送审前进行论文查重,并对查重中发现的问题进行规律性分析[3-6]。考虑到查重的时滞性,有的编辑部早已实行在稿件送审前和稿件拟刊用前二次查重的制度[7-8]。但在论文发表后再行“随访”查重的鲜有报道。因此,笔者对《东南大学学报(医学版)》一期论文进行了出版后的查重研究,旨在进一步发现论文撰写中的学术不端行为并予以纠正。
  1 研究对象
  以2012年第1期36篇论文作为研究对象,利用科技期刊学术不端文献检测系统(AMLC)进行论文出版后的查重。按系统中文字复制比的划分标准,对文字复制比大于25%的论文,从出版前后文字复制比、前三位有重合的比对论文的文字复制比累计值、最高文字复制比论文是否为其本人、涉及论文出版时间等方面进行统计分析。
  2 统计结果
  所选论文已出版近三个月,文字复制比最高者达90%。61.1%的论文文字复制比小于25%,77.8%小于40%,但有7篇论文存在严重问题(具体分布见表1和表2)。文字复制比大于25%的14篇论文中,除两篇定稿前查重缺失外,其他12篇论文的文字复制比均高于出版前。有重合的比对论文前三篇累计文字复制比,基本接近或者超过所查论文的最终文字复制比。仅有3篇所检论文的最高复制比的比对论文为其所发。88.4%(99/112)有重合的比对论文没有被引用,21.4%(24/112)有重合的比对论文在2011年至2012年出版。
  3 讨 论
  3.1 出版后查重的必要性
  在AMLC开发和被各编辑部使用前,编辑部查重使用的数据库一般为中国知网期刊全文数据库、万方数字化期刊、重庆维普的中文科技期刊数据库及题录式数据库(如医学方面的CBMdisc)等[7-8],效率较低,耗时耗力,查全率和查准率均较低,真正做到在稿件送审前和稿件拟刊用前二次查重的编辑部为数不多。随着AMLC的逐步推广和各编辑部对这项工作的重视,稿件送审前查重工作已常态化。鉴于AMLC数据库收录期刊范围、入库时滞等原因,实际文字复制比过一段时间后会有所升高。从这次对36篇已发表论文的查重结果来看,文字复制比大于51%的有7篇,其中2篇为一稿两投,3篇涉嫌抄袭,2篇属于不当引用。因此,虽然对出版后的论文进行查重属事后行为,但非常有必要,有助于编辑部主动发现并及时处理可能发生的著作权纠纷,更有效地防止学术不端行为,纠正论文发表过程中的错误,清理污染文献,使学术环境越变越好。
  3.2 正确对待文字复制比
  从这次研究来看,影响文字复制比的因素有五方面。一是比对数据库收录文献量。AMLC收录了期刊、学位论文、会议论文、报纸、年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源,还集成整合出版了各类第三方数据库资源,所以,使用AMLC查重有一定资源优势。但自2008年万方数据库分别获得中华医学会、中国医师协会等机构的医学期刊全文独家数据库与网络发行权以来,AMLC就不再收录这些医学期刊。因此,仅用AMLC查重,就不能与这些期刊所载论文进行比对。二是文献入库时滞。送审前的文字复制比低于定稿前和出版后,很大程度上是由文献入库时滞造成的。由表2可知,在与文字复制比大于25%的14篇论文有重合的比对论文中,有24篇发表于2011年至2012年之间。三是一稿多投。我们在对第13号论文进行比对时发现,该文参考文献中有一位作者一稿两投,而所投的另一篇文献在参考文献表中没有被著录,从而使文字复制比增加了11.5%。四是被比对论文的组成。有的论文图、表、公式等较多,如论著类;有的文字较多,如护理、教育管理、综述类等。这些都会影响对论文的判断。五是公知公认的知识。一般常识性的或者教科书上的知识,特别是概念性知识,当被作者用来阐释或讨论问题时,也会增加文字复制比。此现象在多篇论文中出现。正因为影响文字复制比的因素非常复杂,所以,编辑需要审查有重合的文字,避免误判。
  3.3 查重时需注意的问题
  在做查重工作时,应注意四个问题。第一,要注意交叉查重。不能只依靠AMLC,还须在万方数据知识服务平台上进行论文相似性检测,特别是医学类论文。第二,要实行在稿件送审前和稿件拟刊用前二次查重制度。经过此次出版后查重研究,我们更加认识到出版前再次查重的重要性,这样可以尽可能杜绝出版有问题的论文。第三,认真比对有重合的比对文献。对文字复制的情况要有清晰的判断,如是复制句子还是复制段落,是整句复制还是意思不变、句式改变或者同义替换。另外,对有重合的比对文献,还要与参考文献表中的文献进行分析比较,判断它们之间有无引证、抄袭、一稿多投的关系。第四,即时调整查重报告。可以删除系统给出的某些抄袭来源文献,得到新检测结果。刘清海[9]研究发现,学术不端医学论文中重复文字主要集中在方法、结果和讨论中。杨柱星等[10]对医学论文学术不端进行特点分析后发现:重合文字比例,县级论文>市级论文>省级论文,文献综述>学术论文>,护理论文>临床研究(治疗)论文;重合文字主要集中在材料与方法、讨论两部分。对于方法重合的,我们认为只要引而标注,可以删除报告中的比对文献,重新生成报告。