论文查重,也称论文检测或学术不端检测,是通过专业的软件系统,将待检测的论文与已发表的文献、网络资源等进行比对,以识别文本重复率的过程。其主要目的是维护学术诚信,防止抄袭和剽窃行为。
万方数据是中国知名的学术资源服务平台,其开发的论文查重系统(万方检测)广泛应用于高校、科研机构和期刊出版单位。该系统依托万方庞大的学术文献数据库,为用户提供论文重复率检测服务。
万方查重系统主要通过以下几个步骤来检测论文重复:
系统首先对上传的论文进行格式解析和文本提取,去除无关的格式信息(如页眉页脚、图片等),只保留可分析的文本内容。
将论文内容切分为连续的文本片段(如连续的13个字或更多),并对每个片段进行特征标记,便于后续的快速比对。
将提取的文本片段与万方庞大的比对数据库进行逐一对比。数据库主要包括:
系统根据匹配到的相似片段,计算整篇论文的总重复率。通常以"总文字复制比"来表示,即重复文字占全文的比例。
查重完成后,系统会生成详细的检测报告,通常包括:
注意:不同机构对重复率的要求不同,一般本科论文要求低于30%,硕士论文低于15%,博士论文低于10%。具体标准需咨询所在单位。
如果查重结果偏高,可以通过以下方式修改: