一、查重的主要内容
1. 正文文字内容
这是查重系统的核心检查部分,包括:
- 连续文字重复:通常5个或以上连续字符的重复会被标记
- 段落结构相似:即使替换了部分词汇,但段落结构和表达方式相似也可能被检测
- 专业术语和固定表达:某些专业术语无法避免重复,但合理使用通常不会被过度标记
- 引用格式:正确引用的内容通常会被识别,但过度引用仍会影响总重复率
2. 图表和公式
现代查重系统已经能够识别和检查:
- 图表标题和说明:图表的标题、图例、注释等文字内容
- 表格内容:表格中的文字、数字等数据
- 公式描述:虽然公式本身难以查重,但公式的文字描述和解释会被检查
3. 参考文献和引用
参考文献的处理方式因系统而异:
- 参考文献列表:大部分系统会排除或降低参考文献列表的权重
- 文内引用:正确格式的引用通常会被识别,但引用内容过多仍会影响重复率
- 自引问题:作者自己已发表文章的引用也可能被计入重复率
4. 其他容易被忽视的内容
- 摘要和关键词:这部分内容通常会被严格检查
- 致谢部分:虽然权重较低,但仍会被检查
- 附录内容:包括补充材料、代码等
- 脚注和尾注:注释中的文字内容