2018知网学位论文检测的算法你知道吗?

作者:知网检测 发布时间:2018-09-10 09:50:56

不管是要毕业的大学生、硕士研究生还是博士研究生,都会要经历知网论文检测。现在大部分的高校都使用知网进行查重,而重复率则是判定是否抄袭的最好依据。所以如何降低重复率就成了必修的课程,而在此之前得先了解知网论文检测的算法,只有了解了知网论文检测的算法,才会大大降低你文章的重复率。


一、段落阀值为5%


知网对于检测系统设置了一个阀值,阀值为5%,以段落为单位,所以一般低于5%的重复是不会被检测出来的,而高于5%的,不用说,是一定会被检测出来的,而这种多用于大段落中的小句或小概念。举个例子吧,如果一个段落有3000字,那么引用单篇文献150个字一下,是没关系的。不过有个解决的办法,就是引用文献的时候,可以多选择几篇文章,而不是一篇文章,每篇也只引用几句就可以了,这样就会降低重复率。


二、文章格式最好用Word


知网学位论文为整篇上传,那么,一篇文章的格式就显得很重要了,比如目录,目录表达的是后面章节的信息,知网论文检测系统会根据目录检测论文的章节信息,当然有时候目录也会被当成正文检测,会被标红,这个时候就应该注意目录的撰写格式。再比如用PDF或者用Word上传,其实两者都是存在乱码的风险的,可是PDF的风险会多一重,因为PDF会比Word多一个文本转换的过程,这个过程有可能会将你原本正确的的目录和参考文献格式打乱,所以,论文的格式很重要,需要注意。


三、连续13个字重复就会被标红


知网论文检测的条件是连续13个字重复或相似就会被红字标注,被判定为重复,不过引用的文献总字数和在各个检测段落中达到5%以上才会被标红。有些学校会要求检测参考文献,如果参考文献格式正确且规范的情况下,一般是不会被记重复的。所以,无论是在引用文献还是在撰写参考文献的情况下,都要注意字数且格式的正确性。


四、模糊算法


知网论文检测采用的是模糊算法,如果整体结构和大纲被打乱,可能会引起同一处的文章第一次检测和第二次检测标红不一致,或者第一次检测没有标红的部分第二次检测被标红。这样就会导致论文的查重率有很大的变动,所以我们在修改文章的时候多变换一下,在不改变原意的情况下运用不同的方式表达出来。

.—— END ——.

客服QQ 返回顶部