有关学术规范与论文查重率的评论

作者:佚名 发布时间:2019-07-11 15:22:00

快要毕业了,全国各类大学都在进行论文答辩和授位活动。于是论文查重成了校园内最热门的话题。碰巧,翟天临“博士”又在这个风口上火了一把。前不久翟“博士”再上新浪微博热搜榜。理由很简单,“你可把我们坑苦了!”原来是毕业生们调侃的“翟一代”不得不面临较往年严苛得多的论文查重率要求,被迫通宵修改论文,以求查重率降到标准线以下,能顺利通过答辩的最后关口。


据说这都是因为翟天临“博士”今年春节火得不要不要的后果。然而事实上,这是自去年以来教育部开始严查学位论文运动的效应。据悉,诸如四川大学、北京大学等学校都在去年下半年开始严查博士学位论文,并因此要求大批学位论文修改并重新送交外审。一时间研究生们紧张异常。到了今年2月22日,教育部更是进一步加码,宣布今年将强化对学术不端行为的监督查处,进一步开展硕士博士学位论文抽检等工作。而这项工作中最为重要的指标之一就是论文的查重率。


本来应该为此举大力叫好,然而事情的进展却不得不让人要质疑一番:严查论文运动将论文查重率置于如此之高地位是否科学?是否合理?


答案当然是否定的。因为这是滥用大数据技术进行论文重复率管控,是一种赤裸裸的形式主义和技术迷信。


大数据技术虽然进步神速,但远没有媒体上吹嘘的那么神奇。恰恰相反,它有极大限制,用于论文查重局限很大。目前大数据技术仍然不能在语义层面上实现真正意义的文本分析。数据科学家采用的办法是通过对自然语言的概率统计算法来比对不同文本语句和段落之间的相似性,也就是一致性检测。然而,语义层面的事实和统计层面的事实是两码事。抄袭本质上是语义层面的事实,而靠概率统计查出的重复只是个统计事实,并不是语义事实。二者可能重合,但绝不等同。当然,二者之间的交叉重合为查认抄袭提供了一个可行的方法。但其局限也一清二楚。


因此,尽管精度较之前的关键字技术有了很大提升,大数据查重技术仍然无法识别和区分哪些引用是必须的,哪些引用不是必须的。因为学者们为了论证引用资料必然会提高重复率,但重复并不就等于抄袭。特别是在较为传统的人文社会学科中,大量的资料引用在所难免,在文献学、古籍校勘、历史考证等学科中更是高频率事件。因而不少大学的文科院系只好在查重率之外另行规定一些标准。但这样一来就跟官方一刀切的标准发生冲突。于是锅就只好扔给毕业生来背了。


由此可见,将基于数据技术的查重率置于如此高的地位是一种颠倒。人,才是学术的主体和根本。本质上,大数据技术只能是一种辅助,不能代替人进行学术鉴别和评价。颠倒主次的做法就是偷懒和形式主义,也是管理者不想负责的表现。通过这种指标管控,管理者可以把所有的锅都甩掉。然而真正的学术质量并不能由此得到提高。因为观点的深浅,论证的松严,见解的高低,研究的创造性,都不是查重率能解决的。管理者们对此无能为力,实际操作中也只有扔给外审专家。专家们也不是吃素的,他们也懂得背锅要吃亏,当然也就愈严愈好,也搞一刀切,好推卸责任。于是毕业生们又多了一层压力。


不难判断,如此片面强调论文查重率不过是一种基于官僚主义的技术迷信。以为靠技术上的苛严标准能解决我国高校中的教学和学术沉疴,无非痴人说梦。真正解决问题的办法还是要老实做好高校教学,认真推动学术共同体的公开公平交流,从而逐步形成每个学科中相对客观的专业标准。


试问:如果学术水平能靠大数据技术提高,那我们以后把学术都交给计算机岂不就一切都OK了?还要教师、学生和学术管理者做什么呢?

.—— END ——.

客服QQ 返回顶部