我抄我自己的论文,能算侵权吗?有学者做了一份论文复用指南

机器学习算法与Python实战

共 2600字,需浏览 6分钟

 ·

2021-07-14 09:04

↑↑↑点击上方蓝字,回复资料,10个G的惊喜

来自:机器之心

自己抄自己,即使不算无处不在,那也是相当普遍。


这是一份来自《Science》的严肃讨论:我抄我自己的论文,能算侵权吗?


假设一个场景:研究者将已经发表过的论文内容,重新用于正在撰写的新论文,这合理吗?如果不合理,又是为什么?

从学界的反馈来说,大多数同行都不赞同这种「自我剽窃」式的使用方法。但当杜克大学的研究者 Cary Moskovitz 企图寻找相关的正式文献来进行写作教学指导时,却空手而归。

「几乎没人对这种做法进行过实质研究」,Cary Moskovitz 说道。学界并没有真正探讨过研究人员复用自己论文内容的频率,也没有严肃讨论过这种复用是否构成侵权,也没有调查过研究人员看待某种复用方法是对或错。

因此,Cary Moskovitz 决定填补这一空白。他开展了一个叫做文本复用(Text Recycling Research Project)的项目,并公布了面向编辑和作者的指南,阐述了与之相关的道德及法律规则,以及如何透明呈现复用文本的原则。指南系列文章正在持续更新中。


项目地址:https://textrecycling.org/

北卡罗来纳大学夏洛特分校的研究伦理学家 Lisa Rasmussen 说,这些指南用自我剽窃之外的方式重新阐述了这些问题:「过分关注自我会导致一些问题。」例如,一些在特定主题上已经花费了数十年时间的研究人员,可能会在另一项研究中使用非常相似的方法,然后就可以简单地剪切、粘贴他们论文的方法部分。「我们不应该让他们洗一遍自己的话,只为了避免被软件系统检测出来。」而这套手段正是许多期刊编辑的常规操作。

科研文章中复用文本分布的示例。

Moskovitz 表示,文本复用在科研中「即使不算无处不在,但也很普遍。」在美国国家科学基金会的资助下,他和一位同事分析了 400 篇近期发表的技术论文,并构建了一种算法来计算同一资助款项下所产生的多篇论文中的句子相似程度,并让人类编码人员交叉检查结果。结果发现,每篇文章平均有 3 个句子属于完全复用或包含大量复用的短语,但在多篇论文中出现一整块相同文本是不常见的。

生物(BIO)、工程(ENG)、数学物理科学(MPS)和社会行为经济科学(SBC)四个学科领域中,每篇文章中复用语句的平均数量。

左为完全复用,右为部分复用。

Moskovitz 发现,即使是收集了关于文本复用的指南,眼下也还有一些没回答的重要伦理问题,例如在作者成员只有部分重叠时,如何处理两篇论文中重复使用的文本?虽然出版道德委员会 (COPE) 描述了一些可以接受的文本复用情况,但该指南是为编辑准备的,而不是研究人员。

除此之外,法律上的问题也很重要。Moskovitz 表示,在对跨学科顶级期刊编辑的一项调查中,他们发现,由于担心侵犯版权,编辑经常要求研究人员「刷新表述方式」。这是因为出版商容易在版权上遇到麻烦,然而编辑们不确定在什么情形下,重新措辞在法律上是必要的。根据 TRRP 指南,从法律角度来看,这种刷新表述通常是不必要的,因为有充分的理由认为它属于美国版权法中的「合理使用」。

编辑们通常要求作者更改表述方式。

为了提供更详细的指导,Moskovitz 及其同事开始借鉴期刊出版商和其他专家(包括 COPE)的建议。这份建议区分了不同类型的文本复用,例如重用来自未发表工作的文本,或者在多篇已发表的论文中重复一种方法的描述。

他们认为,适当地复用文本有助于准确地传达想法。根据该指南,「更新一下表述」这种操作实际上可能比复用更不道德,因为它掩盖了材料已被重复使用的事实。但该指南建议不要在多个场所发表相同的作品,例如对已发表的文章进行小改动并将其提交到其他地方。

Evan Kharasch 是杜克大学的麻醉师和《Anesthesiology》杂志的主编,他没有参与 TRRP 项目,但最近他在 TRRP 的指导下率先制定了该期刊的第一个关于文本复用的编辑规则。当作者描述标准方法或协议时,现在杂志允许他们使用与先前出版物相同或「基本等效」的文本,只要标注引用原始来源。


地址:https://pubs.asahq.org/anesthesiology/article/135/1/1/115824/Authorship-and-Publication-Matters-Credit-and

让人们对他们所做的事情使用最好的描述似乎是合理的,即使它之前已经发表过,」他说。

Rasmussen 希望 TRRP 指南将帮助编辑将重点放在最有可能保护研究完整性的文本复用方面。她指出,简单地使用抄袭检测软件标记文本重复并不能真正确保完整性,并且可能会产生不必要的工作量,这「没有实现任何真正有助于研究诚信的事情」。

而 Moskovitz 希望 TRRP 指南能够帮助人们更好地理解文本复用的范围,并就何时可以合乎道德地进行复用行程共识。「科学研究本质上是循序渐进的,」他说:「人们都说站在巨人的肩膀上,但在某些方面,人们是站在自己的肩膀上。」

参考链接:
https://onlinelibrary.wiley.com/doi/abs/10.1002/leap.1259
https://www.tandfonline.com/doi/abs/10.1080/08989621.2020.1850284?journalCode=gacr20
https://www.sciencemag.org/news/2021/06/when-self-plagiarism-ok-new-guidelines-offer-researchers-rules-recycling-text

推荐阅读

(点击标题可跳转阅读)

下载 | 经典著作《机器学习:概率视角》.pdf
从贝叶斯定理到概率分布:详解概率论

机器学习:XGBoost vs 神经网络

斯坦福大学计算机系,所有课程!

关于决策树,你一定要知道的知识点!

Python 优化提速的 8 个小技巧

老铁,三连支持一下,好吗?↓↓↓


浏览 32
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报