北理工硕士生「一字不差」抄袭顶会投稿,网友:买论文被忽悠了?

开发者技术前线

共 2175字,需浏览 5分钟

 ·

2021-09-27 09:56


点击“开发者技术前线”,选择“星标”

让一部分开发者看到未来


转自:机器之心

竟然如此明目张胆,一字不差地抄袭NeurIPS 2020的论文投稿。
最近AI圈怪事连连,论文抄袭、学历造假事件不断。特别是论文抄袭,是学术圈屡禁不止的一种现象。

前段时间,一篇 ICML 2021 论文的作者举报某 ICCV 2021 接收论文的事件轰动整个社区。被三大视觉顶会ICCV接收的该篇论文也被撤稿。

ICCV抄袭事件刚过去不久,又有作者在知乎爆料某北理工硕士几乎一字不差地抄袭其论文并上传arXiv。

该话题在知乎上已经引发社区热议,热度高达 1057万,登上知乎科技热榜第一。



此次抄袭者与被抄袭者均为国内研究人员。

旷视研究员实锤北理工硕士抄袭


近日,旷视研究员王剑锋在知乎上发文,实锤北京理工大学和河海大学的三位作者共同上传arXiv的一篇论文抄袭他们的研究成果。

抄袭论文为近日上传arXiv的《 Label Assignment Distillation for Object Detection 》。


论文链接:https://arxiv.org/pdf/2109.07843.pdf

被抄袭论文则为王剑锋等人NeurIPS 2020 的投稿。王剑锋在文章中称:「我们的投稿,被泄露并被抄袭挪用了。」


王剑锋等人的投稿。

是不是标题完全一样?不仅如此,从论文对比中,我们可以看出两篇文章摘要几乎完全一致、图片完全一致、表格数据完全一致。

部分论文截图对比

王剑锋称,「(抄袭论文的)作者们主要修改了部分措辞,并采用了 CVPR 2021 的 latex 模板,这一过程完全是主观刻意的。我们要强调一点,arxiv 文章中没有任何一个配图、表格、公式是新的,完全没有做额外的实验。」

看来是实锤无疑了。

此外,被抄袭论文作者们深挖了抄袭者们的信息,发现一作高明豪是山东科技大学计算机科学与工程学院网络工程专业 2017 级本科生,现已毕业;共同一作是北京理工大学自动化学院智能信息处理与控制方向 2020 级硕士生张海伦;三作是河海大学常州校区物联网院计算机科学与技术专业 2017 级本科生晏艺格,现已毕业。

在整理完证据之后,王剑锋也向 NeurIPS 2020 组委会(质疑是否存在审稿人泄露、传播、挪用投稿的情况)、北京理工大学、河海大学做了初步投诉。

来自王剑锋知乎文章

在文章中,王剑锋也透露了与高明豪、张海伦沟通联系的结果,二人声称是「pdf 上传错误」、「初次涉猎相关事务」导致的结果。此外,他们的沟通也透露出该投稿之所以泄露是因为「审稿留下当学习资料。」

之后,王剑锋也收到了 NeurIPS 2020 组委会的官方回复,证明审稿人、领域主席、高级领域主席中没有人来自如上机构。另根据其他一些线索,他们初步也排除来自审稿流程中泄露的可能。



来自王剑锋知乎文章

此外,他们也收到了北京理工大学的官方回复,北京理工大学自动化学院已经成立了工作小组调查此事。

网友:买论文被忽悠了?


抄袭事件被爆料后引起了社区极大的关注,截至发稿一直都是知乎科学热榜第一。

在整个事件中,大家最关注的是两件事:1.论文作者的态度;2.投稿文章是怎么泄露的?

关于抄袭论文作者们的态度,从王剑锋的知乎文章中大家就可以看出,当事人完全没有意识到这是严重的学术不端行为,而是以「pdf 上传错误」、「初次涉猎相关事务」作为借口。

那么投稿文章到底是怎么泄露的?
来自知乎回答:https://www.zhihu.com/question/487690998/answer/2129227928

有网友分析称碰到论文中介了,买到了被审稿的论文。因为三个作者不改标题、图片、数据,几乎一字不差地抄袭论文就挺奇怪的。

这类猜测也得到了大量网友的认同,也许三位作者真是买论文被忽悠了?



   简介
免费电子书《Machine Learning Yearning》是吴恩达历时两年总结整理的一本机器学习实践经验宝典,它以较高的层次为我们介绍了许多在机器学习时代AI工程师应该掌握的技术策略。该书并不聚焦于具体的AI算法,而是为我们介绍了许多具有泛化性的如何让AI算法有效工作的技术。

这本书的重点并不是教你具体的机器学习算法,而是如何让机器学习算法有效工作。

   主要内容
部分内容如下:
  • 机器学习为什么需要策略?

  • 如何使用此书来帮助你的团队

  • 先修知识与符号说明

  • 规模驱动机器学习发展

  • 开发集和测试集的定义

  • 将大型开发集拆分为两个子集,专注其一

  • Eyeball 和 Blackbox 开发集该设置多大?

  • 小结:基础误差分析

  • 偏差和方差:误差的两大来源

  • 偏差和方差举例

  • 与最优错误率比较

  • 处理偏差和方差

  • 偏差和方差间的权衡

  • 减少可避免偏差的技术

  • 训练集误差分析

  • 减少方差的技术

  • 诊断偏差与方差:学习曲线

  • 绘制训练误差曲线

  • 流水线组件的选择:数据可用性

  • 流水线组件的选择:任务简单性

  • 建立超级英雄团队 - 让你的队友阅读这本书吧!


扫下发码关注 获取回复「MLY」即可获取


回复「MLY」即可获取



浏览 18
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报