美国「统治」ICML 2020!中国大陆入选论文数仅为美国1/6,原因竟与...

共 2456字,需浏览 5分钟

 ·

2020-06-22 23:20

c39063958b68c6dcf758b180ba4ce64d.webp


  新智元报道  

来源:medium

编辑:薯条、白峰

【新智元导读】第三十七届ICML将于2020年7月13日至18日举行。近日,有关论文录取的数据放出,引发广泛讨论。美国企业和学者在此届ICML表现惊人,美国「出品」的论文竟然占了将近3/4,英国和中国分列第二第三,但数据和美国相差甚大。


距离第三十七届ICML还有不到一个月的时间。 本届ICML将在2020年7月13日至18日,采用虚拟会议的形式举行。从6月3日放出的论文接收结果来看,ICML 2020共提交了4990篇论文,接受了1088篇论文,接受率仅为21.8%,较前几年来讲都有下降。 作为机器学习的顶会,ICML 2020的录取论文备受关注。一位叫Sergei Ivanov的博主在Medium详细的整理了ICML 2020的论文接受情况,并就作者、机构、国家等问题做出了分析。
日本学者高产11篇,Google领衔各机构组织

下图展示了在发表论文数目上靠前的作者。        baa06306ff393c42875aff21ea45c873.webp      可以看到Masashi Sugiyama以11篇论文在论文数目方面位居榜首。他是一位日本的学者,现在在日本理化学研究所(RIKEN)和东京大学工作,主要的研究方向为机器学习和统计数据分析的理论和应用。 并列第二名分别是来自DeepMind的Michal Valko,来自UC Berkeley的Michael Jordan和来自Google / U. of Alberta的Dale Schuurmans,他们都取得了8篇的好成绩。 谈到作者,不得不再比较一下机构组织的数据。下图展示了前30机构组织的入选论文数目的数据。         1f4e1d1e1364a6f69a3816d07887ebd4.webp      Google在机构组织论文数上大有「碾压」的趋势,114篇这个数字甚至大约占了ICML发表论文的1/10,并且远超于第二名。而在近几日举办的CVPR 2020中,Google同样也表现出色,可见Google在人工智能,机器学习领域成果斐然。 第2至4名由三个学校获得:MIT,Stanford和Berkeley。同属Alphabet的Deepmind获得了第5名,前五名的组织机构均超过了50篇。 需要注意的是,由于部分论文是合作完成的,因此Google的114篇和Deepmind的51篇中有部分重合。
美国「出品」论文约占3/4!中国大陆和英国论文总数分庭抗礼

这一部分数据依据论文作者来统计了各国家地区发表论文的数量。但是,作为免责声明,作者提到了,这种关联数据之间可能存在偏差,并不完全准确。        d07f62eec1d44b301cd345c2536e83d1.webp      按照作者所在国家来看,美国以728篇稳居榜首,大约是接收论文总数的3/4 尽管英国和中国大陆以123篇和122篇位居第二和第三,但是这个数字大约只是美国的1/6,至少在ICML 2020方面,美国的优势巨大。 美国占比如此之大也不是不无道理。一方面,美国在人工智能、机器学习领域的技术位居前沿,这是无可厚非的事情。另一方面,按照论文作者统计国家的时候更多的是基于作者所处的机构组织的国家,因此统计并不准确。例如一位论文作者在Google苏黎世工作,发表了论文,那么该论文依旧是算在美国总数中的,因为Google属于美国企业。 当然,知乎上也有网友提出,ICML 2020的提交时间恰巧与中国春节「撞车」,许多中国实验室都在休假之中,因此即便有相关论文,可能也会留给NeurIPS而不是选择参加ICML。        24640ea416bcc64955a62bdad6f59f4a.webp       为了得到更准确的数据,Sergei Ivanov还采用了作者所属大学来分类,最后得到了类似的结果。这个数据不考虑企业机构,只考虑科研机构,但美国研究者仍然占一半以上。因此,如果加入工业界的研究者的数目,可能依旧会得到之前基于作者国家的那张图。 接下来我们分析一下主要国家的具体数据。        b5fd7b5bfc54a8a95509870603b570b3.webp  美国工业和学术领域都贡献了许多论文,企业和学校机构平分秋色。         2550bba65e6ac476533a5ec6c8d6fb06.webp      而英国则是DeepMind一枝独秀,其余大多是知名院校。DeepMind发表的文章大约占英国文章总数的40%。         ef8ce0b76a66faa46592f11f174f3475.webp      从论文接受数量来看,清华、北大领衔国内高校。但是像华为、百度和阿里巴巴这样的科技公司也在连年进步。         b4bffdea6dca9a20aea4bdd2baeddccd.webp      加拿大的ICML论文则是被高校「统治」,并没有看到企业的身影。         ebb9ae256ff7bc8783c254b899b174b3.webp      比较企业组织和学校组织的论文录取情况,除了美国,学校机构还是占据大比例。全球来看,大学发表论文数量是企业的3倍
各组织机构「协作」论文,互利共赢

最后我们来分析一下论文的协作情况。        10904dd79f97ce4c79eaa3a35683cfd1.webp      可见,大多数论文都是由3-4个作者协作完成的。也有例外情况:有两篇文章是由15位作者协作完成的         b617a1f1871d11e1dbdf0f5f2e7d6913.webp      而大多数论文有1或2个组织,也有7个组织参与的论文。 Sergei Ivanov还构建了一张表现不同组织协作方式的图,图中包含426个节点和1206条边,绘制这张图可以得到一堆由边连接的点。        e03399575bcf5f4ec4b9690cbfb4eb9a.webp 每个点的意义是组织结构,连接的意义则是协作。不同的大小和颜色标志了每个节点的论文数量的不同,边的宽度由协作的数量决定。 这边以一个有至少30个协作节点的子图为例。        2603e851ba941f384c8f4260d9a6f13c.webp      

这样就很直观的展示了机构和学校协作的关系。 本文比较全面的分析了ICML 2020论文投稿的数据,从作者,国家,机构各个方面,真实的反馈了机器学习的现状。有助于机器学习领域的科研者很好的了解行业的变化趋势。
参考链接:https://medium.com/criteo-labs/icml-2020-comprehensive-analysis-of-authors-organizations-and-countries-c4d1bb847fde



浏览 54
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报