KDD 2020大奖出炉!清华大学唐杰斩获时间检验应用科学奖,汤继良获新星奖
共 3386字,需浏览 7分钟
·
2020-08-21 16:28
新智元报道
新智元报道
来源:KDD
编辑:雅新
【新智元导读】近日,KDD 2020公布了6大奖项的获得者。来自清华大学唐杰荣获时间检验应用科学奖,还有两位华人学者汤继良和盛胜利均上榜。
KDD 2020 大奖出炉!
近日,KDD 2020 宣布了今年 ACM SIGKDD 六项大奖的获得者,这六大奖项分别是时间检验研究奖、时间检验应用科学奖、新星奖、创新奖、学位论文奖、服务奖。
这些奖项是为那些在数据科学、大数据分析和挖掘、机器学习以及计算机科学领域做出杰出贡献的研究人员设立的,旨在表彰那些对整个行业产生深远影响的人。
今年获得KDD 2020荣誉的华人有来自密歇根州立大学汤继良教授,清华大学唐杰、张静、李娟子等教授、还有美国阿肯色中央大学的盛胜利教授。
一起来了解下这几位华人学者和其他学者分别荣获的奖项吧。
今年KDD新设立了两个奖项:新星奖和时间检验应用科学奖
新星奖
今年是KDD第一届设立年度新星奖(Rising Star Award)。
该奖项的设立是为了表彰KDD社区里在博士毕业五年内取得卓越成就的学者。
今年的新星奖颁发给了两位学者:
汤继良(Tang Jiliang) 和 Danai Koutra(Morris Wellman)
汤继良教授来自密歇根州立大学数据科学与工程实验室。此前,他是Yahoo Research的研究科学家,并于2015年从亚利桑那州立大学获得博士学位。他的研究兴趣主要包括社交计算,数据挖掘和机器学习及其在教育中的应用。
汤教授荣获此奖项是因为他在特征学习领域所取得的杰出成就,尤其是图和图在网络、社交媒体和智能教育上的应用。
Danai Koutra(Morris Wellman)是第二位KDD年度获新星奖的学者,她目前在密歇根大学计算机科学与工程系的任助理教授,她研究主要集中于用于网络汇总和多网络分析的有原则、可解释和可扩展的方法。
时间检验应用科学奖
今年也是首次颁发时间检验应用科学奖(Test of Time Award for Applied Science),为了表彰在数据科学的实际应用中具有影响力的研究。
清华大学唐杰、张静、李娟子等人凭借他们在2008年发表的论文「ArnetMiner: Extraction and Mining of Academic Social Networks 」获得了该奖项,这篇论文主要关于学术社会网络挖掘。
本篇论文中讨论的ArnetMiner系统旨在提取和挖掘学术社交网络,该系统侧重从 从Web上自动提取研究人员的个人资料、将现有数字图书馆出版数据整合到网络中、对整个学术网络进行建模、为学术网络提供搜索服务。
论文链接:
https://static.aminer.org/upload/pdf/985/1447/1704/53e9a5afb7602d9702edacce.pdf
唐杰目前是清华大学计算机科学与技术系长聘教授,计算机系副主任、清华-工程院知识智能联合实验室主任。研究兴趣包括:社会网络分析、数据挖掘、机器学习和知识图谱。发表论文200余篇,拥有专利20余项。
唐杰教授主持研发了研究者社会网络挖掘系统AMiner,吸引了220个国家/地区1000多万独立IP访问。
SIGKDD的时间检验研究奖是为了表彰已发表数十年的杰出KDD论文。
今年,时间检验研究奖(Test of Time Award for Research)颁给了盛胜利(Victor S. Sheng),Foster Provost和Panagiotis Ipeirotis。
盛胜利(Victor S. Sheng)教授是美国阿肯色中央大学计算机科学系教授和数据分析实验室主任,同时也是IEEE的高级成员。他是多个会议的会议组织者,也是多个期刊的编辑委员会成员。他主要的研究领域为数据挖掘与机器学习、人工智能、数据安全和决策支持,已在机器学习和数据挖掘的会议和期刊上发表了140多个研究论文。
盛教授和其余两位研究者在2008年发表的论文「Get Another Label? Improving Data Quality And Data Mining Using Multiple, Noisy Labelers」对数据挖掘研究界产生了深远影响。
论文链接:
http://crowdsourcing-class.org/readings/downloads/econ/get-another-label.pdf
这篇论文主要讨论了当标签不完善时,重复获取数据项标签的问题。
论文摘要:
我们研究了通过重复标记在数据质量方面的改进或不足,特别是有监督归纳的训练标签的改进。随着小任务的外包变得越来越容易,例如通过Rent-A-Coder或亚马逊的Mechanical Turk,可以经常以低成本获得不太专业的标签。使用低成本标记,准备未标记的数据部分可能会比标记成本更高。
我们提出了增加复杂性的重复标记策略,并给出几个主要结果:
1 重复贴标签可以提高标签质量和模型质量,但并非总是如此。
2 当标签嘈杂时,即使在标签不是特别便宜的传统环境中,重复标签也可能比单标签更可取。
3 一旦处理未标记数据的成本不菲,即使是多次标记所有内容的简单策略也可以带来巨大优势。
4 最好反复标记一组精心选择的点,并且我们提出了一种强大的技术,该技术可以结合不同的不确定性概念来选择质量应提高的数据点。
结果清楚地表明,当标签不够完美时,选择性地获取多个标签是数据挖掘人员应采取的一项策略,对于某些标签质量/成本制度,好处是巨大的。
创新奖、学位论文奖和服务奖
创新奖
ACM SIGKDD创新奖是知识发现和数据挖掘领域技术卓越的最高荣誉,此次奖项授予给Thorsten Joachims。
Thorsten Joachims是康奈尔大学计算机科学与信息科学教授,美国计算机协会、美国人工智能学会院士。因其在机器学习方面的贡献,包括在信息检索,支持向量机(SVM)和结构化输出预测方面研究人类偏见的有影响力的工作获得该奖项。
此外,值得一提的是,Joachims与其他合作者发表的一篇论文「Controlling Fairness and Bias in Dynamic Learning-to-Rank」在今年的SIGIR 2020上获得了最佳论文奖。
学位论文奖
ACM SIGKDD 论文奖旨在表彰在数据科学,机器学习和数据挖掘领域所做的杰出工作的研究人员,Rediet Abebe获得了KDD年度论文奖。
Rediet Abebe现任加州大学伯克利分校计算机科学系助理教授,她的博士论文「Designing Algorithms for Social Good」获得了今年的ACM SIGKDD学位论文奖。
论文链接:https://www.cs.cornell.edu/~red/AbebeDissertation.pdf
Abebe是第一位入选哈佛研究员学会的女性计算机科学家,也是第二位获得计算机科学博士学位的初级研究员。
她是社会公益机制设计(MDSG)的联合创始人,这是一个多机构倡议,旨在改善历史悠久,服务水平低下的弱势社区的机会。
服务奖
ACM SIGKDD服务奖是该领域所授予服务的最高认可,授予给Michael Zeller。
Zeller是Temasek人工智能战略与解决方案负责人,因致力于在ACM SIGKDD担任志愿司库和执行委员会秘书而在该领域做出的杰出贡献而获次荣誉。
参考链接:
https://twitter.com/kdd_news
https://www.aminer.cn/conf/kdd2020/homepage