Google NLP Hack Series:
Intro to ASR Africa Challenge
语音技术可以实现与通过语音以外的方式难以获取和使用的服务和应用程序的交互。自动语音识别 (ASR) 系统正在彻底改变这一领域的可能性,但尚未广泛用于非洲语言。尽管近年来 ASR 建模和数据收集方法取得了许多进展,但最大的问题仍然是对大量语音数据的需求。
此挑战的目的是收集书面和口语数据以创建语音语料库,该语料库可用于以对初学者友好的方式训练 ASR 模型。此挑战是 Google NLP Hack 系列的一部分。
所有人
https://zindi.africa/competitions/google-asr-hack-series-africa-asr-data-challenge京东积累了电商零售场景下的海量商品的图文数据,其中商品主图和商品标题是最直观、最容易触达到用户的数据。因此,图文的一致性(即图文匹配)至关重要,要求模型根据图片和文本判断出两种模态数据传递的信息是否一致。通常,商品主图和标题包含大量的商品属性信息。在实际业务中,图片里商品的关键属性与商品标题描述的是否匹配,是影响用户体验的重要因素。本赛题要求参赛队伍利用脱敏后的京东电商平台图文数据,通过商品图片与商品标题在整体以及商品关键属性上的关联程度来判断两者是否匹配。本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科生、研究生)以及科研机构和企业从业人员均可报名参赛。报名&组队(2月25日–4月21日)
初赛(3月22日–4月22日)
复赛(4月29日–5月21日)
决赛(6月中下旬)
https://www.heywhale.com/home/competition/620b34c41f3cf500170bd6ca京东商品标题包含了商品的大量关键信息,商品标题实体识别是NLP应用中的一项核心基础任务,能为多种下游场景所复用,从标题文本中准确抽取出商品相关实体能够提升检索、推荐等业务场景下的用户体验和平台效率。本赛题要求选手使用模型抽取出商品标题文本中的实体。与传统的实体抽取不同,京东商品标题文本的实体密度高、实体粒度细,赛题具有特色性。本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科生、研究生)以及科研机构和企业从业人员均可报名参赛。报名&组队(2月25日–4月21日)
初赛(3月22日–4月22日)
复赛(4月29日–5月21日)
决赛(6月中下旬)
https://www.kesci.com/home/competition/620b34ed28270b0017b823ad