ATEC 2022大赛详情来啦
线上赛 01 数字化运营
赛题任务
本赛道将重点考察图学习、个性化推荐、序列建模等机器学习能力。主办方提供一定量级的匿名化处理后的、中小商家在数字化经营中的常见情景数据——消费券/购物券的分发与核销数据,要求选手设计出能帮助中小商家提高其券/包分发效率的方法。
数据说明
数据集包含:用户基础特征、消费券基础特征、用户在一段时间内对消费券的行为(是否领取消费券)、用户间关系、消费券的知识图谱。需要选手预测用户在未来一段时间内对消费券的行为(是否领取消费券)。
本赛道所有相关数据(包括但不限于训练数据集)不得以任何形式下载, 仅限在主办方提供的本地服务器及含GPU的公有池服务器上、以比赛为目的使用, 违者将被视作“获取未授权数据”,将依照大赛规则,作禁赛处理。
计分规则
参赛选手提交模型并对评测数据集中的所有样本进行打分(取值在0到1之间的一个预测值,数值越大表示该用户越有可能领取该消费券), 后台将根据提交的打分结果测算出按用户维度计算的GAUC,以及按消费券维度计算的GAUC。两者的平均作为比赛榜单分数。该分数越高表示排名越靠前。
评分采用测试榜(A榜)+终榜(B榜)形式。最终该赛道的名次与奖励评定,以终榜数据集成绩为依据。比赛期间排行榜显示A榜成绩排名,每支赛队每日可提交3次结果。比赛倒计时48小时内,终榜(B榜)开放提交,上限允许提交3次,后台将选取终榜(B榜)分数最高的一次提交结果作为线上赛结果的排名依据。
赛题任务
本赛道重点考察隐私计算(联邦学习/协作学习)、半监督学习、图学习等技术能力。主办方将从云资源配置、数据集形态等多样化的角度模拟构建一个贴近真实场景的答题环境;提供一定量级的匿名化处理后的数据(中小商户交易收款信息),要求选手从中识别出风险商户。识别精度和通讯成本都将是关键考察因素。
数据说明
数据集按商家的类别分成若干份,每份数据均包含商家列表(含部分风险商家标识)、商家在一段时间内的交易(经随机采样)及交易相关特征、与交易相关的用户基础特征表。每份数据存储在不同的节点上,需要多个节点共同完成协作学习。
选手需要识别每份数据的商家列表中其他商家的风险情况。具体来说,即对每份数据的商家列表中除已被标识为风险商家外的其他商家进行打分。
本赛道所有相关数据不得以任何形式下载,仅限在主办方提供的本地服务器上、以比赛为目的使用, 违者将被视作“获取未授权数据”,将依照大赛规则,作禁赛处理。
计分规则
参赛选手提交模型并对数据集中的所有商家进行打分(取值为0~1的一个预测值,分值越高表示该商家越有可能是风险商家),后台将根据提交的打分结果测算出NDCG值,作为比赛榜单分数。该分数越高表示排名越靠前。
评分采用测试榜(A榜)+终榜(B榜)形式。最终该赛道的名次与奖励评定,以终榜(B榜)数据集成绩为依据。比赛期间排行榜显示测试榜(A榜)成绩排名,每支赛队每个自然日可提交3次结果。比赛倒计时48小时内,终榜(B榜)开放提交,上限允许提交3次,后台将选取其中终榜(B榜)分数最高的一次提交结果作为计算最终排名的依据。
计算资源
比赛网址
https://www.atecup.cn/home
点击左下角阅读原文可直达官网
关注我们不迷路
带你及时获取更多竞赛信息~
为了大家能更好的沟(日)通(常)交(吹)流(水),我创建了一个群,感兴趣的可以扫码入群,欢迎大家!!(若码失效了,可后台私信我)