通知 | 2021 中国高校计算机大赛 —— 微信大数据挑战赛
可以自由组队参赛,具体组队要求见赛道相关说明;
参赛选手应保证报名信息准确有效,如队伍中的选手信息不符合要求,组委会有权取消整个队伍的参赛资格及奖励。
大赛主办和技术支持单位如有机会接触赛题和相关数据的人员不允许参赛。
赞助企业的在职人员(不含实习生)不允许参赛。
报名方式:登录比赛官网,完成个人信息注册,即可报名参赛;
每个选手可单人成队或2-3人组队参赛,且每人只能参加一支队伍。
大赛官网:https://algo.weixin.qq.com/
大赛邮箱:data@tsinghua.edu.cn
大赛QQ群:566353409 / 758344321 / 762146461
初赛A阶段:5月20日10:00 – 6月29日20:00,每个参赛队伍每天可以有3次提交结果机会,系统实时评测并返回成绩。排行榜每小时更新,将选择参赛队伍在本阶段的历史最优成绩,按照评测指标从高到低排序。
初赛B阶段:6月30日10:00-20:00。系统将在6月29日21:00更换测试数据,参赛队伍需再次下载数据文件。本阶段提供2次提交结果的机会,系统进行实时评测并返回成绩。排行榜每小时进行更新,并选择参赛队伍在本阶段的历史最优成绩进行排名展示。
复赛A阶段:7月12日12:00 – 8月6日12:00,每个参赛队伍每天可以有3次提交结果机会,系统实时评测并返回成绩。排行榜每小时更新,将选择参赛队伍在本阶段的历史最优成绩,按照评测指标从高到低排序。
复赛B阶段:8月2日12:00-8月9日12:00。8月2日12:00开始,竞赛平台提供最终成绩的测试数据集,此数据集仅用于复赛队伍的最终成绩评比和排名,不参与比赛过程中每天排名。参赛队伍可以随时提交该数据集的结果,如有多次提交则以最后 2 次提交为准。8月9日13:00,系统对参赛队伍提交的最终测试集结果进行评测,并根据 2 次评测结果取高分,公布所有复赛队伍的最终成绩和排名。
严禁参赛队伍之间相互抄袭。如不同参赛队伍提交结果高度相似,经判定存在抄袭行为的,组委会将取消相关参赛队伍的参赛资格,相关参赛成绩无效。
参赛者应保证其在比赛过程中所产出的所有成果未侵犯任何第三方的知识产权、商业秘密及其他合法权益。如第三方因为参赛者侵权行为提出索赔、诉讼等,参赛者应承担由此产生的全部责任及损失。
如大赛主办方及其关联公司有意取得参赛者在本次大赛中独立开发的依约定享有完整知识产权的研究成果,参赛者同意大赛举办方及其关联公司在同等条件下享有优先受让权,相关转让事宜由双方另行协商确定。
训练集和测试集涉及的feed均在此表中;
description, orc, asr三个字段为原始文本数据经过分词为term和脱敏处理后得到的,term 之间空格分隔。例如:文本“我参加了中国高校计算机大赛“经过处理后得到类似“2 32 100 25 12 89 27”的形式(此处只是一个样例,不代表实际脱敏结果)。
feed_embedding字段为String格式,包含512维,数值之间用空格分隔。
初赛阶段:选手需要对测试集中每一行的userid和feedid的四种互动行为的发生概率进行预测,这四种行为包括:查看评论、点赞、点击头像、转发;
复赛阶段:选手需要对测试集中每一行的userid和feedid的七种互动行为的发生概率进行预测,这七种行为包括:查看评论、点赞、点击头像、转发、收藏、评论和关注。