你参加过爬虫相关的比赛吗?这有一个

FightingCoder

共 2074字,需浏览 5分钟

 · 2020-07-02

阅读本文大概需要 3 分钟

同样是做爬虫,为什么别人月薪三万,而你月薪只有三千?别人爬的数据能做出来好多东西,而你爬下来的数据可能就只是数据(还可能是照片,技术男都懂)


你要明白,爬虫是一种提升效率的工具,能“解放双手还我自由”,但你要思考的不只是怎么爬数据,而是爬取下来的数据该怎么用,这才是拉开工资差距的根本原因。

5cf96ec3afd55fa9ba9b4094487799da.webp

相信关注我公众号的人,都是喜欢编程,喜欢爬虫的,所以我今天给大家介绍一场比赛,适合学生党和上班族:


“让数据回家”为主题的数据爬虫开发大赛!


这个比赛不仅仅是爬数据,还可以开动大脑,基于数据做创意应用。不但能增加实战经验,还能给你的简历增光添彩,为接下来的秋招做准备!

大赛旨在旨在为开发者和数据爬虫爱好者提供一个有趣的框架平台,尽情的表达关于数据的灵感。


参赛者可以通过爬虫技术,将属于自己的数据从互联网拿回自己手中,然后基于这些数据开发出各类有趣的应用,做数据的主人!


这次比赛的奖项真的很诱人!


获奖制度




AWARD SETTINGS

1.奖金预设

  • 一等奖(1支队伍):10000元 + 证书;

  • 二等奖(3支队伍):5000元 + 证书;

  • 三等奖(6支队伍):2000元 + 证书;

  • 优秀奖(若干):将根据实际参赛队伍数量确定优秀奖名额,将获得神秘礼品。

2.开源爬虫奖

  • 对于基于GitHub项目( https://github.com/MyDataHomes/Spider  )开发的爬虫工具,主办方将挑选优秀作品提交至Github项目库中,被选作品将获得“开源爬虫奖”,并获得神秘礼物。(本奖项与前述奖项不冲突,可同时获取)


参赛规则




RULES OF ENTRY


01


组队要求

  • 个人或自由组队参赛,每支队伍不超过3人,每人只能参加一支队伍,以队伍参赛须确定一名队长,便于后续赛事联系和通知;

  • 参赛选手报名须提供真实联系信息。


02


参赛作品

作品内容:爬虫工具(含源代码、使用文档、测试用例等),作品介绍材料;


作品要求

  • 进行爬虫工具的开发,爬虫工具能够帮助用户抓取自己的个人数据,抓取的数据源类型不限(如淘宝、京东等);

  • 参赛者可基于爬虫工具获取的数据,自主进行数据应用的设计,本要求为可选项;

  • 参赛作品可基于比赛指定Github项目( https://github.com/MyDataHomes/Spider  )进行开发,也可自行开发

  • 参赛作品的开发语言不限;

  • 作品介绍文档需涵盖爬虫算法思路、实现方法、爬虫运行与测试方法、数据应用介绍(如有)等,介绍文档格式不限。


03


评审标准

由来自隔镜科技、上海交通大学软件学院以及其他机构的专家评判打分,评分标准如下:


爬虫评分(100分)

  • 爬虫性能(40%):包括爬取数据的完整度、性能,爬虫鲁棒性等指标;

  • 代码质量(30%):包括代码撰写是否规范、接口定义是否清晰、注释是否完整等;

  • 创新性(30%):包括在数据获取方式、爬虫算法设计等方面的创新等。


附加分(20分)

  • 用户界面(10%):良好的用户界面设计,操作方式、风格等方面具有创意和美感;

  • 数据应用(10%):数据应用的实用价值、创新性等;


赛事日程




EVENT SCHEDULE


6月

29日

开启报名

(1)关注公众号我的数据百宝箱(微信号:mydatabox),回复“报名”,获取报名链接;

(2)通过社区论坛置顶链接报名,论坛地址:https://mydata.homes/



加比赛群

添加大赛客服微信:mydatahome,回复“开发者+姓名”,加入大赛技术协作群;



准备作品

  • 首先想到一个关于个人数据采集的好点子;

  • 我们准备了一个简单的框架和一些爬虫样例,我们希望您fork我们的爬虫代码库( https://github.com/MyDataHomes/Spider ),并基于此进行创作;您也可以选择其他语言和框架进行开发

  • 完成的作品应当具备完整可运行的代码、测试用例、使用文档、项目介绍材料(可以包括文档、PPT、视频等)。



提交作品

  • 确认已经完成了报名流程(提交了团队信息,并且同意了参赛协议);

  • 确认比赛作品已经完成,并且可以通过阅读项目README文档获取所有资料。如果是私有库,请确认已经给官方账号(id: MyDataHomes)添加了阅读权限;

  • fork本仓库,拷贝作品提交模板( https://github.com/MyDataHomes/GeJing-Cup )来创建一份副本,仔细阅读模板并填充团队和项目信息,注意不要遗漏必填项,也不要修改其他任何文件

  • 重命名为 团队名称.md;

  • 发起一次pull request完成作品提交申请。


7月

22日

报名&提交作品截止

在7月22日 22:00 前完成报名,并提交作品,请注意合理安排项目进程,避免错过提交作品时间;


8月

07日

评比公布

参赛作品由评审委员会评审并打分,全部评分完毕后将通过公众号、论坛、邮箱等公布成绩!



获奖用户领奖

获得一二三等奖的用户,在10个工作日内联系主办方领取奖品,优秀奖、开源爬虫奖用户获得神秘礼品一份!


用代码来唤醒沉睡的数据资产,赢现金大奖!


阅读原文,立即报名!

浏览 63
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报