无论你是经验丰富的 Kaggler,还是刚迈入 Kaggle 大门不久,尚在传火路上的小白,相信本合集对你参悟竞赛的套路都会有所帮助。毕竟,多学习大佬们的思路,也许未来的竞赛冠军就是你呢?
Kaggle 是数据科学领域最大的竞赛平台。上百万的的数据科学家及相关从业者基于企业和研究者在 Kaggle 上发布的数据进行数据建模、分析,相互竞争以产生最优的模型。目前,Kaggle 的竞赛已经在诸如艾滋病、棋牌评级、交通预测等许多领域产生了成果。可以说,Kaggle 已经成功将全世界的数据科学家组织起来,在其与各领域的机构中间搭建了一个桥梁。对于参赛的选手来说,Kaggle 也是一个迅速提升自己的平台。曾经拿过三个 Kaggle Grandmaster 的 Christof Henkel (https://mp.weixin.qq.com/s/Aw2d3Dox4Zcw-n7kNLXWaw) 就曾表示,「Kaggle 可能是掌握机器学习领域知识最有效的方式。」这其中就包括阅读前人的竞赛经验。那么,有没有一个网站可以帮我们迅速查到大量的参赛经验?还真有,名字就叫「Kaggle Solutions」。它收录了从 2010 年 Kaggle 诞生至今几乎全部的竞赛优胜解决方案。并且每当新比赛结束,网站都会立即更新,上传最新的解决方案。网站链接:https://farid.one/kaggle-solutions/网站的内容大体可以分为三个部分。第一部分是每场比赛的解决方案列表。如下图所示,网站的界面十分清晰,分类包括竞赛的时间、类型、简介、赏金等。并且,大多竞赛包含的优胜解决方案非常的多,可以从多角度代入欣赏数据大佬们的思路。值得注意的是,赏金的类型也不仅仅是美金,还有工作。第三部分是每周的 Kernel 列表(主要集中在 17、18 年):如果你发现有哪些解决方案未被收录,你可以通过拉取请求等方式帮维护者补充。当然,除了这个网站之外,进入【机器之心】公众号搜索「kaggle」,你也能获取很多有用的资料。学习了这些资料之后,下一个 Kaggle Grandmaster 可能就是你!往期精彩:
【原创首发】机器学习公式推导与代码实现30讲.pdf
【原创首发】深度学习语义分割理论与实战指南.pdf
真正想做算法的,不要害怕内卷
做人不能过拟合
求个在看