从头到尾做一场kaggle比赛吧!

七月在线实验室

共 1596字,需浏览 4分钟

 · 2020-07-30


导言:入门Kaggle最好的方式是【从头到尾】参与一场比赛!


  • 了解比赛的背景、业务逻辑和数据标签含义;

  • 分析赛题数据,从业务逻辑完成特征工程;

  • 从头构建baseline模型,逐渐深入增强模型能力;

  • 计算模型损失,分析特征重要性;

       

在我第一次参加Kaggle比赛时,我也是茫然的:我不知道如何参与到赛题中,不知道赛题的任务是什么,也不知道如何提交。


最开始连Python读取文件都不是很熟悉,只能在百度、知乎和谷歌上搜索关键字。但是网上的知识点整理的比较散,实践性比较少。

              

在经过多次比赛的经历后,我逐渐感觉到Kaggle比赛是最能锻炼人动手能力的,也是非常适合快速入门一个领域的方式。


1、Kaggle每场比赛都是公司的实际问题,具有具体的业务背景。以Kaggle上的Two Sigma Connect: Rental Listing Inquiries比赛为例,是RentHop公司在纽约地区租房的真实业务。在此场景下会有不同的房源信息被张贴出来,赛题需要对每个房源信息的热度进行预测。


2、Kaggle比赛需要根据业务进行分析,需要掌握合适的数据分析技能。在Two Sigma Connect比赛中,包含了房屋基础信息、位置信息和管家信息等,而每种信息与房源的热度又有不同的关联关系。通过数据分析,可以很直观的找到数据内部的关系。


3、Kaggle比赛需要完整的流程和建模,需要构建和的机器学习模型。在Two Sigma Connect比赛中,有结构化信息、文本信息还有图像信息,各种类型的信息需要分别提取相应的特征,并选择合适的模型进行建模。


所以你在实际工作后遇到的情况,与参加Kaggle比赛是一样的。在工作时,你也会被分配一个新任务,这个任务有背景、有数据,需要分析和构建一个解决方案。


与工作不同,Kaggle比赛能够实时进行打分反馈,所以更加适合入门学习。



             


Two Sigma Connect是Kaggle上一个典型的结构化数据挖掘比赛,有结构化信息、文本信息还有图像信息。赛题数据量不大,但数据内部可分析的地方很多。


在本次课程中,我们将从头带着大家从0开始学习,从赛题背景分析一直到构建模型。并在课程中讲解模型迭代的流程,非常适合入门学习Kaggle。


Two Sigma Connect比赛总共有2500人参加,让我们一起参加这个比赛,享受刷榜的乐趣吧!

      



课程包括完善的【老师教学】+【助教答疑】帮助0基础的同学高效学习,确保每一位小伙伴都能愉快的学习知识,快速填充项目实战经验,挑战高薪。


绝对让你体验到:100%的Kaggle比赛 纯项目实战!


课件代码一应俱全


细致的讲解,不光有理论,代码及实践也一定讲的透彻!


(课件截图)



(课程代码截图)


除此之外:

大家学习中有任何问题都可以在群内提问,12小时内保证解决问题!不怕学不会,老师全程跟踪辅导、答疑,群内学员一起学习!


免费积累行业、人脉和经验。有什么比一边学习一边认识到各行各业的同学更开心的事了吗?上课时,是同学;下课了,这些全是你的人脉!


看到这里,估计想学习Kaggle的同学 已经迫不及待要报名了。


在售价299元的课程,今天大家可以使用优惠券按照199元购买,有兴趣的小伙伴抓紧抢购,先报先占位!


优惠券: DA903EAD9E

购买流程:

复制优惠券>扫描二维码>点击直接购买>点击优惠券>输入优惠券


扫码抢占名额???


(报名过程中,有任何问题请加客服微信:julyedukefu12)


阅读原文”查看课程详情!

浏览 28
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报