从数据竞赛到工作!

算法进阶

共 1013字,需浏览 3分钟

 ·

2021-12-13 19:13


 Datawhale干货 
作者:鱼佬,武汉大学,Datawhale成员

作者信息

内容概况

01 广阔领域的数据科学

数据科学结合了诸多领域中的理论和技术,主要包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助人们理解问题。

数据科学能做很多事情,涉及到很多领域,如金融领域、交通领域、教育领域等。简单地说,只要有数据存在的地方就有其用武之地。

那么对于知识点和涉及学科众多数据科学,如何学习数据科学?

一般而言可以跟着所涉及的理论知识和相应工具进行学习,但是这并不是个高效的方法。最佳的方式是在实践中去学习,数据科学的工作流程就是数据挖掘的流程,背后使用到的算法和优化方法来自机器学习,实践方法是以数据为研究对象的任务,任务的核心点是数据。

可以通过数据竞赛接触真实数据并进行实践。

02 数据竞赛与工作的差异

通过对比竞赛中和工作中时间花费可以清楚的了解两者的差异。竞赛中90%的时间是进行数据和算法相关工作,而工作中则花费70%的时间。

很多竞赛中经历都对我现在的工作带来了助益,2019年KDD Cup竞赛中,最终评估指标特别考虑到了整个代码的运行时间,所以高效的代码也成为比赛的关键,这跟工作中是一样的;在全球城市计算挑战赛中充分进行了数据分析和业务理解,这也有助于找到关键信息,帮助最终的效果提升;安泰杯跨境电商智能算法大赛,初次接触不熟悉的领域,高效的整理和归纳成为关键。

03 从数据竞赛到工作

竞赛所涉及到的方向和问题是非常多的,很多都会和工作中实际的业务相关。通常可以通过 比赛来尝试新的方案、学习不一样思路,帮助解决业务难题。

竞赛中的锻炼也为我在职场中的工作起到很大的帮助,遇到一个新的业务总能很快的抽象成一个问题,并深入业务找出解决方案,对数据的敏感性也在多年比赛中得到提升,快速的构建基本方案也是竞赛中经常做的事情,在工作中也是如此。

最后一句话送给正在或者将要竞赛的大家:

竞赛中获得的名次不能说明什么,如果能在比赛过程中体现出分析问题解决问题的能力,特别是能针对性的提出结果方案,才能体现真实水平。

整理不易,三连
浏览 18
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报