从数据竞赛到工作!
作者信息
内容概况
数据科学结合了诸多领域中的理论和技术,主要包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助人们理解问题。
数据科学能做很多事情,涉及到很多领域,如金融领域、交通领域、教育领域等。简单地说,只要有数据存在的地方就有其用武之地。
那么对于知识点和涉及学科众多数据科学,如何学习数据科学?
一般而言可以跟着所涉及的理论知识和相应工具进行学习,但是这并不是个高效的方法。最佳的方式是在实践中去学习,数据科学的工作流程就是数据挖掘的流程,背后使用到的算法和优化方法来自机器学习,实践方法是以数据为研究对象的任务,任务的核心点是数据。
可以通过数据竞赛接触真实数据并进行实践。
02 数据竞赛与工作的差异
通过对比竞赛中和工作中时间花费可以清楚的了解两者的差异。竞赛中90%的时间是进行数据和算法相关工作,而工作中则花费70%的时间。
很多竞赛中经历都对我现在的工作带来了助益,2019年KDD Cup竞赛中,最终评估指标特别考虑到了整个代码的运行时间,所以高效的代码也成为比赛的关键,这跟工作中是一样的;在全球城市计算挑战赛中充分进行了数据分析和业务理解,这也有助于找到关键信息,帮助最终的效果提升;安泰杯跨境电商智能算法大赛,初次接触不熟悉的领域,高效的整理和归纳成为关键。
03 从数据竞赛到工作
竞赛所涉及到的方向和问题是非常多的,很多都会和工作中实际的业务相关。通常可以通过 比赛来尝试新的方案、学习不一样思路,帮助解决业务难题。
竞赛中的锻炼也为我在职场中的工作起到很大的帮助,遇到一个新的业务总能很快的抽象成一个问题,并深入业务找出解决方案,对数据的敏感性也在多年比赛中得到提升,快速的构建基本方案也是竞赛中经常做的事情,在工作中也是如此。
最后一句话送给正在或者将要竞赛的大家:
评论