数据科学家是不是特有前途的职业

裸睡的猪

共 1652字,需浏览 4分钟

 ·

2022-04-26 07:43

人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。

从需求端角度上看确实有这种趋势。数据慢慢积累上来了,人工智能概念也在迅速普及,人们都开始有了这种意识,都想利用积累的数据做些分析预测之类的事情,这类业务就逐步变得很多,自然对从业人员的需求就变多了,而现在总体来讲数据科学家又少又贵还是个常态,有点AI技能的找个工作都不难,老板还天天担心你跑掉。


但是,数据科学家作为一种职业,长远一点看却未必很有前途。

为啥?

因为还有一个领域也开始被人工智能带得热门起来了,就是自动机器学习软件

比如这个,国内知名数据软件公司润乾出品的易明建模YModel,地道国货,还完全免费,去润乾官网就可以下载。来感受一下:

只要把数据准备好丢进去,几分钟就能建好模型用于预测了,过程中基本不需要懂数据挖掘的人介入,也就是最后看效果时需要了解一些模型评价的指标就可以。麻烦的事都是数据准备,这是自动化软件不会做的事,但也和数据科学家擅长的事不搭界。

这只是其中比较轻量级的一款,还有更多能自动做机器学习的软件,包括google等大牌厂商都在加入这个阵营。


如果你没有认真学习这些建模算法的原理,只是在培训班和速成课里学过些概念和操作,那你还不见得做得过这玩意儿。

在实践这个易明建模软件的过程中发生过N回这种情况,程序写得很溜的IT专业同学,使用Python开源包建出来的预测模型,准确率就是赶不上它。其实易明建模也是用Python开源包做的,大家用的是同一套基础东西。但是,只懂IT的同学常常没有认真系统地学过这些模型算法的原理,不知道数据该怎么做预处理、什么情况该做纠偏了、补缺失值时该用啥规则;也不知道这几十种算法哪种各有啥特点、适合啥场景、又该填什么样的参数。要认真系统地学习人工智能算法原理,大体相当于读半个统计专业的博士,几个月的速成培训班是搞不定的。

而易明建模中却固化了统计专家数十年的经验,这样只擅长IT技能的数据挖掘入门级选手当然就做不过了。而且,不仅准确率更好,工作效率也差很多啊,这玩意儿跑个三分钟就能出模型,人工来做怎么也得搞上几天吧;更关键的是,这个软件还不要钱,还能没日没夜地干活,而一个数据科学家的工资得多少?你说未来的老板们面对这种情况会怎么想?

结果,粗略学过机器学习知识的普通型数据科学家,还不如那些有行业经验的从业人员更管用。丰富的业务经验还能把数据准备得更好,从而也能让模型做得更精准。自动化建模软件也只能解决人工智能的技术问题,没办法自动发现业务知识,所以即使有自动化软件也需要好的业务知识配合才能建出好模型。

未来的职场,大概率不会是满世界的数据科学家,而是满世界的自动人工智能软件加行业业务专家。

打个比方,就像现在医院里做化验。以前,需要相当技能的人员才搞得了,也只有高级医院才配得起,这些人也很吃香;后来呢,后来自动化仪器来了,是个人都会做了,是个医院也都能做了。


这么一说,是不是感到危机重重?数据科学家这职业是不是彻底凉凉了?

那当然也不是。

像易明建模这样的自动化AI软件也是要人去做的,这更需要优秀的数据科学家才做得出来了。而且,软件也没那么智能,总有搞不定的情况,这时候仍然需要精通算法原理的数据科学家才能搞定。不过,精通算法原理是前提,否则,软件搞不定的事你也搞不定。

只是,成为这种人的难度当然很大,而且这种人的需求量也不会很大,大部分常规的数据科学事务都会被自动化的软件替代掉。


数据科学家这个职业很有前途,但仅限于下过苦功N年寒窗的顶尖高手。街上培训班或者大学里速成班里涮一下出来的,那还是省省吧。

 乾学院

 数据技术与产品的知识分享平台

 识别左侧二维码关注乾学院 

 微信搜一搜 : 乾学院

请来【乾学院】的原文中留言,发表您的观点!
浏览 14
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报