算法工程师的日常,一定不能脱离产业实践

机器学习实验室

共 1458字,需浏览 3分钟

 ·

2021-03-20 17:33

观点分享


Author:louwill

Machine Learning Lab

     

昨天刷知乎,看到霍华德老师的一个回答,深以为然,今天拿出来跟大家说道一下。

霍老师在该回答下例举了虚假的AI的主要表现特点,然后给出了要做到真实的AI的几大要点,可谓是点金之言。

在霍老师观点的基础上,笔者今天要跟大家谈的是,算法工程师的日常,一定不能脱离相当程度的产业实践。

在数据和算法行业领域,什么是产业实践呢?打一场kaggle或者天池数据竞赛,算不算数据产业实践?很遗憾,不能算。根据狗熊会“熊大”王汉生老师的观点数据和算法领域的产业实践,是要在真实的生产环境中,让数据和算法能够产生可被产品化的商业价值

从这个定义看,参加数据竞赛不能算数据或者算法的产业实践。

笔者认识很多圈内刚毕业工作没多久的朋友,一心想着提升自身技术水平,这一点无可厚非,笔者当初也是这么过来的。

但需要注意的一点是,一定不能把注意力都放到算法和模型训练方面。之前有个朋友,面试进了一家中等规模的企业,进去之后还一直延续着在学校时候的习惯,数据喜欢要现成的,从来不自己想数据采集、数据清洗和数据标注这类事,只喜欢搞算法训练。一年职场下来,路越走越窄,最后被迫离职了。不是说专注于算法研究不好,而是仅仅想着怎样疯狂过拟合训练集和验证集,不思考数据和模型背后对应的业务逻辑,这种情况对个人成长是非常不利的。写代码训模型的人每年都很多,可替代性极强,但懂业务和注重产业实践的人就很少了。

所以,笔者这里建议各位算法工程师们,做数据与算法相关工作,一定要重视业务,积极深入的参加所在行业的产业实践。

以笔者所在的医疗行业为例,这两年大家可能也有听说过医疗AI落地一直存在这样那样的困难。

难的是算法训练吗?显然不是。如果你抱着天天跑模型的心态进入算法岗位,对个人或者对公司肯定都不是长久之计,更谈不上什么产业实践了。

医疗AI行业,具体来说是医学影像AI行业,真正有益于个人、企业和行业的产业实践应该是怎么样的呢?

医疗数据和算法行业,不同于电商、互联网或者社交等其他行业,要想把一款医疗AI产品做到上市,需要全程受国家药监局管控的。感兴趣的读者可以查一查,医疗AI兴起这么多年,目前国家药监局发了几个医疗AI的三类证?

从数据采集、脱敏、清洗、标注、划分到算法训练、验证和测试,再到形成软件产品的型式检验、临床试验和器械注册,到最后产品落地到医院,在临床实践过程中辅助医生进行诊断。全部流程完成,才算一个真正的医疗影像数据与算法的产业实践闭环完成。

当然也不是说让大家都完成全部的每一个流程,既不现实也不可能。即使你在目前的算法岗上的工作不需要你做数据采集和标注,但深入了解背后的业务逻辑和客户的真实需求,是衡量你是否在做数据产业实践的关键所在。

愿大家都做真实的AI,不做虚假的AI。


往期精彩:

【原创首发】机器学习公式推导与代码实现30讲.pdf

【原创首发】深度学习语义分割理论与实战指南.pdf

 谈中小企业算法岗面试

 算法工程师研发技能表

 真正想做算法的,不要害怕内卷

 技术学习不能眼高手低

 技术人要学会自我营销

 做人不能过拟合

点个在看

浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报