算法工程师当前选哪个方向好?
向AI转型的程序员都关注了这个号???
机器学习AI算法工程 公众号:datayx
1,计算机视觉;2,自然语言处理;3,风控;4,推荐系统?
当前2020年 ,算法工程师哪个方向好?
看了很多回答,模棱两可、模糊不清,给岀一番没有意乂的解释,最终也没有给岀自己的意见。
我首先给出自己明确的答案:选择推荐系统。
不要说什么“根据不同岗位、不同公司、不同能力而定",我所说的都是针对普遍的大众情况
目前在商业中有所应用,而且能够创收的只有搜索推荐和计算机视觉,因此,这两个方向的人力缺口很大,尤其是计算机视觉。前两年校招时可以看到,互联网、IT、生物医药、汽车安防等等行业,几乎都会有计算机视觉的岗位。所以,很多其他方向的同学开始纷纷转向,随着大潮流投入计算机视觉这个方向,为什么这么多人投入计算机视觉方向?我认为有以下几个原因:
入门容易
模型成熟
人才缺口大
热度高,名气大
目前入门CV的常用套路就是:
看吴恩达《机器学习》《深度学习》课程,学一点机器学习的知识。
读几篇CV模型的文章,了解一下经典的Alexnet、R-CNN系列、YOLO等。
在github上找几个tensorflow、pytorch实现上述模型的开源代码。
下载VOC、ImageNet、COCO、kaggle等数据集。
按照开源代码中的Readme准备一下数据集,跑一下结果。
学了两个月、跑了几次结果后就认为已经入行CV了。
看过吴恩达课程的人,有的应该记得他在课里面说过"深度学习是一个基于经验的领域",我们该怎么针对不同领域的图像设置不同的参数?其中包括卷积核大小、网络架构、初始权重等等,不可能拿到一个模型,既适合医学图像,又适合人脸识别,这其中就需要n次从70%的精度调到95%以上中积累出经验。
此外,CV方向目前阶段依然存在着制约这项技术创造更多商业价值的弊端,虽然每年顶会、期刊上面关于CV的文章依然很多,但是绝大多数都是拼拼凑凑,很多模块和思想并不新颖,在关键问题方面并没有太大起色。
我认为在2020年,计算机视觉的状况不仅没有好转,反而更差。曾经狂热吹捧计算机视觉的,现在也基本鸟悄的待着了。因为时间已经逐渐验证,当下计算机视觉所能创造的价值非常有效。而且,受限于数据、准确性要求,它目前很难大展拳脚。
其次是NLP,曾在2015年,我在做计算机视觉之前就做过一段时间的NLP,我认为NLP是一种非常有价值但是地位却很尴尬的存在。
它很有价值,在语音、OCR、人机交互、推荐系统等方面都有对№LP的大量应用,但是,它却很难直接的创造大规模的价值,更多的是作为一种附属能力,结合其他算法为一个系统提供能力支撑。
风控是我目前接触较多的,首先,它应用面比较局限,仅限于金融场景。而且,目前的风控模型是比较成熟稳定的,要么基于规则、要么基于传统机器学习,短时间之内不会有特别大的改动。毕竟涉及资金,银行也不会那么沖动的选择那些不可解释的模型和算法。
目前在互联网行业常用的算法有:
但是,推荐,搜索,广告投放是互联网公司最普及也是最能产生现金流的三个方向。
无论是目前火热的头条系产品(抖音、今日头条),还是阿里系(淘宝、天猫),百度(广告推荐),腾讯(QQ音乐、腾讯新闻),乃至手机行业(应用市场)都是由推荐系统带来的商业价值。
其中,比较知名且成功的当属字节跳动。
我认为优秀的产品设计+强大的推荐算法成就了目前的字节跳动,今日头条的个性化新闻推荐,抖音的个性化视频推荐。
我们会发现,当下我们看到的、听到的都是互联网公司想让我们看到的,我们似乎生活在一个被设计的圈子里,这些背后的所有支撑力都来自于推荐系统。
我认为,推荐系统目前已经产生了很大的商业价值,在接下来的3-5年里,它还有很多场景、很多价值会被进一步挖掘,在短暂的几年里,NLP、CV、风控和推荐还是无法相提并论。
原文地址https://www.zhihu.com/question/398876586/answer/1325993716
阅读过本文的人还看了以下文章:
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
机大数据技术与机器学习工程
搜索公众号添加: datanlp
长按图片,识别二维码