为什么现在不看好 CV 方向了呢?
共 5085字,需浏览 11分钟
·
2022-02-20 23:26
点击下方卡片,关注“新机器视觉”公众号
视觉/图像重磅干货,第一时间送达
作者:匿名用户
https://www.zhihu.com/question/383486199/answer/1152839921
混毕业是个好方向,因为很多工业界的问题用CV去刷刷过拟合,比如检测水泥裂缝这种很不CS的方向,基本是降维打击传统的方法,灌点无关痛痒的SCI/EI还是没问题的。但是这种混过来的成绩,最好就不要去找CV方向的工作了,容易被吊打。业余时间灌点水混毕业,平时好好刷C++/Java和Leetcode, 毕业以后找开发方向的工作,是我最推荐的转行过来的人走的道路,也是学历有硬伤(双非)最容易走的路。
CV方向有很多没有解决的问题,coco的准确度上不去了就是一个典型的例子。要把准确度从50提到70,80,甚至到imagenet的水平,需要的可能是基础理论上的突破,而不是在网络上修修改改。但是研究者的能力是有限的,在CV方向的入门门槛被拉到初中生就能入门,github上拖个模型下来调调参就能获得很好成绩的现阶段,一个研究者要想从广大的调包侠基数中脱颖而出是很难的。很有可能到最后三年研究生毕业,才发现在洪水般泛滥的"CV从业者”中自己根本没有优势可言。
作者:陈历飞
https://www.zhihu.com/question/383486199/answer/1192004116
长期看好,短期谨慎。
随便翻开一个深度学习入门课程,你都会看到一个叫“手写数字识别”的项目——堪称人工智能领域的hello world。
调调CNN,跑跑ResNet,自我感觉良好,似乎每一个AI从业者,都可以是CV领域的带师。魔改一下model和loss,换个应用场景和benchmark,再加个时髦的Gan,一篇paper就呼之欲出了。
那为什么,会开始有人不看好现在的CV方向了呢?
个人认为,CV在科研领域依然在如火如荼的发展,但是在工业界,遇到了AI领域通病:落地难,不挣钱。CV领域的落地,我随便列举几个:
1、无人车
2、AR VR
3、内容理解
4、传统领域赋能(教育,安防,医疗。。。)
无人车领域是最重CV的方向,集结了大量CV人才。比如LZ提到CV的目标检测,就是无人车领域很实用的一个方向。然而,无人车还在发展初期,已经倒了很多,剩下的勒紧裤腰带,不可能招募太多人,要也是要的能突破关键技术的大牛,如果你不是赫赫有名的名校实验室学生,很难在竞争中脱颖而出。
AR, VR,和无人车一样,同样是在早期。同样的CV目标检测,可以去支持抖音上面各种时髦的特效……但然后呢?就算性能提升一倍,对这个商业模式、应用场景的影响也是有限,不能像广告、推荐能给公司带来直接量化的收益。公司需要考虑性价比,对抖音这样大公司尚且如此,小公司可能就直接上商汤API了,都不需要招CV的人。
内容理解,国外在这一块投入很大,但国内情况或许不一样。据说国内的每一条内容都有人工审核,人力便宜,直接上“真人工”智能了……
其他传统领域(教育,安防,医疗。。。),个人觉得核心价值是领域知识,政府关系,商业资源。。。CV技术?那只是锦上添花,讲一个好的故事提升估值。技术模型的提升?销售表示还不是靠他的嘴才有用。
综上所述,我并不是看衰CV,只是对想要跟风的CV新人提个醒,而真正的有志者并不会因此而被劝退。身为CV从业者,我依然相信这是一个很棒很有想象空间的好方向,一起共勉吧!
作者:宝珠道人
https://www.zhihu.com/question/383486199/answer/1190760008
首先说观点:长期来看,我看好CV方向。
我部分理解现阶段不看好CV的论调,并从我的角度尝试解释下为什么会有这个论调。
作者:呆中之歪
https://www.zhihu.com/question/383486199/answer/1178983517
cv,nlp,语音等等都很好找工作,但是不是说train个网络就是cv了,mlp的bp算法能手敲嘛,cnn的呢,rnn的呢,lstm的呢,很多人都是会点网络架构感觉超级棒棒哒,处理复杂的数据集,打标签都不会,分布式训练,大数据集需要边读边训练,如果做底层优化都也不会,就是拿着别人的baseline改点小结构,做点小tricks提升零点几然后发个论文,感觉已然上天。正在厉害的理论+代码的人,太少了,所以cv还是很缺人的,人工智能方向也是很缺人的,现在让人感觉到人很火热,其实大部分都是水,现在硕士动不动就是非算法不找,其实真没必要,算法工程师前提是工程师。
作者:匿名用户
https://www.zhihu.com/question/383486199/answer/1204285642
说多了就是内卷
继续再在已有的一些成熟的task上面怼人力+硬件,对于各个公司来说,除了PR之外,收益真的很小了。烧钱的研究最后还是要商业需求来埋单,如果你是AI公司的老板,固定的HC,你说是找工程师还是找销售?答案根本呼之欲出啊。
更别提现在新冠全球肆虐,近两年的R&D在各个公司肯定都是重灾区。
作者:yuteng
https://www.zhihu.com/question/383486199/answer/1190361261
首先,CV != DL
认为所有的计算机视觉问题都得靠深度学习解决,本身就是一种误解。
CV的研究和实用方向除了深度学习还有太多太多,比如SLAM、传统的机器视觉、双目视觉、全景拼接等等。他们在业界有着越来越多的应用,典型的比如用视觉SLAM做扫地机器人的导航。
就算是深度学习,每天也有那么多创新的网络和应用。
某个小领域的深度学习的论文越来越难发不等于CV行业衰落,希望题主不要以偏概全。
作者:安大叔 https://www.zhihu.com/question/383486199/answer/1173287233
个人觉得现在不看好cv方向的人主要分为两种。
第一种:对cv领域期待太高的投资者,AI泡沫被一些始作俑者坑的太惨~
第二种:对竞争惨烈的cv领域望而却步的入门者~
作者:JianquanLi
https://www.zhihu.com/question/383486199/answer/1198096611
计算机视觉领域的目标检测,目前正在解决的事情是:在一张清晰的图像中找到所有的目标。
而工业界希望的目标检测,则是:在可能过曝,可能过暗,可能模糊,可能存在色差和畸变,可能图像抖动,可能部分数据丢失的实时视频流信息中,用尽可能低的成本,在能保证漏检率和误检率条件下,找到图像中有效的目标,并获知这些目标在世界坐标系下的相互关系。
简言之,工业界和学术界之间对同一个技术的要求不尽相同~
本文仅做学术分享,如有侵权,请联系删文。