为什么现在不看好 CV 方向了呢?-技术圈

点击下方卡片，关注“新机器视觉”公众号

视觉/图像重磅干货，第一时间送达

作者：匿名用户
https://www.zhihu.com/question/383486199/answer/1152839921

混毕业是个好方向，因为很多工业界的问题用CV去刷刷过拟合，比如检测水泥裂缝这种很不CS的方向，基本是降维打击传统的方法，灌点无关痛痒的SCI/EI还是没问题的。但是这种混过来的成绩，最好就不要去找CV方向的工作了，容易被吊打。业余时间灌点水混毕业，平时好好刷C++/Java和Leetcode, 毕业以后找开发方向的工作，是我最推荐的转行过来的人走的道路，也是学历有硬伤(双非)最容易走的路。

正经一点:

CV方向有很多没有解决的问题，coco的准确度上不去了就是一个典型的例子。要把准确度从50提到70，80，甚至到imagenet的水平，需要的可能是基础理论上的突破，而不是在网络上修修改改。但是研究者的能力是有限的，在CV方向的入门门槛被拉到初中生就能入门，github上拖个模型下来调调参就能获得很好成绩的现阶段，一个研究者要想从广大的调包侠基数中脱颖而出是很难的。很有可能到最后三年研究生毕业，才发现在洪水般泛滥的"CV从业者”中自己根本没有优势可言。

另外，CV的落地场景也很有限，虽然无人驾驶，人脸识别，工业机器人，医学图像检测等方向看似很广大，实际上近年来车企一蹶不振，无人驾驶这条路根本不好走。人脸识别已经快成为被解决的问题了，都已经大规模落地了。工业机器人和医学图像检测这种，也还处于造梦阶段，商业化还远着，工业界根本没有多少岗位。

总而言之，CV在现在处于门槛低，从业人数多，职业少的一个尴尬的位置，一边是大量的学生涌入，一边是不景气的经济环境和日益饱满的就业岗位。如果你的目标是就业而不是研究，那么我建议打好开发的地基，和一些项目代码加起来没到过1万行的所谓CV从业者划清界限。

作者：陈历飞
https://www.zhihu.com/question/383486199/answer/1192004116

长期看好，短期谨慎。

随便翻开一个深度学习入门课程，你都会看到一个叫“手写数字识别”的项目——堪称人工智能领域的hello world。

调调CNN，跑跑ResNet，自我感觉良好，似乎每一个AI从业者，都可以是CV领域的带师。魔改一下model和loss，换个应用场景和benchmark，再加个时髦的Gan，一篇paper就呼之欲出了。

那为什么，会开始有人不看好现在的CV方向了呢?

个人认为，CV在科研领域依然在如火如荼的发展，但是在工业界，遇到了AI领域通病：落地难，不挣钱。CV领域的落地，我随便列举几个：

1、无人车

2、AR VR

3、内容理解

4、传统领域赋能（教育，安防，医疗。。。）

无人车领域是最重CV的方向，集结了大量CV人才。比如LZ提到CV的目标检测，就是无人车领域很实用的一个方向。然而，无人车还在发展初期，已经倒了很多，剩下的勒紧裤腰带，不可能招募太多人，要也是要的能突破关键技术的大牛，如果你不是赫赫有名的名校实验室学生，很难在竞争中脱颖而出。

AR, VR，和无人车一样，同样是在早期。同样的CV目标检测，可以去支持抖音上面各种时髦的特效……但然后呢？就算性能提升一倍，对这个商业模式、应用场景的影响也是有限，不能像广告、推荐能给公司带来直接量化的收益。公司需要考虑性价比，对抖音这样大公司尚且如此，小公司可能就直接上商汤API了，都不需要招CV的人。

内容理解，国外在这一块投入很大，但国内情况或许不一样。据说国内的每一条内容都有人工审核，人力便宜，直接上“真人工”智能了……

其他传统领域（教育，安防，医疗。。。），个人觉得核心价值是领域知识，政府关系，商业资源。。。CV技术？那只是锦上添花，讲一个好的故事提升估值。技术模型的提升？销售表示还不是靠他的嘴才有用。

综上所述，我并不是看衰CV，只是对想要跟风的CV新人提个醒，而真正的有志者并不会因此而被劝退。身为CV从业者，我依然相信这是一个很棒很有想象空间的好方向，一起共勉吧！

作者：宝珠道人
https://www.zhihu.com/question/383486199/answer/1190760008

首先说观点：长期来看，我看好CV方向。

我部分理解现阶段不看好CV的论调，并从我的角度尝试解释下为什么会有这个论调。

一、首先说为什么部分理解这个论调：

1. 做CV的门槛低，科研工作相对好做。有一块GPU就能做不少事，论文也相对好发，学术界和产业界从事CV相关科研的人口基数大且呈快速增长态势（特别是学术界），造成每年培养的研究生数量增长很快，就业岗位开始“僧多粥少”了。

2. 前些年人工智能（以CV为代表）的泡沫吹得太大了。不可否认人工智能实打实带来了技术和应用提升，但资本界和产业界特别是非计算机专业的人把牛皮吹太大了。前几年钱好拿时，大家自然快糙猛上，从去年开始进入冷静期了，又遇上今年的疫情，CV需求短期内下滑的阵痛难以避免。

3. CV在产业界虽然能够提升应用精度，但多体现为“锦上添花”而非“至关重要”。这也是为什么旷视、商汤等CV龙头企业在产业界一直不温不火的原因。还有待技术的进一步突破来打开产业应用的天花板。

二、再说为什么长期看好：

1. 人类超过80%的信息是从视觉系统接收的。试想一下，人若都是看不见的，社会生活中有多少现在能做的事情都变成做不了的。李飞飞教授在cs231n课程中也提到，人类区别于其它生物，能够进化到更高阶的一个重要原因是人类发展出了视觉系统。从这套进化逻辑来看，现在CV在社会生活中没有这么重要的地位，主要是现在的分析技术没有达到，而不是CV不重要。随着社会发展，技术终究会进步，CV的重要性不断提升是必然。

2. 科技从技术突破到广泛落地应用有其时间周期。最近十年，基于监督学习的深度学习技术在视觉目标检测上已经算取得突破性进展了，回看一下十年前的目标检测技术就会发现。现在这些技术，也已经能够实打实的提升部分医疗影像处理、人脸、工业视觉相关的应用，但从全面改变这些领域的应用范式的角度来看，还有相对较长的路要走，毕竟技术只是一个方面。此外，近年来半监督/非监督的深度学习技术也在快速发展，这些技术取得突破后，也会为技术的广泛落地应用打开更多扇窗口。总的来说，利用CV技术改变社会生活，是一个不可逆转的方向。

三、最后再提一点对CV方向新入行人的建议：

1. 学得更深入一点。不要只做调参侠，这个门槛真不高。现成的数据，现成的框架，跑个好的性能出来，真的不难也不构成核心竞争力。大家要扎实把基础打好，你会手写卷积等基本运算吗？你能把大网络的梯度传导计算一步步推出来吗？

2. 不要只想着深度学习，把图像处理及相关的基本功底打好。深度学习是一种效果相对有保障的方法，但是，它对数据和计算资源的要求比较高。社会生活中方方面面都存在不少可以通过CV技术改善的地方。首先好好分析具体问题，若是可以通过相对简单的方法解决，部署起来既稳定又便宜，为什么一定要上深度学习呢。

作者：呆中之歪
https://www.zhihu.com/question/383486199/answer/1178983517

cv，nlp，语音等等都很好找工作，但是不是说train个网络就是cv了，mlp的bp算法能手敲嘛，cnn的呢，rnn的呢，lstm的呢，很多人都是会点网络架构感觉超级棒棒哒，处理复杂的数据集，打标签都不会，分布式训练，大数据集需要边读边训练，如果做底层优化都也不会，就是拿着别人的baseline改点小结构，做点小tricks提升零点几然后发个论文，感觉已然上天。正在厉害的理论+代码的人，太少了，所以cv还是很缺人的，人工智能方向也是很缺人的，现在让人感觉到人很火热，其实大部分都是水，现在硕士动不动就是非算法不找，其实真没必要，算法工程师前提是工程师。

cv还是很缺人的，nlp为啥现在感觉比cv好找，原因很简单，nlp还没有被深度学习完全替代，传统算法需要学习，而那些没什么数学底子的nlp更本学不会，所以自然劝退他们，但是cv里面也有需要很多底子的地方，但是现在的学这方向的太表面和浮躁。不过现在也有所降温，公司也不是养闲人的地方，公司也不需要你推公式，研究大部分建个实验室，找博士足以，而cv工程师呢，企业需要的是（代码能力+理论分析能力）巨佳的人。

作者：匿名用户
https://www.zhihu.com/question/383486199/answer/1204285642

说多了就是内卷

CV也好NLP也罢，就算算力充足，模型容量提高10倍，最后反应到点数上面来，未必和已有的模型有太大的优势。最早的最老的Google BERT依然还是很香的，更别提很多地方连BERT也未必能够跑的流畅。

再说应用。CV的应用要进一步扩展，那么必须要发展基于视觉的理解，很多应用只给一个标签是不足够的，更加普遍的应用是通过视觉输入映射到更加多样的决策空间。随之而来的问题是，数据的制作更加复杂，产量更低，而且QA复杂。结果就是问题更加复杂，数据却更少，而且健壮性还要保证。

继续再在已有的一些成熟的task上面怼人力+硬件，对于各个公司来说，除了PR之外，收益真的很小了。烧钱的研究最后还是要商业需求来埋单，如果你是AI公司的老板，固定的HC，你说是找工程师还是找销售？答案根本呼之欲出啊。

更别提现在新冠全球肆虐，近两年的R&D在各个公司肯定都是重灾区。

作者：yuteng
https://www.zhihu.com/question/383486199/answer/1190361261

首先，CV != DL

认为所有的计算机视觉问题都得靠深度学习解决，本身就是一种误解。

CV的研究和实用方向除了深度学习还有太多太多，比如SLAM、传统的机器视觉、双目视觉、全景拼接等等。他们在业界有着越来越多的应用，典型的比如用视觉SLAM做扫地机器人的导航。

就算是深度学习，每天也有那么多创新的网络和应用。

某个小领域的深度学习的论文越来越难发不等于CV行业衰落，希望题主不要以偏概全。

作者：安大叔 https://www.zhihu.com/question/383486199/answer/1173287233

个人觉得现在不看好cv方向的人主要分为两种。

第一种：对cv领域期待太高的投资者，AI泡沫被一些始作俑者坑的太惨~

第二种：对竞争惨烈的cv领域望而却步的入门者~

社会上的每一个现象都有其深层次的原因~

1. 高期待。cv领域大火之后，确实极大程度上推进了感知智能的历史进程。但是由于媒体较高的关注度和或许是无意识的捧杀，也让大家都cv新技术对产业的正向改进能力有了过高的预估。

2. 增速放缓。当一个领域在学术前沿领域不再有突破性的进展时，一定会造成这个领域锻造的积累期，那些望而却步的人不泛油一些急功近利的考量，希望可以选择到将要爆发或者即将爆发的热门领域。

3. 就业。当一次学术突破对产业带来的改变有限的时候，当产品的升级对普罗大众带来的便利以及实用价值有限的时候，就会造成本领域就业竞争大，进而影响求学的人对这个领域的选择。当然，我是认为cv产学研的路上还有很大的潜力的~ 相信技术革新与产品革新就在不远的明天~

总之，cv是一个刚需领域，cv依旧有着极大的学术价值与潜力。多些脚踏实地者，少些急功急利，这个领域会发展的更好更快更强~

作者：JianquanLi
https://www.zhihu.com/question/383486199/answer/1198096611

计算机视觉领域的目标检测，目前正在解决的事情是：在一张清晰的图像中找到所有的目标。

而工业界希望的目标检测，则是：在可能过曝，可能过暗，可能模糊，可能存在色差和畸变，可能图像抖动，可能部分数据丢失的实时视频流信息中，用尽可能低的成本，在能保证漏检率和误检率条件下，找到图像中有效的目标，并获知这些目标在世界坐标系下的相互关系。

简言之，工业界和学术界之间对同一个技术的要求不尽相同~

本文仅做学术分享，如有侵权，请联系删文。

—THE END—