讨论:对于神经网络,不需要弄明白原理,只需要应用,是这样吗?

极市平台

共 2238字,需浏览 5分钟

 ·

2021-01-15 03:34

↑ 点击蓝字 关注极市平台

来源丨机器学习初学者
编辑丨极市平台

极市导读

 

一位CV领域的硕士问:一直弄不懂神经网络原理,看了很多教程博客还是弄不懂,我想是不是不需要弄懂啊?个人觉得:不懂原理能做些应用,但是想出成果就难了。可以参考下网友的讨论。 >>加入极市CV技术交流群,走在计算机视觉的最前沿


回答一

作者丨zyhu

有几种程度的“弄懂神经网络的原理”:
  1. 知道loss function的作用,知道sgd minimize loss function的过程就是神经网络(包括传统机器学习)的学习过程。知道loss function,optimizer背后的优化原理
  2. 知道CNN的一些trick,怎么调结构,调超参数,背后的直觉是什么,这个直觉就是原理
  3. 研究overparameterized neural network的generalization原理
这些原理的重要性:
  1. 这是大二数学,学习人工智能必备的。如果这都不懂,建议回炉重造
  2. 这是成为一名工程师必备的技能。这个搞不懂不建议从业人工智能
  3. 这是优秀PhD研究的内容。这个搞不懂对找工作毫无影响。

链接:https://www.zhihu.com/question/433274875/answer/1613600102

回答二

作者丨匿名用户

绝大部分所谓机器学习从业者,包括知乎上的,都对神经网络的原理一知半解。不指望所有从业者搞明白神经网络里面的数学,只希望能让大家不要觉得所谓的deep learning就是无脑调参。个人觉得即使不懂原理也可以找一个不错的工作,但在工作/科研中一定会受到局限。关于神经网络原理有很多工作,大范围的比如说Neural Tangent Kernel 的一系列工作。
https://arxiv.org/pdf/1806.07572.pdf
关心CNN的话对于residual connection也有很多理论解释https://arxiv.org/pdf/1909.04653.pdf
对于GAN,尤其是GAN的generalization bound也有不少人尝试
https://arxiv.org/pdf/1703.00573.pdf
以上都是冰山一角。还有很多关于神经网络的optimization的工作可以看Princeton的Jason Lee和UW的Simon Du 杜少雷。

回答三

作者丨霍华德

不懂原理,我觉得跑demo。做应用。写毕业论文甚至发论文可能都可以。但我觉得你找工作就比较困难了。

回答四

作者丨金海峰

以现在开源工具的发展水平来看,你即便是“只需要应用”也要搞懂一些原理,否则连应用都做不出来。你做应用至少还需要理解问题,根据问题选择合适的模型,并且调调超参数。针对特定问题,找到合适模型。这一步就需要你能看懂模型的适用范围与优缺点。想要做到这点,就需要你对其背后的原理有一定的了解。调超参数就更需要根据实验反馈结果定位哪个超参有问题了。这需要对模型和数据有更深刻的理解才行。所以,做应用就需要懂原理。但是,这是基于现有机器学习工具的发展水平来说的。也许有一天,会出现一个基于Keras的开源软件,自动帮你选模型调参呢。到时候你做应用可能就真的只会应用就行了,真的好期待这一天哦!
链接:https://www.zhihu.com/question/433274875/answer/1662351913

回答五

作者丨可乐

显然不是。即使只是应用神经网络的话,也需要理解常见的组件/模型结构的意义,它们为什么work/不work。例如batch normalization 的作用,skip-connection的作用,各种优化器的优缺点等知识点需要非常熟悉。不然你调参数的效率是会显著低于有经验的算法工程师的,而且当你遇到神经网络不收敛、loss降不下去、疯狂过拟合等各种各样的问题时你是没有办法知道怎么去解决的。上面举例的知识点掌握起来其实并不难,而且应用的话学到这种程度就足够了。至于背后深入的数学原理,神经网络可解释性的问题过于前沿了,现在不去了解也没有什么关系。
链接:https://www.zhihu.com/question/433274875/answer/1625527052

总结

绝大部分回答都是认为需要了解神经网络的原理,但是否深入,看你的需求了。


推荐阅读




    添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

    △长按添加极市小助手

    △长按关注极市平台,获取最新CV干货

    觉得有用麻烦给个在看啦~  


    浏览 20
    点赞
    评论
    收藏
    分享

    手机扫一扫分享

    分享
    举报
    评论
    图片
    表情
    推荐
    点赞
    评论
    收藏
    分享

    手机扫一扫分享

    分享
    举报