熬了几个大夜,学完一套 "海外博士" 总结的「卷积神经网络、目标检测、OpenCV」笔记!

Jack Cui

共 1731字,需浏览 4分钟

 ·

2021-09-14 20:27

工作需要

因工作需要,年初花了4个月左右时间学习了机器学习、神经网络相关的知识,工作日每天大概学习4-6个小时,周末每天大概10个小时,工作中的需求应对也得心应手了。

想快速入门的话,从自己的经验看,可以先不看高等数学和线性代数,因为机器学习和深度学习中涉及的相关知识并不多。

视觉的知识部分建议分成两部分学习,第一部分传统图像处理,第二部分基于深度学习的图像处理。

但我发现,几乎80%的CVer 都没有从头至尾深入的学习图像处理方面的知识。

现在有了深度学习,不需要人为提取特征了,所以很多人不再关注图像底层的信息,而是直接越过这个根基去搭建模型,我觉得这是一个误区。

计算机视觉的提升不在于搭建模型,而在于不断调优、改进过程中积累的经验。

我们该怎么针对不同领域的图像设置不同的参数?其中包括卷积核大小、网络架构、初始权重等等,不可能拿到一个模型,既适合医学图像,又适合人脸识别,这其中就需要n次从70%的精度调到95%以上中积累出经验。

如果你决心要在这个领域深耕,那么图像底层方面的知识坚决不可跨越的,欲速则不达。

分享一套当时我学习过的教程,有视频、代码、PPT等,帮助大家打好基础。

跟着这个路线重新去梳理一下你的学习路线,相信计算机视觉水平一定会有质的提升。

资源已经整理好了,文末附下载方式!以下是详细内容介绍~


第一章:机器学习与计算机视觉

1. 计算机视觉简介

技术背景

  • 了解人工智能方向、热点

计算机视觉简介

  • cv简介
  • cv技能树构建
  • 应用领域

机器学习的数学基础

  • 线性与非线性变换
  • 概率学基础
  • kl散度
  • 梯度下降法

2. 计算机视觉与机器学习基础

图像和视频

  • 图像的取样与量化
  • 滤波
  • 直方图
  • 上采样
  • 下采样
  • 卷积
  • 直方图均衡化算法
  • 最近邻差值
  • 单/双线性差值

特征选择与特征提取

  • 特征选择方法
  • filter等
  • 特征提取方法:PCA、LDA、SVD等

边缘提取

  • Canny
  • Roberts
  • Sobel
  • Prewitt
  • Hessian特征
  • Haar特征

相机模型

  • 小孔成像模型
  • 相机模型
  • 镜头畸变
  • 透视变换

3. 计算机视觉与机器学习进阶

聚类算法

  • kmeans
  • 层次聚类
  • 密度聚类
  • 谱聚类

坐标变换与视觉测量

  • 左右手坐标系及转换
  • 万向锁
  • 旋转矩阵
  • 四元数

三维计算机视觉

  • 立体视觉
  • 多视几何
  • SIFT算法

三维计算机视觉与点云模型

  • PCL点云模型
  • spin image
  • 三维重构
  • SFM算法

图像滤波器

  • 直通滤波
  • 体素滤波
  • 双边滤波器
  • 条件滤波
  • 半径滤波
  • 图像增加噪声与降噪

4. OpenCV详解

OpenCV算法解析

  • 线性拟合
  • 最小二乘法
  • RANSAC算法
  • 哈希算法
  • DCT算法
  • 汉明距离
  • 图像相似度

第二章:深度学习与计算机视觉

1. 神经网络

深度学习与神经网络

  • 深度学习简介
  • 基本的深度学习架构
  • 神经元
  • 激活函数详解(sigmoid、tanh、relu等)
  • 感性认识隐藏层
  • 如何定义网络层
  • 损失函数

推理和训练

  • 神经网络的推理和训练
  • bp算法详解
  • 归一化
  • Batch Normalization详解
  • 解决过拟合
  • dropout
  • softmax
  • 手推神经网络的训练过程

从零开始训练神经网络

  • 使用python从零开始实现神经网络训练
  • 构建神经网络的经验总结

深度学习开源框架

  • pytorch
  • tensorflow
  • caffe
  • mxnet
  • keras
  • 优化器详解(GD,SGD,RMSprop等

该视频出品人是王小天,目前就职于BAT之一,AI算法高级技术专家,法国TOP3高校双硕(计算机科学和数学应用双硕士)毕业。

👇长按下方二维码 2 秒
立即领取

(添加小助理人数较多,请耐心等待)

他在人工智能和芯片领域发表10余篇论文,具有深厚的学术背景和丰富的项目及业务落地经验。工作期间主要负责人工智能业务线CV与NLP相关算法工作,推进人机混合智能、语义分割、机器翻译、虹膜识别等模块的核心算法研究与优化。对图像分类、物体检测、目标跟踪、自动驾驶、计算机体系结构等有深入的研究。他兼具理论与实战落地经验,深知初学者学习痛点。

有幸当时接触到了这份资源,能有一位这样的学术届与工业届双开花的大佬教程陪伴,完成从学校到职场的过渡。

浏览 42
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报