图像处理分类、一般流程与算法
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文转自|新机器视觉
常用的图像处理算法:数字图像处理基础、遥感数字图像处理、机器视觉、计算机视觉
图像处理程序:C++ OpenCV、Matlab与图像处理
数字图像处理-概述
其实,造成“不可能图形”(三角形的三个角都是90°)的并不是图形本身,而是你对图形的三维知觉系统,这一系列在你知觉图形的立体心理模型时强制作用。在把二维平面图形知觉为你三维立体心理图形时,执行这一过程的机制会极大地影响你的视觉系统。
正是在这一强制执行的机制的影响下,你的视觉系统对图形中的每一个点都赋予了深度。换句话说,一幅图像的某些二维结构元素和你三维知觉解释系统的某些结构元素相对应。二维直线被解释成三维直线。二维的平面被解释为三维的平面。在透视图像中,锐角和钝角都被解释为90°角。外面的线段被看作是外形轮廓的分界线。这一外形分界线在你定义整个心理图像的外形轮廓时起着及其重要的作用。这说明,在没有相反信息的影响下,你的视觉系统总是假定你从一个主要视角观看事物。
三角形的每一个顶角都产生透视,三个90°的角,而且,每条边的距离变化不同。把三个顶角合成一个整体,就产生了一个空间不可能图形。
相对性:环境对比的影响
计算机视觉的发展历史:
1950s:二维图像分析和识别,如光学字符识别,工件表面、显微图片和航空图片的分析和解释等。是模式识别的重要内容。
1960s:MIT的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述.这项研究开创了以理解三维场景为目的的三维计算机视觉的研究.Roberts对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景.
1970s:出现了一些视觉应用系统.
-70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“计算机视觉” ( Machine Vision) 课程,由B.K.P.Horn教授讲授.
-David Marr教授于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论.
1980s:Marr理论成为计算机视觉研究领域中的一个十分重要的理论框架.(ICCV, Marr奖)
计算机视觉获得蓬勃发展,新概念、新方法、新理论、新应用不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等.
Marr模型
80年代初,Marr首次从信息处理的角度综合了图像处理、心理物理学、神经生理学及临床神经病理学的研究成果,提出了第一个较完备的视觉系统框架。
Marr将系统分为基元图、2.5维图(部分的、不完整的三维信息,缺少深度信息)和三维模型三个层次来表达视觉信息的处理过程,而每层的表达将适当的信息明朗化。
基元图:使亮度变化(边沿)的信息明朗化,如角点、边缘、纹理、线条、边界等基本特征。
2.5维图:使表面朝向的信息明朗化,如场景可见部分的深度、法线方向、轮廓等。
三维模型:物体的形状与空间位置信息明朗化。
优点:系统地阐述了用二维图像恢复三维物体的可能性和一般性方法。
缺点:没有考虑视觉本身具有的反馈机制和不同层次的处理力度。
计算机视觉(Computer Vision)与相关学科的关系
- 图像处理 (Image Processing) 图像处理通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成。
- 计算机图形学 (Computer Graphics) 通过几何基元,如线、圆和自由曲面等,来生成图像,属于图像综合,它在可视化(Visualization)和虚拟现实(Virtual Reality)中起着很重要的作用.计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征,属于图像分析.
- 模式识别 (Pattern Recognition) 研究分类问题,确定符号、图画、物体等输入对象的类别.强调一类事物区别于其它事物所具有的共同特征。一般不关心三维世界的恢复问题。
- 人工智能 (Artificial Intelligence) 涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景.
- 媒体计算 (Multimedia Computing) 文字\图形\图像\动画\视频\音频等各类感觉媒体的共性基础计算理论、计算方法,以及媒体系统实现技术。以实现下一代计算机能听、能看、会说、会学习为目标。
- 认知科学与神经科学 (Cognitive science and Neuroscience) 将人类视觉作为主要的研究对象.计算机视觉中已有的许多方法与人类视觉极为相似.许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉更加自然化,更加接近生物视觉
图信号处理层次
- 图像处理:图像采集、储存;图像重建;图像变换、增强、恢复、校正;图像(视频)压缩编码。
- 图像分析:边缘检测、图像分割;目标表达、描述;目标颜色、形状、纹理、空间和运动分析;目标检测、识别。
- 图像理解:图像配准、融合;3-D表示、建模、场景恢复;图像感知、解释、推理;基于内容的图像和视频检索。
计算机视觉技术的应用
- 工业领域(生产装配、质量检验)
- 机器人(星球探测机器人)
- 遥感图像分析(植被分析)
- 医学图像分析(骨骼定位)
- 安全鉴别、监视与跟踪(门禁系统、视频监控)
- 国防系统(目标自动识别与目标跟踪)
- 图像与视频检索(基于内容的检索)
- 文物保护(数字博物馆)
- 其他(游戏、动画、体育、人机交互)
本文转自:博客园 - 2008nmj,转载此文目的在于传递更多信息,版权归原作者所有。
End
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~