六大机器视觉趋势
共 4322字,需浏览 9分钟
·
2021-07-19 09:02
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文转自|新机器视觉
机器视觉趋势经常被讨论,那么可能影响工业自动化中机器视觉的这些技术的选择和实施有哪些实用的信息?
一、用于计量和视觉引导机器人(VGR)的3D成像
机器视觉市场中3D成像组件的扩展是一个强劲的趋势,这是由对3D测量和指导的高需求以及作为3D成像系统一部分的成本效益技术的可用性的增加所推动的。部分扩展是针对某些应用的算法功能的激增,如3D测量,机器人引导(VGR - 视觉引导机器人以及相关任务,如拾取或随机对象拾取和放置),以及自动移动机器人(AMR)指导和安全。
三维成像系统捕获物理空间的视图并提供表示包含深度的场景中的点以及熟悉的2D“平面”(x和y)位置的数据。一些可用的组件还提供灰度(对比度)或甚至彩色图像以及3D数据。3D成像的基本优势在于提供3D位置,但另一个重要的好处是3D图像通常是“对比度不容忍”。也就是说,图像信息允许软件处理深度变化而不是表面颜色特征的变化或阴影。
三维成像是机器视觉应用的强大技术。可以很容易地说它已经从“趋势”转移到机器视觉工具箱的标准部分。
实际执行
3D组件的区分可能很困难,对功能的详细讨论超出了本讨论的范围。但是,第一步是确定目标应用程序的类型。需要分析分辨率,深度以及水平X,Y平面的要求。虽然大多数系统作为一个整体提供通用功能,但提供了更多的组件,这些组件在特定任务中具有目标和优势,例如,专门用于3D测量或3D箱子拾取。也就是说,除了能够为应用程序提供适当的精确度量之外,任何3D解决方案的成功主要是软件实现和系统集成。
实际限制
在表面上集成3D成像可能很简单,但特定应用的细节存在挑战。其中一些包括:
虽然看起来很明显,但在物体或成像系统运动的应用中,任何一个位置的误差都可能引入必须考虑的测量误差。
大多数3D成像系统都表现出一定程度的“3D数据丢失”,即相对于主动照明和摄像机角度的特征阴影在3D信息中产生空白。根据应用,使用一些成像技术可以克服这种情况。
简而言之,并非所有3D机器视觉应用都“准备好迎接黄金时段。”例如,虽然应用程序在挑选随机定向,同质对象或“箱子拾取”已经很好地解决并且可以被认为是通用的在许多情况下,挑选异构和未知物体,包裹,盒子等在许多情况下仍然是3D成像的挑战。此外,用于测量或区分的物体或表面的3D重建在生产率上可能是具有挑战性的,因为可能需要许多图像来完全建模和分析该部件。
二、不可见成像 - 红外波长
更广泛的可用性和改进的成像组件性能,以从红外波长的非可见光捕获和创建图像是一种趋势能力,可以积极影响各种机器视觉应用。这种趋势的一部分是能够在各种IR波长下产生光的LED照明的激增。用于这种类型的成像的用例是普遍的,并且识别IR成像可以在何时何地可以使应用受益,这主要取决于被成像的对象和应用的需要。
大约700-1000nm的“近红外”(NIR)波长的成像已经用于机器视觉多年。用于成像约1000-2800nm的“短波红外”(SWIR)波长的相机也不是全新的,但最近传感器技术的进步使得这些相机在自动化应用中更加实用。最后,现在可以使用非冷却且非常适合自动检测的小型相机(微测辐射热计)进行热成像或大约7000-14000nm发射的IR波长的成像。
实际执行
不可见成像具有特定用途。NIR已被用于消除机器视觉灯的高功率眩光造成的工作人员分心和不适,或突出显示红外灯可能以不同方式对颜色或某些材料作出反应的特定部件的特征。SWIR波长由一些完全不透明的材料(例如许多塑料)传输,并且以与可见光波长非常不同的方式被一些透明的材料(例如水)吸收。当热像必须在自动化环境中进行测试时,热成像是唯一的解决方案。
实际限制
总体而言,对于非可见成像,如果目标波长提供所需的成像结果,则该技术是一个不错的选择。但是,请记住,应用程序库是机器视觉组合中用例的一小部分。限制可能包括:很难总是准确地预测NIR或SWIR照明将如何与待检查的材料相互作用。建议测试应用程序。
自动化中热成像的一个共同挑战是为相对于背景温度的所需热分布开发可靠的基线。例如,必须在部件由于散热而冷却之前进行“过热”部件的检查,并且在检查过程中冷却必须在部件之间保持一致。成本正在下降,但SWIR和热部件可能比可见成像部件更昂贵。
三、嵌入式成像
嵌入式成像作为机器视觉趋势的情况取决于市场中关于技术定义的差异。将嵌入式视觉分类为任何结合图像捕获和处理的设备的一个定义涵盖了传统机器视觉组件的非常广泛且可能重叠的部分。有人可能会将嵌入式视觉约束到那些完全集成在较低级别的设备(SOC - 芯片上的系统,或SOM - 模块上的系统或单板计算机),以便将其集成到更大的设备中。易于想象的用例可能包括自动驾驶汽车和AMR甚至智能手机。
实际执行
嵌入式视觉 - 无论是SOM,SOC还是具有嵌入式处理功能的摄像机 - 在某种意义上都体现了嵌入式视觉处理器的存在; 通常(但不是唯一地)GPU(图形处理单元)或FPGA(现场可编程门阵列)。在任何一种情况下,处理器都针对特定任务进行编程,该任务是完整的应用程序或某些图像处理。在大多数实现中,嵌入式视觉处理器需要低级编程以配置或创建应用程序。嵌入式视觉设备与主机系统的接口与标准机器视觉组件不同,这是实施的重要考虑因素。
通过组合利用相对于物体表面以多个角度指向的照射产生的图像,可以更可靠地可视化在灰度图像中不可见的特征。
实际限制
对于通用机器视觉,在特定的单用途应用中使用低级嵌入式视觉可能是不实际的,因为嵌入式视觉设备的编程仍然是一个开发而不是集成任务。具有嵌入式处理的机器视觉相机对于某些应用可能更实用。嵌入式视觉在机器视觉中的直接更广泛的使用案例可能在于具有“预编程”嵌入式图像处理应用的相机的实现
- 特别是AI或深度学习,以及针对特定任务的商业成像。
四、液体镜头和高分辨率光学元件
机器视觉光学中两个明显的趋势技术方向是更先进的高分辨率和大幅面相机镜头的激增,以及更加无缝集成组件液体镜头的趋势。第一个趋势是实用的;随着相机分辨率的增加和像素尺寸的减小,对更好的光学元件的需求被许多元件镜片供应商理解并得到满足。更多产品规格包括镜头性能的详细信息,例如显示系统调制传递函数(MTF)的图表,这是镜头比较的一个很好的衡量标准。
液体镜头是可以根据外部信号改变焦点的装置,而不需要像手动可调焦镜头那样在镜头中进行任何机械改变。这不是一项新技术,液体镜头多年来一直用于智能传感器,智能相机和其他机器视觉设备。然而,这些设备与机器视觉光学器件和相机的集成的最新进展使该技术更多地进入通用用途领域。
实际执行
对于所有机器视觉应用,将镜头与应用的分辨率和物理要求相匹配是必需的集成任务。更多镜头选择的可用性为用户和解决方案提供商提供了更好的选择。
液体镜头在成像距离可能会在应用中从一个部件变为另一部分的情况下非常有价值,因为它可以动态地实现非常快速的焦点变化,甚至具有自动对焦功
实际限制
广泛的产品系列可能难以选择和区分光学元件。评估组件相对于特定应用的规格和特性非常重要。
液体镜头技术可能难以实现,但是一些具有嵌入式处理的组件相机正变得可用于自动控制液体镜头。一些附加液体透镜组件可能限制相关透镜的传感器覆盖范围(对于集成的液体透镜系统而言不是这样)。同时注意焦点变化会影响校准,因此液体镜头可能不适合需要精确校准的应用。
五、先进的照明技术和加工
用于机器视觉的照明组件的趋势是可控制的多光谱设备的可用性,其在某些成像情况下实现更大的灵活性和高级能力。通过改变单色颜色,可以更好地克服没有多个照明设备的部分族变化,或者甚至使用不同照明颜色的多个图像来创建彩色图像。使用不同照明角度的多个视图的高速成像可用于创建对象的3D表示或提供高动态范围(HDR)图像。
六、AI和深度学习
最后,让我们来解决几十年来最受欢迎的机器视觉趋势:人工智能,机器学习和深度学习。人工智能或人工智能是计算机科学的一个分支,涉及计算机模仿人类行为的方式。作为一门学科,人工智能自上世纪中叶以来一直存在。AI没有描述任何特定技术,只描述目标; 任何编程逻辑都可能被称为AI,甚至是简单的if-then规则和决策树。机器视觉搜索算法被称为人工智能。
机器学习是AI的一个子集,深度学习是机器学习的一个子集。这些术语是通过学习算法实现AI的技术的名称。机器学习是与系统相关的一般概念,其基于初始数据输入可以在给定任务中学习和改进它们的性能。
深度学习是机器学习,它使用“深层”神经网络,允许计算机基本上“通过实例”进行学习。该技术已被证明在图像识别,声音识别和语言处理等任务中表现优异。深度学习是高度计算密集型的,通常需要特殊的处理器硬件(例如GPU,具有深度学习核心的图形处理单元),特别是在学习过程中。在过去几年中,可用于执行机器视觉深度学习的软件和硬件平台迅速扩展。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~