基于机器视觉的智能人机交互技术
共 3385字,需浏览 7分钟
·
2021-08-05 23:34
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
机器人视觉和机器人技术已被广泛地使用在我们的生活当中,智能机器人技术逐渐成熟。在传统的机器人技术应用过程中,没有做到机器视觉和机器控制的技术统一,只实现了某一技术的应用,极大地制约了智能机器人的发展工作,因此如何统一机器视觉、机器人控制以及人工智能三大要素,成为了人机交互功能实现的主要限制。
随着未来智能机器人的不断发展,人们对人机交互的要求也越来越高,智能化、流畅化、拟人化,这都深深考验着我们对各种机器模块的应用能力。下面我们从机器人视觉人工智能和机器人控制三个方面来探讨机器视觉与人工智能的人机交互问题。
机器视觉是一项综合性技术,包括图像处理、控制电光源照明、光成像传感器、数字模拟计算机软件等一系列的模块组成,机器视觉的主要应用是提高生产的灵活性和自动化程度,一些不适合人工劳动的场所内,使用机器视觉来代替人工劳力,或者在一些自动化程度比较高的生产线上,机器视觉可以极大地提高生产效率。
1.1 机器视觉设计理念
机器视觉的设计理念首先就是教会机器如何分辨物体或人脸,在以往的传统技术下,我们无法做到智能识别这一功能,但是伴随着科技的不断发展,识别技术也应运而生,使得机器视觉得到了进一步提升的可能性。机器视觉的目标就是模仿人类的识别能力,所以说就需要机器识别系统具有足够的运算能力,以及相应的硬件支持,如光传感器,图像处理等硬件,并且IT人员需要进行大量的算法优化、标注增加机器世界的识别效率。机器识别的主要方式,就是通过已有的编程,识别出物体的具体特征,在对数据库的已知物理特征进行对比,进而识别出眼前物体。
机器视觉的主要理念思路先进行图像处理再进行图像识别。在图像处理的过程当中,筛选出识别物体的各项物理特征,对图像进行预制处理,过滤掉其余的干扰因素,将最真实有效的物体特征保留下来。图像识别阶段就是在图像处理之后的过程当中,对筛选过的物体特征,进行识别处理,根据初始系统图像特征的处理范围,进而对已知数据库中数据进行匹配分析,从而得出结论。
1.2 实践分析
在日常生活中,机器视觉的处理技术十分常,比如说在图像审核中,对视频中的各项图文信息进行收集分析,在预制筛选结果之后留下疑惑信息,并与已知数据库信息进行对比参照,进而做出审核判断。又或者闻名于世的阿尔法狗也是机器视觉的典型应用,在阿尔法狗围棋人工智能系统的应用过程中,需要拥有图像矫正修正图像二极化、图像格式转和画直线方图分析等识别算法,首先为了实现人机博弈的目的,就必须建立一个直角坐标系在棋盘当中,以此作为后续捕捉棋子位置的基础,然后根据已做好的模板进行棋子查找,将棋盘上的棋子对应到直角坐标系中,这样就实现了机器视觉,后续就可以由人工智能进行决定落子,这个就是机器算法的作用所在。
阿法狗智能围棋系统之所以可以做到如此地步,正是因为当今的世界人工智能技术的飞速发展。人工智能的飞速发展得益于处理器等硬件算法能力的不断提高,使得人工智能可以进一步地应用于人们日常生活当中,随着技术的不断发展,出现了越来越多关于人工智能的应用,如智能识别系统、围棋软件、机器人深度学习,或者众所周知的苹果语音智能系统SIRI。
普通的围棋系统大概有三层神经网络,分别为预测网络,预测对方可能下的棋子,并在系统中进行算法预测,在局势的不断改变中,调整网络中落子概率的分布列表。第二层网络为策略网络,该网络用于判断各个不同落子所可能产生的不同结果,并对不同落子进行不同的优劣分析。第三层为战略网络,即对整个局势进行长期分析,并决定落子方位,为整个系统运行确定一个大方向,进行远期的胜负评估。最后三层网络互相交融,在最后对数据进行量化分析,以此得出最优的落子点。
要想实现上述操作,就必须有一套运行稳定的硬件系统,以CPU为核心进行浮点运算,基础硬件的运算能力,决定了多层神经网络算法处理的运行能力,这就要求系统平台需要提供运算能力较强的硬件设备,保证人工智能系统拥有足够的运算能力。算速度不仅有 CPU 决定也与GPU 相关,对于人工智能深度学习功能而言,GPU的内存带宽起到至关重要的作用。但是仅仅有这些还不够,人工智能系统还要进行不断的AI 测试,需要进行海量的自动运算作为预测标准。
在经历了人工智能和机器视觉的过程之后,就进入机器人控制的环节。世界上第一台商用工业机器人由美国制造,至今已有六十余年,现如今无论是科技水平和运算能力都远超那时,但是机器人承担的主要工作,还是简单的筛选焊接工程处理等方面,没有做到智能化无人化,如果我们想让机器人从事更高级的工程应用方面,就要求机器人拥有更加强大的感知能力和运算能力,做到机器视觉、人工智能、机器人控制三维一体的统一工作。
机器人之间是如何实现人工模块,机器视觉系统和人工智能的相互配合,从而实现人机交互的目的,就拿智能围棋系统为例。如果想要达到人机交互,我们就需要选用合适的机器人,在选择机器人的情况之前需要考虑,应该选择何种驱动方式的机器人,是液压还是气压,并且还要考虑其负载能力,以保证人机交互工程可以正常运行。如果围棋系统想实现人机交互,就必须考虑安置视觉摄像头、吸盘等装置,侧面安置机械臂,保证其活动范围可以覆盖到整个棋盘之上。
人机交互指的是人与计算机或机器设备之间应用某种方式或者某种语言进行一定程度上的交流,而人机交互在我们的日常生活中也极为常见,小到收音机按钮,电脑开关键,大至汽车方向盘,核反应堆控制室,都可以理解为人机交互。就如同阿尔法狗围棋系统一般,就是借助机器视觉、人工智能、深度学习等功能的基础之上进行围棋运算,进而实现人机交互的目的。
尽管机器视觉和机器人控制广泛的应用于我们的生活当中,但是两者往往没有做到相互统一,传统的生产工序往往集中于一点,比如说运用机器视觉进行样品筛选,通过机器视觉筛选出残次品,进而提高成品率。又或者遥控机器人,使用遥控机器人进行高危工作,由人工远程操作。现在的机器人技术往往没有做到智能化,那么就更谈不上人机交互的实习,如今随着科技水平的不断提高,人机交互的应用能力也不断提高,开始出现一些智能机器人,内置视觉传感器,外置机械骨骼,可以如同吃常人一般具有基本逻辑思维能力,与人沟通,甚至发生动作互动。
现如今人机交互的技术领域逐渐向智能化发展,如我们所用的手机智能语音,无人机,智能家居等技术就是十分典型的人机交互功能的应用,相信在未来会出现越来越多结合机器视觉人工智能机器控制的机器人出现,为我们带来更加流畅的人机交互体验。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~