利用计算机视觉进行手势检测的工作流程
共 1773字,需浏览 4分钟
·
2022-05-28 11:06
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
拦截器通过手势相互发送信号。然而,由于干扰或光线不足,这些手势并不明显。为此,需要一种装置来记录这个手势并将其发送给其他拦截器。在光线较差的情况下,手势识别的另一种选择是使用传感器进行识别,这种传感器的设计目的是提供有效的结果。
例如,机器人对人类手势的反应可以通过摄像机进行视觉识别。这种先进的算法可以帮助机器人识别输入图像中的手势关系,这是五种可能的方向(或计数)之一。然后,该命令将作为命令输入应用于机器人,以执行特定的操作或执行指定的任务。例如,“1”计数可以表示“前进”,“5”计数可以表示“后退”。
特定的手势包括手指、手腕和肘部的动作。为了识别其中的任何变化,开发的设备使用了flex传感器,它可以识别出在每个关节处成型的测量方法。该装置的设计考虑了有效的姿态,使用了惯性测量单元(IMU-MPU-9250)。IMU使用的参数是加速度,陀螺仪加速度在三个轴上的角度。Arduino* Mega用于接收来自传感器的信号并将其发送到处理器。
手势可以分为静态手势和动态手势。用于静态手势和动态手势的特征是不同的,因为静态手势使用flex传感器并考虑三轴角度。另一方面,动态手势使用柔性传感器条件、线性加速度、陀螺仪加速度和三个轴上的角度。
基本步骤从使用加速度值计算角度开始
角度值会产生一些噪音,必须进行细化才能获得稳定的值。因此,我们使用卡尔曼滤波器来渗透这些值。然后将柔性传感器值和角度都提供给具有径向基函数(高斯)核的预训练支持向量机(SVM)。从而获得输出。
在动态手势识别中,利用卡尔曼滤波器对角度、线性加速度和陀螺加速度进行了改进。这些值存储在临时文件中,每行概述一个时间点。一旦存储了这些值,每个值都按列标准化。然后测试50个时间点,然后将它们线性值转化为由800个维度组成的单个矢量。
将结果填充到具有径向基函数核(Gaussian)的SVM中。测试集由诸如“队列”,“车辆”之类的手势组成,这些手势彼此相关,并且具有相似特征的结果被分组为一个类。如果第一个SVM文件归入其中一个组,则它们将被填充到另一个SVM中,该SVM仅用于分析该组中的手势。
在当今数字化的世界中,处理活动急剧增加,处理器已经发展到可以支持人类完成复杂任务的水平。然而,输入技术似乎造成了交付某些任务的主要瓶颈,未充分利用可访问的资源,限制了应用程序使用的可表达性。
手势界面的计算机视觉方法必须在稳健性和灵活性方面优于当前的表现,以提供交互性和可用性。为了保持这种势头,可以预测,在特征提取、分类系统和手势表示领域的进一步研究有望完成人类在自身自然持续时间内与机器交互的最终目标。
好消息!
小白学视觉知识星球
开始面向外开放啦👇👇👇
下载1:OpenCV-Contrib扩展模块中文版教程 在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。 下载2:Python视觉实战项目52讲 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。 下载3:OpenCV实战项目20讲 在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。 交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~