基于轨迹匹配的动态手势识别算法研究文献综述
2020-04-14 19:44:27
随着现代科学技术的突飞猛进,计算机与嵌入式技术也随之迅猛发展。当前,嵌入式技术朝着更高速、更高效、并行化、更高可靠性方向飞速发展的同时,也向着更自然、更简洁、更舒适的人机交互领域阔步前进。特别是在互联网、游戏、数码产品、AR、VR产业中,可提供更好的人机接口,方便人们与计算机更加自然和谐的沟通与交流,成为了计算机商业领域中一个具有经济效益的发展方向。
在人机交互中,技术的发展经历了键盘、鼠标、操作杆、手柄等交互方式,还经历了佩戴可穿戴传感设备、肢体交互方式,再到当前基于视觉的人脸、手势、指纹、触摸屏等交互方式和眼球、瞳孔交互等新型交互方式。利用这些新型方式进行人机交互,符合人类交流习惯、方式简单易懂、效率高、用户体验也很舒适。手势识别可以实现在现实生活中对虚拟环境的控制、对智能设备进行控制,实现智能家居。此外,对于智能控制和视频监控等领域,动态手势识别更具有重要的意义。基于实时摄像头的动态手势交互,因具有方便、易操控等特点,可以直接用裸手在摄像头前完成相应的手势操作,具有自然性、可移植性等特点,因而获得了学术界和工业界的较大关注。
目前在主流单目手势识别中,手势可分为静态手势与动态手势两大类。在静态手势中,手势的形状、轮廓、纹理等信息指示了静态手势的意义,而在动态手势中,手势的意义包含在移动速度、方向、轨迹中。从视觉上识别手势一般采用摄像头,根据完成功能的复杂度可分为普通型摄像头和深度检测型摄像头。普通摄像头只能捕捉2D平面图像,而深度摄像头可以捕捉3D立体图像,可以获得丰富的信息,识别成功率较高。微软公司的Kinect为深度摄像头的代表,可以利用运动捕捉系统对象进行跟踪。该设备性能优秀,指令响应迅速,准确率高,但由于深度信息获取的相关技术仍在研究阶段,并且深度摄像机设备费用价格不菲,为这方面的研究设置了较高门槛,该方法也难以普及。基于2D摄像头的手势识别系统一般采用隐马尔可夫模型,包含了四个模块的识别系统,该方法可以在静止背景下进行连续的动态手势识别,识别率在90%以上、但由于该方法采用的HMM(Hidden Markov Model,隐马尔可夫模型)算法需要大量的样本进行学习,导致算法累赘且实时性不高。
{title}2. 研究的基本内容与方案
{title}2.1 研究内容和目标
为了改善动态手势的检测跟踪效果,提高轨迹识别的算法实时性,本课题针对基于机器视觉的动态手势识别研究。首先对其中涉及的运动检测、肤色检测、目标跟踪等方面的相关算法进行理论分析和实验对比,据此选择出效果较好的算法,分析根据轨迹匹配进行动态手势识别的方法,利用OpenCV进行动态手势识别算法的编写,利用MFC设计系统的图形界面用以显示手势识别的关键步骤和识别结果。计划完成基于轨迹模板匹配的动态手势识别的理论设计,尝试软件仿真验证效果,完成资料整理和论文编写。
2.2 拟采用的技术方案
1)隐马尔可夫模型
隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。隐马尔可夫模型描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态的序列,称为状态序列。每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列。序列的每一个位置又可以看作是一个时刻。其难点是从可观察的参数中确定该过程的隐含参数,然后利用这些参数来作进一步的分析。
2)基于帧差法的运动检测
帧差法又叫时间差分法,它是利用相邻帧现查分后阈值化的处理方式来确定图像中的运动区域。帧差法算法简单,由于采用相邻帧建立背景,实时性好,其检测结果不受亮度影响。