基于RGB图像的人体姿态识别研究开题报告
2020-04-10 16:42:41
1. 研究目的与意义(文献综述)
1.1研究目的及意义
人体姿态识别是计算机视觉领域的一个重要研究方向,它在众多领域具有广阔应用前景,比如智能监控、虚拟现实、高级人机交互、人体运动分析、人体行为分析等。基于rgb图像的人体姿态识别,在行为识别、人机交互、游戏、动画等领域有着很广阔的应用前景,通过对人体姿态的识别还可以延伸到人体动作行为的判断,是计算机视觉领域中一个既具有研究价值、同时又极具挑战性的热门课题。
给定一幅图像或一段视频,人体姿态识别就是去恢复其中人体关节点位置的过程。根据输入图像的类型,人体姿态识别算法可以分为两类:基于深度图的算法、以及直接基于rgb图像的算法。随着微软公司推出kinect深度传感设备之后,基于深度图像的姿态识别技术得到了越来越多的学者关注和研究。但是,在研究中由于图像受光照、阴影外界变化以及人体姿态类别的限制、特征选择的难度、机器学习的局限性、识别算法的性能等因素的影响,人体姿态识别研究进展缓慢,姿态识别的方法成为近些年的研究热点。相较于深度图对图像采集设备要求过高而带来的应用易受限的问题,基于rgb图像的人体姿态估计算法具有更广的应用前景,并且在学术上也取得了很好的成果。目前,即便是针对比较复杂的场景下,基于rgb图像的人体姿态估计算法也能达到很好的识别效果。以下就将简要的介绍一些重要的应用领域及其研究发展方向。
2. 研究的基本内容与方案
研究学习神经网络,如卷积神经网络(convolutional neuralnetwork,cnn),卷积神经网络网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(convolutional layer)和池化层(pooling layer)。cnn主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。
研究学习从图像中获取信息。利用卷积神经网络从图像中提取图像特征.由于卷积和池化计算的性质,使得图像中的平移部分对于最后的特征向量是没有影响的。从这一角度说,提取到的特征更不容易过拟合。而且由于平移不变性,所以平移字符进行变造是无意义的,省去了再对样本进行变造的过程。cnn抽取出的特征要比简单的投影、方向,重心都要更科学。不会让特征提取成为最后提高准确率的瓶颈、天花板。可以利用不同的卷积、池化和最后输出的特征向量的大小控制整体模型的拟合能力。在过拟合时可以降低特征向量的维数,在欠拟合时可以提高卷积层的输出维数。相比于其他特征提取方法更加灵活。
最后实现人体姿态识别的算法,并实现识别过程。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解姿态识别的研究现状和趋势,初步确定设计方案,撰写开题报告。
第4-7周:研究神经网络模型,获取人体姿态特征。
4. 参考文献(12篇以上)
[1] 代西果.基于卷积神经网络的人体姿态识别研究.2017
[2] zhecao, tomas simon, shih-en wei, yaser sheikh. realtime multi-person2d pose estimation using part affinity fields.2017
[3] haoshufang, shuqin xie, yuwing tai, cewu lu. rmpe: regionalmulti-person pose estimation.2017 iccv