利用随机森林的实时头部姿态估计方法设计开题报告
2020-04-12 09:01:33
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
在计算机视觉领域,头部姿态估计算法有着其很大的研究价值。头部姿态估计通常是指计算机通过对输入图像或者视频序列的分析、预测,确定人的头部在三维空间(相对于摄像机)中的位置及姿态参量。头部姿态估计指的是计算机估计图像中用户头部姿态参数的过程。近年来,头部姿态估计成为计算机视觉领域非常活跃的研究问题。随着计算能力的提高以及摄像机被引入新的领域,准确估计用户头部的朝向和位置变得日益重要,如在驾驶应用中通过估计头部姿态参数来分析驾驶员的驾驶状态。此外,头部姿态估计在人机交互、面部表情分析以及虚拟现实等众多领域有重要的应用。
随机森林算法(random forests algorithm,rfa)是leo breiman发展起来的一种新型分类和预测模型,是一种由多个分类决策树组成的组合分类器。rfa方法具有树型分类器运行速度快、需要调整的参数较少、不必担心过度拟合、能高效处理大样本数据、能估计哪个特征在分类中更重要以及较强的抗噪声能力等特点,理论和实验研究都表明,rfa方法能够有效地提高对新样本的分类准确度。
2. 研究的基本内容与方案
本文为了训练和测试随机森林算法,需要一个具有连续的头部姿态的空间的数据集上进行训练与测试,biwi kinect头部姿态数据集是从质量较低的深度传感器(例如,微软kinect设备)获取深度图像。得到采集的深度图像分辨率,人脸分辨率,头部姿态范围等数据。
从采集头部姿态方法看,头部姿态容易受头部形状脸部特征、表情变化、眼镜帽子等影响,基于外表模型方法及基于特征的方法不能有效地进行头部姿态估计。采用弹性建模思想,能有效地降低 这些外在因素的影响,在一定程度上,能有效地提高头部姿态的平均绝对误差。流形学习方法把高维并姿态相近的头像映射到低维的流形中,在流形学习算法上。加入姿态信息进行样本训练,能很好地忽略人脸外在因素的影响,在一定程度上,有效提高头部姿态方向精度。另外,融合多种方法进行头部姿态估计,也能弥补单一方法的缺陷。从实用性分析,在实时头部姿态估计上,头部姿态估计面临一些挑战,本文认为头部图像3d建模及融合多种头部姿态估计算法是必要的。头部图像的3d建模可以有效地呈现头部3d特征,头部转动本身就呈现出一个三维空间,这样可以避免2d空间的平面距离的缺陷。融合多种方法有效地避免另一种算法的缺陷,比如其中一种算法用于粗劣估计头部的大致姿态,另外一种算法用于估计头部的精细姿态。这样有利于降低头部姿态估计的平均误差。
随机森林因为具有快速处理大数据的训练能力和高效的在线计算能力,成为近年来机器视觉中处理大数据量的热门方法之一。进行随机森林算法后,将密度采样后的图像块通过训练好的随机森林模型中,从上至下遍历决策树的节点,最终到达叶子结点l。在叶子结点l存储的p(c=k∣p)表明对于类别标签k而言测试图像块所携带的信息量。最近,随机森林已经应用于实时的2d头部姿态的估计和分类以及3d图像的头部姿态识别。
本文算法不需要特定的硬件环境,无需手动初始化设置,并且可以根据头部姿态估计的速度和精度的要求来调节平衡点。实验过程中,通过kinect设备一帧一帧的运行,得到实时的头部姿态估计结果。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1] 李成龙,钟凡,马昕,秦学英.基于卡尔曼滤波和随机回归森林的实时头部姿态估计[j].计算机辅助设计与图形学学报.2017(12)doi:10.3724/sp.j.1089.2017.16521.
[2] 刘袁缘,陈靓影,俞侃,覃杰,陈超原.基于树结构分层随机森林在非约束环境下的头部姿态估计[j].电子与信息学报.2015(3)doi: 10.11999/jeit140433.
[3] 陈书明,陈美玲.头部姿态估计技术研究综述[j].泉州师范学院学报.2015(12)doi: 10.16125/j.cnki.1009-8224.2015.06.015