基于稀疏约束和级联回归的人脸特征点定位研究文献综述
2020-04-28 20:31:49
为了有效的由人脸图像中获取包括表情、姿势、身份等信息,通常需要先进行人脸特征点检测。人脸特征点是当前计算机视觉领域的研究热点之一,其目的是准确定位出人脸图像中具有语义特征的面部关键点,这也是人脸识别、人脸美化等众多与人脸有关的视觉任务中的重要步骤。[1]近年来,国内外学者提出了许多人脸配准的方法,大体上可以分为基于参数化模型的方法和基于回归的方法。基于回归的方法中,代表性的工作有基于深度卷积神经网络回归的方法和基于级联回归的方法。在加州理工学院从事博士后研究的Piotr Dollár于2010年首次提出级联形状回归模型Cascaded Pose Regression(CPR),来预测物体的形状基于级联回归的方法主要依赖局部描述子的稳健性能,通过级联的弱回归器你和复杂的非线性映射,能够有效定位人脸关键点坐标。级联回归模型通过级联简单的回归器不断拟合配准残差已完成人脸配准[2]作为一种流行的人脸对齐方法,它在野外数据库上取得了良好的表现。基于级联回归的代表性算法有ESR(explicit shape regression)[3]、LBF(local binary feature)[4]、ERT(ensemble of regression tree)[5]等,它们大多精度高,定位速度快。然而,在估计可靠的特征点位置时,它很大程度上取决于局部特征。[6]所谓局部特征,顾名思义就是在有遮挡情况下,一直能够稳定出现并且具有良好的可区分性的一些点。常见的局部特征有SIFT特征(尺度不变特征变换)、SURF特征(加速鲁棒特征)、DAISY特征(面向稠密特征提取的快速计算的局部图像特征描述子)。而在现实中,由于表情,照明,姿态以及现实世界中的遮挡现象存在很大的变异性,这个问题仍然具有挑战性。[7]
为了解决级联回归框架在以上提到极端情况——特别是有遮挡情况应用下所出现的局限性,本课题提出将遮挡检测加入级联回归框架。随着压缩感知(Compressed Sensing, CS)理论的兴起,稀疏表示成功的用于人脸识别,并且,与传统的人脸识别方法相比较,基于稀疏表示的分类方法(Sparse Representation Classifier, SRC)省掉了特征提取这一步骤,并且对噪声、光照、遮挡等具有一定的鲁棒性。[8]本课题将利用稀疏约束筛选鲁棒的特征,将遮挡概率转化为权重,减小遮挡概率大的特征点对应的权重,从而有效抑制遮挡对回归过程的影响,最终提高级联回归算法的特征点定位准确度。
参考文献:
[1] 伍凯, 朱恒亮, 郝阳阳,等. 级联回归的多姿态人脸配准[J]. 中国图象图形学报, 2017, 22(2):257-264.
[2] 邓健康, 杨静, 孙玉宝,等. 基于稀疏级联回归的快速人脸配准方法及其在移动设备上的应用[J]. 计算机科学, 2015, 42(10):301-305.
[3] Cao X, Wei Y, Wen F, et al. Face Alignment by Explicit Shape Regression[J]. International Journal of Computer Vision, 2014, 107(2):177-190.
[4] Ren S, Cao X, Wei Y, et al. Face Alignment at 3000 FPS via Regressing Local Binary Features[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2014:1685-1692.
[5] Kazemi V, Sullivan J. One millisecond face alignment with an ensemble of regression trees[C]// Computer Vision and Pattern Recognition. IEEE, 2014:1867-1874.