基于表情变化的三维人脸识别外文翻译资料
2022-09-26 16:49:17
英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
基于表情变化的三维人脸识别
摘要:在本文中,我们介绍了一个完全自动的框架下,基于表情变化的三维人脸识别。对于三维数据的预处理,提出了一种改进过的鼻子检测方法。一些小的姿势可以同时校正。随后,提出了一种基于稀疏表示的人脸表情处理方法。其结果是,该框架提高了识别率,因为面部表情是三维人脸识别的最大障碍。那么,基于双树复小波变换(DT-CWT)的面部表述是从深度图像中提取的。它包含了面部信息和六分区信息。识别是由线性判别分析(LDA)和最近邻分类器所达到的。我们已经对人脸识别大挑战数据库和博斯普鲁斯海峡数据库进行了不同的实验。它实现了98.86%的识别率,在人脸识别大挑战(FRGC)中所有的实验都在0.1%的错误接受率(FAR)并且在博斯普鲁斯海峡数据库中近正面人脸的表达变化和遮挡验证率达95.03%。
关键词:二元树复小波变换;三维人脸识别;稀疏表示;线性判别分析
介绍
三维人脸识别是一个不断发展的学科挑战性问题,这些年来,许多新的三维人脸识别方法均表明在人脸识别大挑战(FRGC)V2的数据中有很好的性能。
首先通过faltemier等人提出了区域匹配方案。在他们的论文中,整个三维人脸图像被分为28个补丁。独立匹配的区域的融合结果可以实现良好的性能。Wang等人从深度图像中提取了Gabor,LBP和Haar特征,然后最具歧视性的局部特征就是选定最佳的增强和训练为弱分类器,以便于组装三个集体的强分类。Mian等人从三维人脸数据中提取了球面表示(SFR)和尺度不变特征变换(SIFT)的二维数据用来训练一个拒绝分类器。其余的使用了基于区域的匹配方法,对于面部表情有较好的鲁棒性,来进行了验证。Berretti等人提出了一种将图形的形式化为反映三维人脸几何信息的方法,并将相邻点间的相关信息编码成一个协议表示。三维加权演练(3dww)的描述证明了相互的空间位移对应于双弧的条纹点之间。Zhang等人发现了一种新的三维人脸识别的分辨率不变局部特征。六种不同尺度不变的相似性措施进行了融合的得分水平,这增加了对表达变化的鲁棒性。
图1 框架的自动识别方法
三维人脸识别的精度可由于大表情变化显著降低。Alyuz等人提出了一种基于区域注册的表情抵抗三维人脸识别方法。在最近几年中,也有许多在处理面部表情之前识别的方法。Kakadiaris等人利用弹性适应变形模型,然后将三维几何信息放置到一个二维规则网格,从而结合二维数据的计算效率与三维数据的描述性。采用多级全自动对准算法和先进的小波分析方法进行识别。Drira等人为代表的面部表面的径向曲线从鼻子尖发出和使用弹性形状分析这些曲线的发展框架用来分析曼全面部表面形状。他们的方法使用的鼻子标本已经提供。Mohammadzade等人提出了一种新的迭代方法,可以处理三维人脸。他们进行的实验证明,正常的向量和点的坐标相结合,可以提高系统的识别性能。一个验证率为99.6%在一个虚假的接受率(远)为0.1%的情况下,已经实现了使用所提出的方法的所有实验。Amberg等人描述了一种用于人脸识别的表达不变的方法拟合一个身份/表达分离的三维形变模型的形状数据。表达式模型大大提高了识别功能。他们的方法操作查询时间在约40秒/次至90秒/次。我们的方法是一种自动三维人脸识别方法。我们的方法的框架在图1表示出。对于数据预处理,提出了一种改进的鼻子检测方法。同时,对人脸的小姿态进行校正。然后,面部区域(没有头发和耳朵)使用一个以鼻子为中心的球体。在寻找人脸区域后,使用一种基于稀疏表示的新方法去除面部表情。最后构建了深度图像。在训练的部分,我们使用所有的943面在FRGC V1中训练。首先,我们通过复小波变换提取各培训四级子面双树。随后,我们将六级子图像矢量化为一个向量维数是384的矢量,利用线性判别分析(LDA)学习培训面临的子空间,然后记录变换矩阵。其次,六个四级子图提取双树复小波变换,并转换成维数是2304的矢量。之后,我们利用线性判别分析法来学习变换矩阵。最后,我们利用双树复小波变换获得画廊中的人脸的两个特征和变换信息矩阵,来建立两LDA子空间。在测试部分,我们获得的所有探头面两特征分别采用DT-CWT和他们的两个变换矩阵。余弦距离是用来建立2个相似矩阵的。在该方法的结尾,2个相似矩阵的融合,和最近邻分类器被用来完成识别过程。
本文的主要工作可以概括为以下几个方面:
第一个贡献是一种改进的鼻子检测方法,它可以正确的小姿势的脸迭代。提出的这种鼻子检测算法简单,且在FRGC数据库中成功率为99.95%。
第二,本文提出了一种基于稀疏表示的三维人脸表情处理方法。李等人将稀疏表示方法运用在三维人脸识别中,并将其应用于人脸识别中。在本文中,稀疏表示用于面部表情处理。稀疏表示的目标是与最小数目的画廊数据集关联。考虑到我们的表达处理工作的首要任务是找到表达元件的最小数目的字典(因为人们只是一种表达一次),稀疏表示的目的自然是更适合于从数据集中发现的表达变形。这是一种学习方法,可以从一个中性和表现空间的字典中试验面中性成分,它去除一个表情的成本只有14.91(我的CPU型号为英特尔(R)核心(TM)i3 - 2120,内存是2 GB)。所提出的方法更简单且只需要花费更少的时间。
论文规划内容如下:在第二节提出了数据预处理方法。本节介绍了改进的前端检测方法。然后,在第三节提出了三维面部表情处理方法。在4节中,给出了我们的三维人脸识别方法的框架。实验结果在第5节中给出,并在第6节中得出结论。
3D数据预处理
首先,一个3times;3高斯滤波去除尖峰和噪声,然后范围数据采样在1:4的比例。在FRGC数据库中一些3D的面孔包含耳朵的信息,而有些耳朵被头发遮住了。为了保持一致性,我们只使用人脸区域进行识别。现在,我们介绍的人脸区域提取方法。
2.1鼻子探测
鼻子是三维人脸的中心,所以鼻子检测对面部区域提取是非常重要的。在图2中给出了提出的建议的鼻子检测程序框图。
在本文中,前端检测的第一步是寻找中央条纹。详细介绍在我们早期的工作中给出。我们使用面临身份02463d453 FRGC V1为标准的脸和手动找到鼻尖上的条纹。随后,我们发现其他人的鼻子尖可使用自动迭代算法。让我们假设A是一个ID为02463d453脸的中央条纹,B是需要被发现的鼻尖的脸中央条纹。方法如下:
⑴用电感耦合等离子体发射光谱法对条纹进行调整并记录变换矩阵M。
⑵用矩阵M找第一人称的转换鼻尖的点P。
⑶作物一个球体(半径为37毫米)为中心的点P的最高点在球体被发现作为鼻尖的步骤是在我们以前的工作中给出。
⑷作物一个球体(半径= 90毫米)为中心的前端和对齐的标准面。计算变换后的鼻尖P1。
⑸作物一个球体(半径为25毫米)为中心点P1。在球的最高点是发现新的鼻尖P2。
⑹如果P2-P1的绝对值小于2毫米,则P2点为鼻尖,否则重新回到步骤4。
2.2面部区域
一旦鼻尖被成功地发现,鼻子检测的最后一步的区域被用作面部区域。所有有过多的头部旋转,头发,和夸张表情的面部都成功的被该鼻子算法分段。图2给出了一些例子。
3.基于稀疏表示的三维人脸表情处理方法
面部表情是三维人脸识别的最大障碍之一,因为人脸表情信息较少,脸上的信息可以很容易地被面部表情所影响。在这一节中,我们引入了一个新的表达处理方法,用于去除面部表情,这是基于稀疏表示。我们希望,我们的方法可以建立一个开放的嘴和估计中性成分之间的对应关系。
3.1稀疏表示简介
在本文中,我们使用L1正则化最小二乘回归模型的系数估计。L1正则化是已知产生稀疏系数可以鲁棒性无关的特征。在一般情况下,这个问题可以被表述为: (1)
其中y为试验样品,x是一个dctionary稀疏表示,和gamma;是标量常量(在本文中,我们令y等于5000)。特征符号搜索法被用为求解方程1。
图2 所有这些脸成功鼻子检测算法分段
3.2面部表情处理方法
首先,我们使用一个基于三角形线性插值法拟合曲面z = f(x,y)(它的尺寸为128times;128)。同时,我们使用一个基于三角形线性插值拟合尺寸为384times;384的曲面,然后在第四节中,我们使用特征提取的表面来建立深度图像。
我们认为的表面( = Z)作为参考面的总和(),中性成分(Delta;),和一个表达元件(Delta;)。在本文中,我们使用ID f0001_ne00的BU-3DFE集的表面作为参考。
这节的目标是为了得到
在本文中,我们利用稀疏表示从中性空间和表述空间评估测试表面的Delta;和Delta;,因为我们想找到字典中表达组件的最低数量和使用中性空间Delta;的线性组合。首先,字典中的A =[ , ]需要被建立,属于中性空间,属于表述空间。275中性面孔的结果(对FRGC V1每一个人的第一面)减去基准面,然后化为275大载体作为中立的空间=[,,...,],当。然后,再对460种不同的表情的面孔结果(第一10男子23表达面临从DataSet数据集和BU-3DFE BU-3DFE第一10女子23表达的面孔)子牵引相应的中性面,分别矢量化为460大载体应用于被表达的空间[],当。基准面和第一人的表情的脸如图3所示。
在测试部分中,从测试面中减去基准面和该字典的稀疏表示A被方程1描述为
当
由于中性成分的中性面是高度相关的,这种方法可以找到熟悉的中性成分的测试面。在此之后,我们使用一个和稀疏向量的测试面的中性成分重建的测试
(4)
所以等于 与的和。:
=
= (5)
但是是相近的,所以中的每个点不可能完全存在于中。在本文中,我们使用一个迭代的方法来寻找中性面。该方法在图4中给出。
十个不同的人的表达处理结果在图5的第二行。误差图显示在第三行中。从图中,我们可以发现,我们的方法可以保持刚性部件的脸。注意我们的方法不仅可以去除面部表情,还可以保持中性面孔。所以在识别部分,我们没有必要识别探头是否表达了脸表情。在图6中给出了一些中性面。
最后,利用中性点对表情进行深度图像的构建。深度图像的大小为128times;128。
4.基于二元树复小波特征的人脸识别
除去面部表情后,三维人脸变得非常相似。从每个人脸特征提取识别特征是非常重要的。在本文中,我们利用双树复小波变换提取表达[19,20]去除面特征(人脸图像的大小是128times;128),六个区域的特征(六个区域是从人脸图像中提取的大小是384times;384和每个区域的大小是128times;128)。六个特征点在图7a所示。我们用一个简单的方法来找到这些点。首先,我们手动定义一个标准面的六点。然后,每个画廊和探针的面孔,六区9号9times;重心为标准,面对同样的标准被发现。最后,在形状指数值[ 21 ]提炼出的六个特征点。局部极大值点和细化标志点5,而局部细化的地标为点 1,3,4,和6。因此,大小为128times;128的六区质心被定义为六成品特征点。
图3 参考脸和表情脸 第一个参考面,而其他人是23张表情的脸,用于建立表现的空间。
在训练的部分,我们使用所有的943面在FRGC 1.0中培训。首先,我们提取四级幅度每个人脸图像。随后,我们进行六级子成一个大的矢量(尺寸384),然后我们利用LDA [ 2 ]学习判别空间和记录变换矩阵。其次,我们提取六subre
图4 找中性脸框图
区四级子双树复小波变换和矢量化为一个大的载体(尺寸2304)利用LDA的学习空间。最后,我们分别把所有的画廊面临的双树复小波变换及其变换矩阵的两个特征。
在测试部分,我们把所有的探头表面的两个特点分别利用DT-CWT以及两个变换矩阵。利用余弦距离建立相似矩阵的和。在此之后,我们利用函数建立了他们。
(6)
在这个函数中,表示相似矩阵和的一个元素(行为r列为c),为相似矩阵和列为c的元素表示,为的相似标准化形式。然后,最终的相似性矩阵是建立一个简单的和规则。识别是通过最近邻分类器获得的。
图5 10个不同的人表情处理结果。 第一行显示了原始深度图像。第二行是表情处理结果。最后一行是错误处理二进制的结果。
图6 一些中性脸。我们的方法可以保持中性面孔
图7 使用两个不同大小的深度图像的方法。(A)大小为384times;384。(B)大小为128times;128。
5.结果分析
我们在博斯普鲁斯数据库[22]和FRGC[23]真实感三维人脸数据库实施我们的实验。博斯普鲁斯数据库有105个有各种姿势、表情和咬合状态的受试者。十八个有胡子/小胡子和短头发的受试者可用于15个项目。大多数的受试者年龄在25 - 35岁之间。总共有60名男性和45名女性,大多数受试者是白种人,而且数据库中注册有27个专业的演员。每个受试者有54个脸部扫描,但有34个受试者是31个扫描。因此,总面部扫描的数量是
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[150569],资料为PDF文档或Word文档,PDF文档可免费转换为Word