年龄估计的深度学习特征外文翻译资料
2022-12-07 16:14:52
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
年龄估计的深度学习特征
郁振波
南京信息工程大学信息与控制学院 江苏省南京市 210000
摘要:人类的年龄提供了一个关键的人口统计信息。这在人类的鉴定和搜索方面被认为是一个重要的生物识别特征。和其他的模式识别的问题相比(对象分类,现场分类等),因为随着年龄变化人脸变化越来越不显著以及年龄衰老的程度差异因人而异,所以年龄估计的研究越来越具有挑战性。在这项工作中,我们调查了基于卷积神经网络(convoltional neural network,CNN)深度学习的技术。一个基于深度学习模块的年龄特征提取的新框架被建立起来。和之前基于CNN的模型,我们用在估计过程中用同层获得的特征图来代替从底层获得的特征。此外在提出的方案中产生的多样的学习算法,且该算法且该算法显著提高其性能。此外,用这种深度学习老化模式(deep learned aging pattern ,DLA)评价年林估计的各种分类和回归方案。据我们所知,这是第一次深度学习技术被用于引入或应用于解决年龄估计问题。两个数据集的实验结果表明,所提出的方法要显著优于当前最先进的方法。
关键词:卷积神经网络 深度学习技术
Deeply-learned Feature for Age Estimate
Yu Zhenbo
Nanjing university of information scienceamp;technology Nanjing 210000
Abstract: Human age provides key demographic information. It is also considered an important soft biometric trait for human identification or search. Compared to other pattern recognition problems (e.g., object classification, scene categorization), age estimation is much more challenging since the difference between facial images with age variations can be more subtle and the process of aging varies greatly among different individuals. In this work, we investigate deep learning techniques for age estimation based on the convolutional neural network (CNN). A new framework for age feature extraction based on the deep learning model is built. Compared to previous models based on CNN, we use feature maps obtained in different layers for our estimation work instead of using the feature obtained at the top layer. Additionally, a manifold learning algorithm is incorporated in the proposed scheme and this improves the performance significantly. Furthermore, we also evaluate different classification and regression schemes in estimating age using the deep learned aging pattern (DLA). To the best of our knowledge, this is the first time that deep learning technique is introduced and applied to solve the age estimation problem. Experimental results on two datasets show that the proposed approach is significantly better than the state-of-the-art.
Keyword: convolutional neural network;deep learning technology
1 介绍
面部知觉是人类社交的根本,很多不同种类的信息是从人脸可见的,从这些信息中提取相应的过程和机理是复杂而又相当专业化的,人脸的重要已经被广大科学家所认知[1]。例如,人脸在辨认根源,情感趋势,健康质量和社会信息上至关重要。很多视觉非语言的信息是由人脸传达的,包括身份,年龄,性别,民族,情感等。人脸对于日常交流是必要的。
人脸属性在图像处理技术,比如人机交互(HCI)的应用中起着重要的作用。已知的是,一个重要的评价这些系统的标准是正确实时解释面部图像的能力。从面部图像精确获取这些面部属性对提高系统的反应和执行功能有很大的提高。自动年龄估计系统有着广泛的应用,在安全区,一个精细设计的特定年龄人机交互系统(ASHCI)有助于防止未成年人浏览成年网站的网页或者从自动售货购买年龄限制的材料。ASHCI可以方便我们的日常生活,比如ASHCI安装的车辆可以预防小孩在没有成年人指导的情况下启动引擎。当司机没有采取任何保护就把小孩单独留在了车辆中,一个ASHCI系统可以提供一个警告。年龄的信息也可以在执法时使用,它可以被用来在一个图画集通过特定年龄组在图库集中限定搜索范围从而快速确定嫌疑人,这可以帮助提高匹配的效率。年龄估计也在商业领域有用。例如,店主可以通过顾客的人口统计调整装饰风格和广告。
虽然基于图像的年龄估计在实际应用中是一个重要的技术,但他仍然是一个具有挑战性的问题。正如图1所示,在老化的过程中不同个体的差别也很大。
|
|
|
|
|
|
|
|
|
|
图1 两个不同个体的老化过程示意图,每行显示了同一个人在不同年龄的图像 |
特定年龄人机交互(ASHCI)在日常生活中有着广泛的潜在应用,但是自动年龄估计系统还不发达。其中一个主要的问题是,对人脸的老化影响表现出几个独特的特征使年龄估计成为一个需要无标准分类方法的挑战性任务。
根据老化年龄影响的特殊性,论文[2]为自动年龄估计提出了AGES(老化模式子空间)的方法。基本的思路是模拟老化的方法,其通过学习一个代表性的子空间被定义为一系列个人老化人脸图案。对于一个看不见的人脸图案正确的老化模式由在最能重建人脸图案的子空间上面的投影所决定,然而人脸图案在老化模式中的位置将会表现出它的年龄。所述的AGES的方法无论是在年龄估计还是年龄范围的估计的对比实验中均显示出其令人鼓舞性的性能。
总的来说,这些因素可以被分为内部因素和外部因素两个不同的种类。内部因素主要是由生理因素决定的,如基因。外部因素包括生活环境,健康状况,生活方式等。提取出不随个体差异变化而带来影响的稳定的老化特征仍然是一个开放性的问题。
本文提出一个自动年龄估计的新颖的方法。所提出的方案基于深度学习模式(CNN),据我们所知,这是CNN首次应用于年龄估计问题。其次,为了评估所提方案的性能,我们比较了最近大多数基于两个标准数据集的方法。实验结果表明和最先进的相比该方案有一个显著性的提高。
2 相关的工作
2.1前人的研究
在过去的几年中,许多努力一直被致力于基于年龄估计研究的人类图像。这些工作可以被分为两个子问题,如何提取年龄特征,如何根据提取的特征预测年龄。
2.1.1基于人体特征和仿生原理的年龄估计
1994年,Kwon和Lobo用人形形状来表示老化特征[3]。他们用人体测量的信息来预测年龄。他们的方法是基于头颅面庞发展理论和皮肤皱纹分析。2006年,Ramanathan 和 Chellappa在头颅面庞生长模式的基础上进一步通过表征生长形状的变化来进行年龄估计[4]。
但是基于人体特征的年龄估计只能粗略地估计年龄,并不准确。只能解决一些例如为一个调查图片估计整体的年龄组别,该图片是否属于年轻的成年人,老年人或者是小孩之类的笼统性的问题。这类研究并不能解决那些已经限制了年龄估计问题的应用范围的连续年龄分类。
2.1.2基于仿生原理的年龄估计
在2009年[5]和2012年[6],Guo et al运用仿生原理以及面部表情的变化来估计年龄,通过一些不同方向和标尺的gabor滤波器事先确定好从脸部图像中提取年龄特征从而进行年龄估计,一定程度上大大增加的年龄估计的准确性。
2.1.3基于老化模式子空间的年龄估计
年龄图像表示的另一个代表方法即2007年Geng提出老化模式子空间[7],基本思想史充分利用有序个人的面部图像来为年龄估计重建老化子空间。被用来重建投影子空间用于预测测试人脸的年龄标签。这种工作的其中一个优点是所构建的学习子空间可以解决在序列中丢失的年龄。
2.1.4基于回归判别法的年龄估计
还有其他一些用于提取年龄特征的方法。在2011年,受到老化过程顺序特征的影响,Chang提出排名方案来解决年龄估计[8],如8岁的脸部与11岁的脸部更加密切相关。
年龄问题可以被看做是一个分类[7]或者回归问题[9]。最近,一些新的回归方法被引入年龄估计。在2013年,Chen等人将累计属性的想法用于年龄估计[10]。在2014年,郭和幕采用将偏最小二乘(partial least squares ,PLS)回归[11]和典型相关分析(canonical correlation analysis,CCA)[12]结合的性别和种族的老化模式[13]。
本文结构安排如下,所提出的方案在第三节给出,在其中,我们给出了关于所提方案的一个细节描述。在第四节,我们谈论数据集和实验环境。对所提方法和以前方法的比较的实验性评论将在第四章节被讨论。最终的结论在第五章节。
3 提出的方案
我们首先介绍CNN的基本原理,然后谈论我们的特征提取方案。给出对卷积神经网络简要的介绍,主要集中于为什么学习“深”的学习特点在表征年龄模式中是有效的和如何在年龄估计问题中充分利用深入学习特征。然后为了一个好的性能我们调查了在年龄估计中不同多方面的学习方法来捕捉潜在的老龄化结构并代表在低维的年龄的信息。我们也研究了一些流行的分类和回归方法,包括支持向量回归(support vector regression,SVR)[14],支持向量机(support vector machine,SVM)[15],对年龄估计的PLS和CCA。
3.1卷积神经网络(CNN)
要从不同的人脸面庞中了解到衰老模式,我们需要一个有强大学习能力的模型。最近,深度学习模型已经被用来在分层结构中提取多个特征层次。所构建的结构可以捕获分层的,抽象的和平移不变的特征。深度学习模式在很多应用中证明能得到非常有希望和合理的结果我们从中可以发现深度学习擅长利用深度框架,表征视觉数据的高度抽象性,它是由多个非线性变化构成。其中,卷积神经网络(CNN)已经表明了在捕获图像特性方面极好的能力[16]。CNN可以归为一类生物激发,多层神经网络。它采用了前馈神经网络。CNN的设计灵感来源于使用多层转化在特征图中的深度单个神经元对应于视觉领域的重叠区域来模拟人视觉感受的生物过程。CNN已经被广泛使用在计算机视觉的很多方面并获得了非常理想的结果,例如视觉对象识别[17],检测[18]和图像恢复[19]。尤其在文献[20]中的学习特征可视化可以看出,CNN在不同层次的学习可解释特征中显得非常有效。得益于在从图片中提取特征的良好能力,在这项工作中,我们将CNN应用于从静态人脸图像中提取老化特征。我们认为从更深的层次学到的权重对于年龄估计问题训练集的图像更为具体。典型的CNN结构由卷基层和交替重叠的二次取样层构成。一个完全连接的多重逻辑感知(multiple logistic perception,MLP)被应用于网络的顶部。
3.1.1卷基层
在卷基层的每个神经元由使用从上一层的逻辑感知领域产生的输出和学习的核心(权重)形成。在相同特征图中的神经元共享同种内核,但只能通过使用不同的输入感知领域获得。这些被用在同一层的不同特征内核
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[31625],资料为PDF文档或Word文档,PDF文档可免费转换为Word