基于卷积神经网络的人脸识别系统研究文献综述
2020-04-20 13:02:17
1.1课题背景
随着信息技术与计算机视觉技术的迅速发展,基于计算机视觉技术的信息安全在日常生活中的重要性日益凸显。身份认证作为信息安全的重要技术,被广泛应用于金融、安防和电子商务等各个领域。但传统的身份认证方法依赖于标志证件或密钥信息等附加信息,其安全性和方便性受到了携带物的限制,都无法满足互联网高速发展的需求。基于以上状况,人们开始利用具有唯一性、可靠性和方便性的生物特征识别技术,如指纹、虹膜、步态和人脸等,来实现各类身份识别应用。而生物特征识别技术中一种非接触式的识别方法——人脸识别,具有方便、隐蔽和交互性强等特点,已经成为人工智能与模式识别领域的热点。从生物学、心理学到生理学、认知学,从图像图形学到模式识别等领域都有着很广阔的应用前景。虽然,相对于指纹识别、虹膜识别技术来说,人脸特征的唯一性要差一些,但是采集手段十分简单、方便、隐蔽,使用者也不会因为隐私等问题而产生抗拒心理。目前,因为人脸特征的唯一性比较差,在对信息安全性的要求比较高的系统中,只能作为一般的辅助方法。然而在安全性要求相对较低的系统中,例如,近期在武汉火车站,上海交通大学图书馆设立的人脸识别身份验证,以及最新智能手机的人脸识别解锁系统,都体现了身份识别技术有其良好的应用价值,并广受众多体验者的支持和青睐。
人脸识别技术(Face RecognitionTechnology,FRT)是基于人的脸部特征, 对输入的人脸图像或者视频流判断人脸及其位置、大小和各件主要面部器官的信息,提取身份特征,将其与已知的人脸进行对比,从而识别每个人身份的技术。目前,人脸识别技术一般由三部分组成:人脸检测与校准、人脸特征提取、人脸验证和识别。人脸特征提取对后续的人脸识别极其关键,直接影响到识别准确性。传统的人脸识别方法在特征提取环节往往是依靠经验,人工预先提取出样本数据的浅层特征,然后再选择相应的分类器来决策分类。这种浅层特征不但依赖大量的先验知识,而且缺少信息表征能为,导致基于浅层特征的识别方法泛化能力较差,容易受到光照、姿态和表情的干扰。随着机器学习发展,深度学习应运而生。深度学习本质上是通过构建具有多个隐藏层的网络来表征更多具有代表性的特征信息,通过大规模数据训练,实现人脸特征的高维隐性表达,不但避免了复杂的特征提取工作,同时具备强大的特征表达能为。
卷积神经网络(Convolutional NeuralNetwork,CNN) 作为深度学习中广泛使用的神经网络模型,通过构建多个特征提取层隐式地从训练数据中学习深层次的特征;其局部感知、权值共享和池化采样等技术大幅度降低了网络的复杂度,更利于网络训练与实现。卷积神经网络具有较强的特征表达能力和学习能为,不但避免了人工提取特征的繁琐工作而且可以提取深层次抽象特征,大幅度提高图像识别的精度。同时该网络主要用于二维图像的识别,对图像的位移、缩放和形变具有高度的不变性。因此构建和应用合适的卷积神经网络来解决人脸识别问题具有十分重要的研究意义。
1.2发展现状
1.2.1国外发展现状
当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer InterfaceInstitute,Microsoft Research,英国的Department of Engineeringin University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:
(1)模板匹配
主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较多。但是由于人脸特征的变化很大,很难得到有效的模板来表示人脸的共性。变形模板在原理上与固定模板相同,但其中包含一些非固定的元素,一种方法是手工构造参数化的曲线和曲面以表征人脸中的某些非固定特征,如眼睛,鼻子和嘴唇等。另一种方法是系统自动生成自适应的曲线或曲面,以构成变形人脸模板。检测方法是:将模板与测试图像进行弹性匹配,并加入惩罚机制,利用某种能量函数表示匹配程度。
(2)示例学习
示例学习的基本思想是从某一概念的已给正例和反例的集合中归纳产生出接受所有正例同时排斥所有反例的该概念的一般规则。将人脸样本和非人脸样本送入学习机中,产生出判别规则,从而用于作为判断输入的测试图像是否属于人脸的主要判别依据。为了获得较高的精度,学习过程需要大量的样本,另外样本数据本身是高维矢量,因此,研究通用而有效的学习算法的关键是精确的区分性和数据维数的降低。