基于分段hash索引的虹膜快速匹配与识别系统毕业论文
2021-11-06 20:11:21
摘 要
针对传统的虹膜特征匹配识别时间随数据量的增长而大幅增长的问题,提出了一种利用hash索引的虹膜特征匹配搜索方法。传统的虹膜特征匹配识别是将待识别虹膜进行特征编码后得到的二进制串与数据库中的数据串逐一利用Hamming距离进行比对,直到找到小于阈值的串才停止,从而得出判断结果。这种方式在数据量扩大的情况下会带来计算量的增加,识别时间随之变长。为此提出一种新的方法,对虹膜数据集进行分段并对每段建立hash索引,并使用r-近邻算法对虹膜数据集进行筛选匹配。同时利用鸽巢原理,将整串查询变为对分段进行查询。该算法大幅度减少了查询次数,算法时间复杂度随之降低,达到了在大数据集下的虹膜快速匹配与识别的目的。本文利用CASIA虹膜数据库对该算法进行了大量的实验。实验结果表明:该方法在数据量增长的情况下能保持稳定快速的搜索速度,说明该方法可行有效。
关键词:特征匹配;分段哈希;CASIA虹膜数据库;虹膜识别
Abstract
Aiming at the problem that the traditional iris feature matching recognition time increases greatly with the increase of data volume, an iris feature matching search method using hash index is proposed. Traditional iris feature matching recognition is to compare the binary string obtained by feature encoding of the iris to be identified with the data string in the database one by one using Hamming distance, and stop until a string less than the threshold is found, so as to obtain the judgment result. This method will increase the amount of calculation when the amount of data expands, and the recognition time will become longer. To this end, a new method is proposed to segment the iris data set and establish a hash index for each segment, and use the r-nearest neighbor algorithm to filter and match the iris data set. At the same time, using the pigeon nest principle, the entire string of queries is turned into query on segments. The algorithm greatly reduces the number of queries, and the time complexity of the algorithm is reduced accordingly, which achieves the purpose of rapid matching and recognition of irises under a large data set. This paper uses CASIA iris database to carry out a large number of experiments on the algorithm. Experimental results show that this method can maintain a stable and fast search speed under the condition of increasing data volume, which shows that this method is feasible.
Key Words:Feature matching;Segmented hash;CASIA iris database;Iris recognition
目录
摘 要 III
Abstract IV
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 1
1.2.1 虹膜识别的国内外研究现状 1
1.2.2 虹膜识别的应用 2
1.3 本文主要研究内容 3
1.4 本章小结 3
第2章 虹膜识别系统概述 4
2.1 虹膜的生理结构 4
2.2 虹膜识别系统的基本流程 4
2.3 本章小结 6
第3章 基于分段哈希算法的虹膜模式匹配 7
3.1 分段哈希算法介绍 7
3.1.1 r-近邻搜索 7
3.1.2 分段哈希算法 7
3.2 基于汉明距离的模式匹配 8
3.3 基于分段哈希算法的模式匹配 10
3.4 性能分析 13
3.4.1 时间复杂度 14
3.4.2 空间复杂度 15
3.5 本章小结 16
第4章 实验结果及分析 17
4.1 实验配置 17
4.2 算法效率分析 18
4.1.1 真实数据集 18
4.1.2 扩大数据集 20
4.3 本章小结 20
第5章 总结与展望 21
5.1 本文工作总结 21
5.2 未来工作展望 21
参考文献 22
致谢 24
第1章 绪论
随着计算机科学技术和信息社会的快速发展,我们生活的方方面面无不渗透着智能的气息。声纹识别,指纹解锁,面容ID等生物特征识别技术更是广受关注。而基于虹膜的特征识别技术又以其独特优势成为关注和待发展的重心。本章主要概述论文课题的研究范围。
研究背景及意义
身份鉴别从古至今都是维持社会秩序和人们正常交往的一环,从古人佩戴玉佩或帽徽这种个人专属物品来确定个人身份,到现代身份证准确表征身份,可以看出,传统的身份鉴别方式基本的手段大多是以身份标志事物[1]来确定身份。但身外之物容易丢失,还容易被有心人伪造,基于记忆的密码方式有被遗忘的风险。这些漏洞存在于传统的身份验证方法中,导致利用盗窃身份标志事物违法犯罪的案件时有发生,人民的生命财产安全受到了极大的威胁。随着生物技术的快速发展,利用人体所固有的生理特征(或行为特征)来进行个人身份识别的生物特征识别技术应运而生。这些生物特征是人生来所具有的,不会丢失,除非受到外界打击,在很长一段时间内不会改变,具有一定的稳定性,最重要是的是其不易被伪造,所以这一项识别技术被认为是一种终极的身份认证技术[2]。指纹识别,人脸识别,声纹识别等作为我们常见的生物特征识别技术有其独特的应用价值。虹膜识别或许在生活中不常见,但其以唯一性,稳定性等优点从众多生物特征识别技术中脱颖而出,成为国内外的研究重点。目前虹膜识别技术并未被广泛使用,主要原因是虹膜采集设备昂贵,虹膜图像处理和提取复杂。且如何利用提取好虹膜特征生成结构良好的数据库,在系统有大数据库虹膜识别的需求下,怎样提高系统的识别速度。这些问题都是虹膜识别技术发展中的关键问题,解决了这些问题,虹膜识别将在金融、信息、国防、交通、公安司法和人们日常生活这些领域中有广阔的应用前景。
国内外研究现状
虹膜识别的国内外研究现状
国外的虹膜研究较早,追溯到19世纪末,巴黎的刑事监狱利用犯人虹膜的颜色和纹理的不同来对他们进行区别。接下来从1987年到1994年,是虹膜识别技术体系的初步建立阶段。比较重要的事件分别是1993年John Daugman[3]使用二维Gabor变换提取虹膜特征开发出一个自动完备的虹膜识别系统,和1994年R.P.Wides研制出基于图像注册技术的虹膜认证系统,该系统通过拉普拉斯金字塔将虹膜区域图像分解为四个水平,根据图像的相关性进行匹配度计算[4]。近年来国外对于虹膜识别的研究也在于虹膜识别的四个过程,对于虹膜定位,Soliman[5]等人提出由粗到细的定位方法,利用形态学进行粗定位,再使用微积分算子进行精定位最后确定虹膜与瞳孔的中心点和半径。在特征提取方面,Adamovi[6]等人将机器学习与虹膜识别相融合,采用机器学习方法将生物识别模板分类为数字特征。省略了通常用于虹膜识别系统中的Gabor小波和其他滤波器组。所提取的特征进一步用于分类。随着虹膜识别研究的不断深入,人们也发现单一的虹膜特征存在应用的局限性,许多学者也开始尝试将多种特征融合的方法进行虹膜识别。Umer[7]等人提出了一种基于虹膜和眼周生物特征识别融合的身份识别新方法。
国内对于虹膜识别的研究较国外稍晚一些,1998年底,中科院自动化所开始虹膜识别方面的研究。2000年,谭铁牛提出利用多通道Gabor滤波进行特征提取[8],随后成功开发出具有我国自主知识产权的虹膜识别系统[9],因此获得了三项国家专利。国家重点实验室不仅拥有自主知识产权的虹膜识别系统,还建立了CASIA系列虹膜数据库,该系列目前已包含七个不同的虹膜数据库,有超过70多个国家的人下载了并使用了这些数据库。现今机器学习的兴起,人们对怎样有效的定位和提取虹膜特征点更感兴趣。在定位方面,王[10]等提出了一种新型的圆近似算法来实现瞳孔中心点的自动定位,实验结果显示定位精度和定位时间较传统Hough圆算法及改进的Hough圆算法均有所提高。杨[11]等提出了一种由粗到细的定位方法,并取得了不错的实验结果。在提取特征点方面,有使用小波变换提取全局虹膜特征点后再利用Log Gabor滤波提取局部虹膜特征点的综合特征提取方法[12]。肖[13]等通过卷积神经网络提取人脸和虹膜特征,并将t‐SNE 算法和支持向量机同时运用到降维和识别的过程中,提高了系统的鲁棒性。总之,将深度学习算法应用到虹膜识别中成为了现今的主流研究趋势。
虹膜识别的应用
虹膜识别的应用场景十分广泛。2000年美国设计的专为航空公司飞行员和机场职工使用的虹膜通行证在机场开始启用。而后在2002年2月8日,英国伦敦希思罗机场也将虹膜识别应用到了旅客的登机上,将传统的手持登机牌变为了无需额外携带的虹膜。2006年1月30日,美国新泽西州的学校将虹膜识别应用于学校的安保中,使用虹膜这一生物特征对学生和老师进行识别,防止了外来人员的侵入,降低了校园管理的难度。在信息安全领域,越来越多的设备开始支持虹膜识别,微软的Win10系统不仅可以使用Windows Hello面部识别,还可以选择虹膜识别代替密码。2015年,EyeStart与Intel、民生银行和联想合作,推出了全球第一款能够用虹膜进行支付的手机。同年,富士通也推出了一款概念手机,该手机主打虹膜解锁手机功能,不再使用传统的密码解锁方式。2020年新冠肺炎疫情期间,虹膜识别也应用到了医疗领域。北京小汤山医院首次启用了非接触式虹膜识别门禁系统,医护人员将不需要使用门禁卡进入各个医疗区域,使用虹膜的方法大大降低了接触和感染的风险。同时,为了推动疫情期间企事业单位的安全复工复产,中国航天二院二〇三所研发的远距离虹膜测量一体机[14],同时具有虹膜识别与红外热成像测温功能,可应用于企事业单位的考勤中,非接触式的设计可有效避免交叉感染。