居民身份证号码识别毕业论文
2022-07-24 10:12:59
论文总字数:16627字
摘 要
由于现在社会上身份证号码是每个公民所拥有的识别身份的唯一标识,所以身份证号码就成了每个公民终身不变的能够辨别公民身份的唯一代码。因为我国人口众多,而身份证号码自动识别系统拥有较高的识别效率,因此研究并推广身份证号码自动识别技术是十分必要的。
由于身份证图像在采集和传输时一般会受到噪声干扰,还可能包含其它无用的,影响识别率和识别速度的信息,所以本文首先对采集到的身份证图像进行预处理,包括图像灰度化、二值化、腐蚀膨胀、单个字符切分等。鉴于身份证号码只有0-9和X这11个标准的加粗5号黑体字符,本文在识别阶段直接采取模板匹配法进行全字符匹配,利用corr2函数求两个矩阵对象的相似度,通过相似度的比较进行识别。
实验结果表明,本文实现的身份证号码自动识别系统能有效的识别身份证号码,并具有较高的识别准确率和较快的识别速度。
关键词:身份证号码 预处理 模板匹配 识别
The Recognition of the ID Card Number
Abstract
Now that the community identity card number is a unique identifier for each citizen to have identity. So the ID number for each citizen to become life-long citizenship can identify a unique code. Because China’s large population and identity card number of automatic identification system has high recognition efficiency. The promotion of research and identification number of automatic identification technology is essential.
Since the ID image capture and transmission in general will be noise. But also may include other useless marketing recognition rate and speed of information. So this first collection to the identity image preprocessing. Including gray-scale image, binary, corrosion expansion a single character cut grading. Given the ID number is only 0-9 and X which 11 standard No.5 in bold characters. The paper directly take on the recognition stage template matching full character matches, the use of two matrices corr2 similarity function evaluation object through similar comparison of identification.
The experimental results show that this ID number to achieve recognition system can effectively identify the identity card number has a high recognition accuracy and faster recognition speed.
Key word:Identity card number;Pretreatment;Location and segmentation;Distinguish
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 课题背景 1
1.2 研究现状 1
1.3 主要工作和内容安排 2
第二章 身份证号码自动识别系统概述 4
2.1 基本构成 4
2.2 相关概念 4
2.2.1 图像采集 4
2.2.2 图像预处理 5
2.2.3 图像的识别 5
2.3 本文的身份证号码识别系统框图 5
2.4 本章小结 5
第三章 图像的预处理 6
3.1 图像灰度化 6
3.2 图像二值化 7
3.2.1 二值化方法概述 7
3.2.2 全局二值化方法实现 8
3.3 身份证号码区域的粗定位 9
3.4 边缘检测 10
3.4.1图像边缘检测概述 10
3.4.2 图像边缘检测方法的实现 11
3.5 图像腐蚀膨胀 12
3.6 单个字符的分割 16
3.6.1号码区域的分割 16
3.6.2单个字符边界的确定 18
3.7 本章小结 18
第四章 字符识别 20
4.1字符的特征及特征提取 20
4. 2本文的方法 21
4.2.1 模板的建立 21
4.2.2模板匹配 22
4.2.3字符识别的实现 24
4.3本章小节 25
第五章 结果与分析 27
5.1 实验环境 27
5.2 测试过程与结果 27
5.3 分析 29
第六章 总结与展望 30
6.1 总结 30
6.2 展望 30
参考文献 32
致谢 34
第一章 绪论
1.1 课题背景
由于现在社会上身份证号码是每个公民所拥有的识别身份的唯一标识,所以身份证号码就成了每个公民终身不变的能够辨别公民身份的唯一代码。当公民从事相关活动,例如户籍变更登记等需要证明身份的活动时需要用到身份证。因此,如何对身份证号码进行识别就成了需要研究的对象。
目前,由于使用多年的一代身份证科技含量较低,难以辨别真伪,而二代身份证则有效的解决了上述问题,且便于管理,因此二代身份证的普及势在必行。同时,为了方便识别,身份证号码自动识别系统的建立也是必要的,但是由于二代身份证图像使用彩色照片,而采集到的数字相片都有着不同程度的色彩质量偏差。
伴随着计算机的出现及日益成熟的人工智能系统,将图像信号变为数字信号并通过计算机来处理而产生的新的科学即计算机视觉技术也日益成熟。人类思想的载体交流主要通过文字,因此如何通过计算机视觉来对文字进行识别就成了很重要的一个课题。字符识别是计算机视觉科学中一个很重要的分支,字符识别是一门综合性科学,它在社会各行各业都有广泛的应用。脱机识别和联机识别是基于所输入设备的识别分类,印刷体字符识别和手写字符识别是脱机字符识别的两个类别,限制性手写字符和非限制性手写字符是手写字符的两个分支,而身份证号码则是典型的印刷体字符,由于印刷体字符基本上都差不多,在相同的预处理情况下印刷体字符识别的错误一般都是由分割方法的好坏造成的。
本课题主要通过对身份证号码进行图像预处理,图像定位与分割以及识别等步骤来提高身份证号码识别的准确率。
1.2 研究现状
居民身份证号码识别的研究对象主要是印刷体数字,因此可以将身份证号码识别的研究归类为印刷体字符识别体系中。世界上最早的文字识别始于50年代初期的欧美,当时的研究对象主要为文字识别的方法,此后在1955年出现了印刷体数字OCR(Optical Character Recognition)的识别产品。最早的汉字识别是使用模板匹配的方法识别了1000个汉字。我国是在70年代末期、80年代初期开始对印刷体字符识别进行研究,到目前为止,由于研究的广泛性,我国的身份证号码自动识别技术已经全面进入推广阶段。但是,仍然存在的各种各样的问题,比如图像采集如何才能获得更好的原图,如何在消除干扰方面找到更为方便实用的方法,这些问题都是需要继续解决的。
请支付后下载全文,论文总字数:16627字