基于深度学习的身份证识别系统的开发毕业论文
2021-12-22 22:03:59
论文总字数:17365字
摘 要
身份证可以为我们生活中办理各项业务提供很大的便利,在很多场景下,身份证号及其他重要文本信息需要手工录入,因此使用身份证识别系统具有一定的实用价值。身份证识别系统可以对身份证图片中的文本信息进行自动识别,解决了人工信息录入十分繁琐的问题。
身份证识别系统的主要工作流程是经过灰度化、图像对比度增强、图像降噪、图像二值化后由原始的身份证图片转化为有效信息和无效信息分离的二值化图片;对二值化图片通过投影法进行文本定位文本切分、字符切分来获得单个字符的图片;再通过卷积神经网络训练出来的字符识别模型识别出图片对应的文字标签,最终得到身份证上各个字段的文本信息,达到文本识别的效果。
对身份证识别系统的研究发现图像处理和深度学习的组合可以有效的实现对印刷体汉字的识别,并且可以应用到中国居民身份证的文本识别上。
关键词:身份证识别 深度学习 字符分割 OCR CNN
Development of id card recognition system based on deep learning
Abstract
Id card can provide great convenience for us to deal with various services in real life. In many scenarios, id card number and other text information need to be entered manually. Therefore, id card recognition system has very practical value. The id card recognition system can automatically recognize the id card texts, which solves the tedious of manual information entry.
By preprocessing the id card images, including image graying, image contrast enhancement, image noise reduction and image binarization, the id card recognition system can obtain binary image with valid information and invalid information separation. The text region of binary image is located by the projection method, and then do the segmentation. The character recognition model trained by convolutional neural network can recognize the processed image and find the corresponding text labels, and finally get the text information of the id card.
The research on id card recognition system shows that the combination of image processing and deep learning can effectively implement the recognition of printed Chinese characters, and it can be applied to the text recognition of Chinese identity card.
Keywords: Id card recognition; OCR; character segmentation; deep learning; CNN
目录
摘 要 I
Abstract II
目录 III
第一章 绪论 1
1.1 课题背景 1
1.2 研究现状 1
1.3 主要工作 2
1.4 总体结构 3
第二章 系统工作原理 4
2.1 系统总体工作流程 4
2.2 图像处理所用相关技术 4
2.2.1 图像灰度化 4
2.2.2 图像对比度增强 5
2.2.3 图像降噪 7
2.2.4 图像二值化 9
2.2.5 字符切割算法 11
2.3 字符识别 11
2.3.1 深度学习框架 12
2.3.2 卷积神经网络经典模型 12
第三章 身份证图片预处理 15
3.1 图像调整大小 15
3.2 图像灰度化 16
3.3 图像对比度增强 16
3.4 图像降噪 17
3.5 图像二值化 18
3.5.1 cv2.threshold()实现图像二值化 18
3.5.2 判断阈值是否合适 18
3.6 本章小结 20
第四章 身份证图片文本分割 21
4.1 文本行分割 21
4.1.1 去除人像部分 21
4.1.2 水平投影 21
4.2 文本块分割 23
4.2.1 垂直投影切分字符 23
4.2.2 字符组合成块 24
4.2.3 按字段提取文本块 25
4.3 单个字符提取 27
4.3.1 垂直投影 27
4.3.2 更改格式 27
4.3.3 字符识别 28
4.3.4 错误切分的汉字合并 28
4.4 统一字符大小 29
4.5 本章小结 30
第五章 深度学习网络模型训练 31
5.1 卷积神经网络介绍 31
5.2 数据集获取 31
5.2.1 生成字体图片 31
5.2.2 图像增强 32
5.2.3 训练集测试集随机划分 32
5.3 网络模型训练 33
5.4 字符识别 33
5.4.1 取出结果集 33
5.4.2 最终的识别 34
5.5 本章小结 35
第六章 系统展示 36
6.1 文件上传 36
6.2 结果输出 36
6.3 本章小结 37
第七章 总结展望 38
参考文献 39
致谢 41
绪论
1.1 课题背景
居民身份证是由政府颁发给个人的独一无二的证明,通常在许多场合中需要用到身份证上的信息进行检查登记,而靠人力读取身份证上的信息并输入到系统中十分耗时耗力。因此,基于图像处理与分析的印刷体汉字识别系统具有很高的使用价值和广泛的发展前景。身份证识别系统属于光学字符识别(OCR)技术的应用,更具体来说,是属于OCR领域中印刷体字符的识别,可以快速高效地识别出身份证上的文本信息。
身份证的识别需要先对身份证图片进行一些预处理操作,包括对文本块的提取,再从文本块数组中进一步提取出单个字符的图片,这是身份证图片处理中的关键步骤。考虑到实际情况中可能出现汉字字母字符同时出现的情况,不能依据只依据字符的宽度来判断左右结构的字符是否需要切分,而错误的切分会导致识别出来的字符变得难以理解。因此,字符分割也是身份证图片处理中的难点。
请支付后下载全文,论文总字数:17365字