名片识别系统的研究与设计毕业论文
2020-04-12 14:10:39
摘 要
近几年来,随着社会信息化的不断发展,各种各样的名片识别软件应运而生,为名片信息的高效存储提供了极大的便利。因此,对名片识别系统进行研究具有重要的理论意义和实际价值。
本文首先介绍了名片识别系统的研究背景及意义,简要分析其发展现状,并简述相关的图像处理基础知识;然后对名片识别系统的一系列步骤展开分析,分别是名片的预处理、名片定位、分割、字符识别。对名片进行识别,首先需要把采集到的彩色名片图像进行预处理,如灰度化、二值化、滤波等;其次还要进行文本定位,由于采集的名片图片是有背景的,需要运用相关的算法以及版面分析才能定位到文本部分;接着还要进行文本分割,即是运用投影法首先进行行分割,再对分割出来的文本行进行垂直投影得到单个字符;最后完成的是字符识别,本文用到的识别方法是模板匹配,运用模板匹配时需要把分割出来的字符的尺寸设置成统一值,这样才能保证字符被正确地识别出来。
MATLAB仿真实验结果表明,本文设计的名片识别系统实现了定位、分割以及识别等功能,达到了预期的目的。
关键词:定位;分割;识别
Abstract
In recent years, with the continuous development of social information, a variety of business card identification software has emerged, which has provided great convenience for the efficient storage of business card information. Therefore, research on the business card recognition system has important significance and practical application value.
This paper first introduces the research background and significance of the business card recognition system, briefly analyzes its development status, and briefly describes the relevant basic knowledge of the image. Then a series of steps of the business card recognition system are analyzed, namely, the business card preprocessing, business card positioning, segmentation, and character recognition. First of all need to preprocess the collected color business card pictures, such as graying, binary; business card positioning, because the collection of business card pictures is a background, we need to use algorithms and layout analysis to locate the text of the business card; That is, the projection method is used to perform line segmentation first, and then vertical projection of the segmented lines to obtain a single character. Character Recognition, the recognition method used in this paper is template matching, and it is necessary to set the size of the separated characters into a uniform value in order to ensure the correct recognition. In the fourth chapter, simulation results are shown and analyzed.
The MATLAB experiment results show that the card has achieved basic positioning, segmentation and recognition.
Keywords: positioning;segmentation;recognition
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 1
1.3 本文主要工作以及章节安排 2
第2章 相关基础理论知识 3
2.1 名片识别系统简介 3
2.2 关于图像处理的基础知识 3
2.2.1 数字图像处理的概念 3
2.2.2 图像的灰度化 4
2.2.3 图像的二值化 4
2.2.4 图像的增强 5
2.2.5 图像的分割 6
2.2.6 连通域 6
2.3 本章小结 7
第3章 系统设计 8
3.1 系统分析 8
3.2 总设计图 8
3.3 图片预处理及定位 9
3.3.1 边缘检测 10
3.3.2 倾斜校正 11
3.3.3 文本定位 13
3.4 文本的分割 13
3.4.1 行分割 14
3.4.2 字符切分 15
3.5 字符的识别 15
3.6 本章小结 16
第4章 系统实现 17
4.1 预处理及定位的实现 17
4.1.1 读取图像 17
4.1.2 灰度处理 18
4.1.3 中值滤波 19
4.1.4 边缘检测 19
4.1.5 去倾斜 22
4.1.6 完成名片文本区的初步定位 27
4.2 分割的实现 29
4.2.1 对名片文本区域的预处理 29
4.2.2 行分割 31
4.2.3 字符分割 31
4.3 字符识别 32
4.4 多组名片的测试及分析 33
4.4.1多组图像定位的测试 33
4.4.2 多组图像分割的测试 35
4.4.3 识别结果 37
4.5 本章小结 38
第5章 总结与展望 39
参考文献 40
致 谢 41
第1章 绪论
1.1 研究背景及意义
名片是人们用来方便联系的卡片,上面印有名片主人的姓名、公司名称、电话号码、地址等各种信息。以往,以人工的方式录入名片上的信息,工作非常繁琐,且速度非常慢。而随着科学技术的不断发展,我们可以利用计算机技术来处理名片上的信息,而不需要手工输入。名片识别系统,顾名思义,就是用来识别名片信息的系统。如今,已有许多名片识别系统投入应用。如关于名片的手机应用软件——名片全能王,商务工作者特别喜欢用这个软件;还有云脉名片识别、经纬名片通等。通过使用这些系统,我们可以一键识别名片上的信息。它们的出现为人们的生活、工作带来了无限的便利性。
现在的名片都是比较个性化的,人们为了突出自己的个性,设计出风格各异的名片,因此就需要名片识别系统紧跟上名片变化的步伐。在所获得的名片图片中,可能会存在背景影响、光照不均、名片倾斜等问题,因此关于这些问题的研究是必不可少的。
1.2 国内外研究现状
对名片进行识别,必须要提及OCR(Optional Character Recognition)技术[1]。OCR即为“光学字符识别”,是一种图像信息数字化的过程,其主要功能是将文本图像中的文字形象通过处理转换成计算机语言格式以便进一步进行信息处理,最终实现将图像信息转换成文本信息的目标[2]。该技术能够帮助人们将文档资料和各类纸介信息进行数字化,推动信息、资源的开发和利用,为人们的学习、生活、工作提供便利 。而名片识别系统正是利用光学字符切割和识别的原理,对名片进行识别。
最早的OCR研究是在模式识别领域中开展的,其思想可以追溯到20世纪二十年代。1929年,科学家Taushek在德国首次提出OCR概念,并获得了专利[3]。在OCR研究的初期,只能识别指定字体的数字、英文字母以及部分符号。到目前为止,西文OCR系统的研究及其相应技术日趋完善,特别是对印刷文字的OCR技术已经相当成熟,也涌现出相当多的优秀产品,如ABBYY Finerrader[4]。
在国内,OCR技术的研究开始于20世纪八十年代。汉王公司在1999年5月推出了首个中文名片识别与管理系统——汉王OCR。经过多年的发展,我国在该领域已经取得了一定的成就,特别是在印刷体汉字方面的识别。继汉王OCR之后,涌现出了许多优秀的名片识别产品,它们的识别功能也越来越强大,识别技术得到了发展,识别准确度也相应提高,并且支持多种语言识别,识别时间也大大减少,为人们提供了极大的便利。
1.3 本文主要工作以及章节安排
本文研究并设计名片识别系统,完成名片图像的预处理、文字的定位、分割和识别,并通过MATLAB进行仿真,检验设计结果是否符合预期。
本文的具体章节安排如下:
第一章,绪论,首先对名片识别的研究背景和意义、国内外现状进行简要介绍。然后说明本文的主要工作以及内容安排。
第二章,介绍名片识别系统的概念以及一些相关的数字图像处理知识。
第三章,介绍名片识别系统的设计,并详细分析各模块的算法。
第四章,用MATLAB进行仿真并分析结果,评价算法的优劣。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: