名片识别系统的研究与设计文献综述
2020-04-28 20:31:16
1.1研究目的及意义
名片是人们用来方便联系的卡片,上面印有名片主人的姓名、公司名称、电话号码、地址等信息。随着社会信息化的不断发展和人们生活节奏的加快,名片对于销售、保险、金融等行业的从业人员显得尤为重要。在各类商务活动中,社交首先是从名片的交换开始的。但是,名片上的诸多信息想要输入至手机或者电脑进行管理却并非易事,通常都要由手工完成,效率低下且容易出错。因此,各类名片识别软件应运而生,为名片信息的高效存储提供了极大的便利。通过这些软件,对名片进行拍照扫描之后便可在短时间内完成联系人资料的录入、整理,在降低时间成本的同时,也让联系人的检索更加方便,甚至不用担心换了手机而联系人不同步的问题。
1.2 国内外研究现状
对名片进行识别,必须要涉及OCR(Optional Character Recognition)技术。OCR即为“光学字符识别”,是一种图像信息数字化的过程,其主要功能是将文本图像中的文字形象通过处理转换成计算机语言格式以便进一步信息处理。该技术可以帮助人们以低成本、快速度、高质量地将文档资料和各类纸介信息进行数字化,推进信息、资源的开发和利用,进一步方便人们的生活、学习和工作。
最早的OCR研究是在模式识别领域中开展的,其思想可以追溯到20世纪20年代。早在1929年,Taushek就在德国获得了一项有关的OCR专利。欧美国家为了将浩如烟海、与日俱增的大量报刊杂志、文件资料和单据报表等文字材料输入计算机进行信息处理,从20世纪50年代就开始了西文OCR技术的研究,以便代替人工键盘输入。到目前为止,西文OCR系统的研究及其相应技术日趋完善,特别是对印刷文字的OCR技术已经相当成熟,也涌现出相当多的优秀产品。
在国内, OCR技术的研究开始于20世纪八十年代。经过多年的发展,我国在这个领域已经取得一定的成就。特别是在印刷体汉字方面的识别方面,涌现出了汉王OCR、清华大学文通和尚书七号OCR等优秀的产品。目前国内OCR的发展主要分为两个方向,一是脱机手写汉字识别技术的研究和实用OCR系统的集成,二是具有实用背景的专用OCR系统的研制和开发,如车牌OCR系统、税票OCR系统及名片OCR系统等。
名片识别技术在移动终端上的发展却不尽人意,主要有以下原因:
(1)手机的图像采集系统有限,低端的手机甚至没有图像采集设备;
(2)手机的处理器处理速度比较慢,内存资源有限,一个信息量比较大的名片处理起来需要比较长的时间;
(3)OCR系统对于单一语种的识别效率较高,但对于名片中多语种混排的复杂信息的识别还存在困难,效果并不理想;
(4)仅仅得到识别结果是不够的,还必须经过信息提取将其存入对应的数据库中,才能满足人们对信息的查询、更新和管理需求。
{title}2. 研究的基本内容与方案
{title}一个完整的名片识别系统主要包括三个方面的内容,一是前期的预处理,完成名片图像的分割等;二是对处理后的结果进行识别,三是对识别的结果进行信息提取。