名片识别系统的研究与设计开题报告
2020-04-11 17:50:21
1. 研究目的与意义(文献综述)
1.1研究目的及意义
名片是人们用来方便联系的卡片,上面印有名片主人的姓名、公司名称、电话号码、地址等信息。随着社会信息化的不断发展和人们生活节奏的加快,名片对于销售、保险、金融等行业的从业人员显得尤为重要。在各类商务活动中,社交首先是从名片的交换开始的。但是,名片上的诸多信息想要输入至手机或者电脑进行管理却并非易事,通常都要由手工完成,效率低下且容易出错。因此,各类名片识别软件应运而生,为名片信息的高效存储提供了极大的便利。通过这些软件,对名片进行拍照扫描之后便可在短时间内完成联系人资料的录入、整理,在降低时间成本的同时,也让联系人的检索更加方便,甚至不用担心换了手机而联系人不同步的问题。
1.2 国内外研究现状
对名片进行识别,必须要涉及ocr(optional character recognition)技术。ocr即为“光学字符识别”,是一种图像信息数字化的过程,其主要功能是将文本图像中的文字形象通过处理转换成计算机语言格式以便进一步信息处理。该技术可以帮助人们以低成本、快速度、高质量地将文档资料和各类纸介信息进行数字化,推进信息、资源的开发和利用,进一步方便人们的生活、学习和工作。
最早的ocr研究是在模式识别领域中开展的,其思想可以追溯到20世纪20年代。早在1929年,taushek就在德国获得了一项有关的ocr专利。欧美国家为了将浩如烟海、与日俱增的大量报刊杂志、文件资料和单据报表等文字材料输入计算机进行信息处理,从20世纪50年代就开始了西文ocr技术的研究,以便代替人工键盘输入。到目前为止,西文ocr系统的研究及其相应技术日趋完善,特别是对印刷文字的ocr技术已经相当成熟,也涌现出相当多的优秀产品。
2. 研究的基本内容与方案
一个完整的名片识别系统主要包括三个方面的内容,一是前期的预处理,完成名片图像的分割等;二是对处理后的结果进行识别,三是对识别的结果进行信息提取。
本次毕业设计将研究、设计一个名片识别系统,完成名片上文字的分割、文字/文本定位和识别,并测试结果。其中,字符分割即将定位的文本块分割成单个字符,按照字符分割的方法一般分为三类:基于图像特征的分割、基于识别的分割和基于整体的分割。文字定位则根据图片中文字的几何特征、颜色、运动特征、边缘等信息;文本定位也可以分为三类:基于连通域的定位方法、基于边缘的定位方法和基于纹理的定位方法。在字符识别过程中,应首先使设备学习、记忆将要辨别字符的特征,使这些特征成为识别系统自身的知识,然后再利用这些先验知识对输入图像进行判决,得到字符图像的识别结果。字符的特征不仅仅局限于平面上的点阵位置信息,在频率空间、投影空间,甚至在语义空间上都有各自的特征。这些特征在识别字符时又有各自的特点及优势。
本次毕业设计首先要采集名片图像;然后就是实现文字/文本定位,将采取去歪斜的办法以求达到效果;接着对其进行分割(行分割),之后再进行一次分割,分割出字符;最后就是字符的识别,计划参考ocr字符识别的一些方法进行设计。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1]白嘉盈. 基于android手机的名片文字定位与分割[d].西安电子科技大学,2013
[2]张巍.基于android平台的名片扫描识别系统的设计与实现[d].吉林大学,2015.
[3]刚亚州.基于android的名片识别研究与实现[d].南京航空航天大学,2013.