基于卷积神经网络的印刷体数字识别文献综述
2020-04-14 17:14:36
1.1 研究目的及意义
印刷体数字识别 (PrintedNumeral Recognition)是光学字符识别技术 (OpticalCharacter Recognition, OCR)的一个分支,是在OCR基础上采用计算机等工具自动对印刷体阿拉伯数字进行辨别的一种技术,是文字识别的重要组成部分。
印刷体数字识别有极大的实用价值,它可以应用于身份证号码识别、汽车牌照识别、银行票据识别等各种印刷体编号的识别,涉及到交通、银行、教育和邮政等多个领域。它是字符识别的一个重要分支。在全球信息化全面发展和自动化程度提升的背景下,对印刷体数字识别技术的需求变得十分急迫,研究出精准且高效率的识别方式有重要的意义和价值。随着卷积神经网络对图像分类的研究兴起,给印刷体数字识别带来了无限的可能。卷积神经网络独特的二维数据处理方式和在分类识别时自动提取图像特征的特点,可以提高印刷体数字识别的泛化能力和准确度。
1.2 国内外研究现状1929年,德国科学家Tausheck最早提出了OCR的概念,并且获得了关于OCR的专利。然后在1933年,美国的Handel也提出了文字识别的想法并获得了专利。
50年代,美国从事密码分析处理工作的Shepard成功的实现了一台机器,解决了将打印好的资料转成机器可识别的语言的问题。随后Shepard成立了公司并发布了世界上第一个应用于商业的OCR系统。
60-70年代,面对字符识别的广泛需求和其能够获得的巨大的商业前景,各个国家都相继开始了对字符识别的研究。从研究初期的识别数字发展到英文,汉字等各类文字符号,甚至对不同文字的全识别。经过各国科学家和研究人员的努力,OCR识别精度不断提高,在日常生活学习中也得到了广泛的应用。
中国比较晚才开始研究发展OCR技术,在70年代才开始研究数字、英文字母及符号的识别,70年代末开始针对汉字识别的研究。但是,经过我国科研工作者的不断地努力,已经取得了很多的成果,很多研究单位都推出了自己的OCR产品。
目前,印刷体字符的识别算法可分为以下几类,分别是在背景中提取一些特征点进行匹配,待识别字符与标准模板互相匹配的算法,在模板中选取重要的特征与待识别字符的特征进行匹配的算法,神经网络的判别算法,数字结构特征识别方法等,每种辨别算法都有各自的优缺点以及实用场所。
数字识别在各个行业及方向都有应用,涉及领域十分广泛。例如:在电子出版物领域中完成信息标准化并将出版物的一系列信息进行关联,同时增加数字信息防伪和防盗版的功能;身份证编号识别:其识别精度高、速度快并且抗干扰性能非常好;船用设备管理:尤其是液晶显示的仪器仪表,缓解了人在实时观测报警系统中的工作压力,更准确地完成对重要表器仪表的实时监控,有效防止事故的发生;印刷质量的检测;自动监控系统在高辐射的磁控溅射设备中的应用:可以自动记录实验数据,并对实验数据进行存储和进一步识别进而实现远程监控,从而使磁控溅射仪能够自动记录数据减小实验仪器对人类的高辐射危害。{title}2. 研究的基本内容与方案
{title}本设计旨在研究卷积神经网络的基本结构和训练等理论,了解其应用背景及研究现状,使用TensorFlow深度学习框架,以实现印刷体数字(包括各种不同字体)的提取与识别方法的设计,达到95%以上的印刷体数字识别的准确率,并在此基础上探究相应的改进方法。
本设计实现对印刷体数字识别的总体流程如图一所示。通过数字图像处理的方法,实现对一般输入图像的处理,定位并提取出其中的印刷数字,送入训练好的神经网络进行识别,最终输出识别结果。其具体步骤为:印刷数字区域检测与定位、文字分割与文字提取、文字后处理。