基于卷积神经网络的印刷体数字识别开题报告
2020-02-18 16:45:29
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
印刷体数字识别 (printednumeral recognition)是光学字符识别技术 (opticalcharacter recognition, ocr)的一个分支,是在ocr基础上采用计算机等工具自动对印刷体阿拉伯数字进行辨别的一种技术,是文字识别的重要组成部分。
印刷体数字识别有极大的实用价值,它可以应用于身份证号码识别、汽车牌照识别、银行票据识别等各种印刷体编号的识别,涉及到交通、银行、教育和邮政等多个领域。它是字符识别的一个重要分支。在全球信息化全面发展和自动化程度提升的背景下,对印刷体数字识别技术的需求变得十分急迫,研究出精准且高效率的识别方式有重要的意义和价值。随着卷积神经网络对图像分类的研究兴起,给印刷体数字识别带来了无限的可能。卷积神经网络独特的二维数据处理方式和在分类识别时自动提取图像特征的特点,可以提高印刷体数字识别的泛化能力和准确度。
2. 研究的基本内容与方案
本设计旨在研究卷积神经网络的基本结构和训练等理论,了解其应用背景及研究现状,使用tensorflow深度学习框架,以实现印刷体数字(包括各种不同字体)的提取与识别方法的设计,达到95%以上的印刷体数字识别的准确率,并在此基础上探究相应的改进方法。
本设计实现对印刷体数字识别的总体流程如图一所示。通过数字图像处理的方法,实现对一般输入图像的处理,定位并提取出其中的印刷数字,送入训练好的神经网络进行识别,最终输出识别结果。其具体步骤为:印刷数字区域检测与定位、文字分割与文字提取、文字后处理。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1] 郭丽丽, 丁世飞. 深度学习研究进展[j]. 计算机科学, 2015, 42(5):28-33.
[2] 董峻妃, 郑伯川, 杨泽静. 基于卷积神经网络的车牌字符识别[j]. 计算机应用, 2017(07):196-200.
[3] 杨冰,陈浩月,王小华,姚金良.基于卷积神经网络的中国绘画图像分类[j].软件导刊,2019,18(01):5-8.