利用卷积神经网络实现数字手写体图像识别开题报告
2021-12-27 21:04:50
全文总字数:1876字
1. 研究目的与意义及国内外研究现状
手写体数字识别是利用计算机等自动化设备自动识别手写体数字一种技术,在实际的生活当中,有着非常广泛的应用。另外,该方面的研究内容与成果同样为推广到字符识别、汉字识别以及其他模式识别领域提供参考和借鉴,在模式识别的案例中,手写数字识别是模式识别中的一个重要的研究课题,在当今信息化的社会有非常广阔的应用。但目前对各类字体的数字识别,特别是脱机手写数字识别仍然处在发展阶段,识别效果仍然不够理想。因此,手写体数字识别有着非常好的应用研究意义和一定的理论研究意义。
神经网络是一个非线性的动力系统,模拟人类人脑的神经元的结构与功能,可以在一定程度上模拟人类的思维,它可以实现其它设备所不具有信息分布式存储和并行地协同处理。所以利用神经网络实现数字手写体图像识别有很大的前景。
国内外研究现状
随着计算机技术尤其是计算机视觉技术的发展计算机应用到社会日常生活的方方面面,文字识别作为计算机视觉中的一个重要研究分支领域,在日常生活很多环境中有着广泛的应用。文字字符识别是集人工智能、模式识别、数字图像处理、组合数学等多个学科方面于一体的技术,是新的一代智能计算机接口的非常重要的组成部分。它即自动半自动地把文字字符等信息通过计算机智能的识别,用以代替人的手工输入。近若干年来,国内外的专家学者对各种字符进行了各种广泛深入的研究,提出了很多非常切实有效的各种识别算法。目前对各类字体的数字识别,特别是脱机手写数字识别仍然处在发展阶段,识别效果仍然不够理想。手写体数字识别在学科上属于模式识别和人工智能的范畴。多年的研究实践表明,对于完全没有限制的手写数字,由于不同手写习惯的数字体千差万别、风格迥异,且有的书写很不规范,目前还没有一种简单的方案能达到理想的识别率和识别精度。因此,我们所做的工作是努力使这项技术向着更为成熟、复杂、综合的方向发展。另一方面,研究工作者正努力把新的知识运用到预处理,特征提取,分类等技术当中,如神经网络、数学形态学等。
2. 研究的基本内容
利用Caffe软件包对MNIST数据库上的数字手写体图像识别,需要了解神经网络工作原理,熟练掌握Caffe软件的使用,并研究如何编写一个界面用以读入数字图片并进行处理判别。学习如何训练数据,能较为准确的识别MNIST数据库中的图像。
3. 实施方案、进度安排及预期效果
准备近期阅读并试验5篇相关论文中识别手写数字的方式,了解识别原理,并了解掌握神经网络的训练过程,以及神经网络学习算法模型。
3月份去图书馆借《21天实战caffe》,将caffe软件熟练掌握,并构思如何利用caffe软件识别数字手写体图像,如何训练,实现后再准备编写一个界面可以读入数字手写体图像,将图像处理识别后,输出识别结果。
预期能做出一个界面,可以读入数字手写体图像,并能准确输出识别结果,并能将准确率提高至92%以上。
4. 参考文献
1. 肖锋,强晓安. 《基于神经网络的手写体数字识别关键技术研究》
2. 陈浩翔,蔡建明,刘铿然,林秋爽,张文玲,周 涛. 《手写数字深度特征学习与识别》
3. 吕蓉.《基于手写体数字识别的信息录入与处理系统》