基于卷积神经网络的手写数字体识别方法研究毕业论文
2020-02-14 18:12:06
摘 要
手写体数字识别在中文自动化处理和智能输入等方面有着广泛的应用前景,但由于手写体数字具有类别多、结构复杂、相似字多、字形的多样化等特点,使得手写体数字识别成为相关研究领域中的一个难点与热点。本文主要离线和在线的孤立手写体数字样本为研究对象,在对前人的工作进行了认真的学习和总结基础上,做了大量的实验研究,采用深度学习技术进行手写体数字识别,并得出了一些有用的结论。论文的主要研究内容如下;首先,本文采用卷积神经网络对孤立手写体数字进行识别,通过一系列对比实验,分析了卷积神经网络在数字识别任务中的性能,验证了其在手写数字识别领域的可行性。实验表明,得益于卷积网络强大的特征表达能力,我们能够用非常复杂的深度网络结构对手写体没字进行建模,同时,其"端到端"的特性也简化了数字识别的流程。其次,本文对传统的手写体数字预处理和卷积神经网络方法做了深入的研究,通过人工进行特征提取(方向梯度特征,方向线素特征等),然后再利用卷积网络进行特征学习,获得了比直接使用没字样本更好的识别率,验证了传统的特征提取方法与卷积神经网络相结合能产生更好的识别效果。再次,针对数字类别过多所导致的网络参数不易收敛、训练速度慢等问题,本文采用了基于迁移学习的监督式预训练方案。通过预先对小字符集(例如,手写数字库MNIST)进行网络训练,以获取一个初始化参数,并在此基础上进行大字符集的手写数字网络训练。实验证明,该种方法能够使卷积网络的参数迅速收敛,同时保证识别率不出现大的浮动。
最后,使用经典LeNet-5模型,对模型及网络训练过程进行分析,推导网络模型训练过程中涉及到的前向和反向传播算法.将模型在MNIST数据集上进行实验,分析卷积层不同卷积核数量及大小、每批数量、网络学习率等参数对识别性能的影响。
关键词:数字手写体识别;卷积神经网络;LeNet-5模型;MNIST数据集
Abstract
Handwritten numeral recognition has a wide application prospect in Chinese automatic processing and intelligent input. However, handwritten numeral recognition has become a difficult and hot point in the related research field due to its characteristics of multiple categories, complex structure, similar characters and diverse glyphs. In this paper, the main W offline and online isolated handwritten digital samples for the research object, on the basis of careful study and summary of the previous work, do a lot of experimental research, the use of deep learning technology for handwritten digital recognition, and draw some useful conclusions. The main contents of this thesis are as follows: First of all, this paper USES convolutional neural network to recognize isolated handwritten digits. Through a series of comparative experiments, the performance of the convolutional neural network in the digital recognition task is analyzed, and its feasibility in the handwritten digits recognition field is verified. The experiment shows that thanks to the powerful feature expression ability of convolutional network, we can use very complex deep network structure to model handwritten Chinese characters. Secondly, in this paper, the traditional handwriting digital preprocessing and feature extraction method to do a thorough research, through the artificial feature extraction (direction gradient feature, directional line element features, etc.), and then using convolution learning network characteristics, obtained better than directly use no words the recognition rate of the traditional feature extraction method was verified with convolution combined neural network can produce better identification effect. Thirdly, aiming at the problems caused by too many digital categories, such as the difficulty in convergence of network parameters and slow training speed, this paper adopts the supervised pre-training scheme based on transfer learning. Network training of small character sets (for example, handwritten digital library MNIST) is carried out in advance to obtain a relatively stretch initialization parameter, and on this basis, handwritten narrow word network training of large character sets is carried out. Experimental results show that this method can make the parameters of our network converge rapidly and the recognition rate does not fluctuate greatly.
Finally, the use of classical LeNet - 5 model, analyze the model and the network training process, training involved in the process of network model derived from the forward and back propagation algorithm. The model experiment on the MNIST data set, layer analysis of the convolution convolution kernel number and different parameters such as size, quantity of each batch, learning-ratio affect the recognition performance.
Key words: Digital handwriting recognition; Convolutional neural network; LeNet - 5 model; The MNIST data set.
目 录
摘 要 I
Abstract II
第1章 绪 论 1
1.1 课题研究背景与意义 1
1.2 研究现状 1
1.2 课题研究内容 2
第2章 需求分析设计 3
2.1 功能性需求 3
2.2 非功能性需求 3
2.3 设计约束 4
第3章 具体方法设计 5
3.1读取数据 5
3.2归一化 5
第4章 基于卷积神经网络的数字手写体识别 6
4.1 卷积神经网络 6
4.1.1 卷积神经网络的基本原理 6
4.1.2 卷积 6
4.1.3 池化 7
4.2 卷积神经网络算法 8
4.2.1 向前传播阶段 8
4.2.2 向后传播阶段 11
4.3 LeNet-5模型介绍 11
4.4 数字手写体识别流程 13
4.5 MNIST数据集简介 14
4.6 卷积神经网络在MNIST数据集中的应用 14
第5章 系统实现 16
5.1系统实现概述 16
5.2显示图片展示界面 16
5.3 归一化实现展示界面 16
5.4 LeNet-5实现展示界面 17
5.5 配置模型 18
5.6 程序运行实现展示界面 18
5.7 输出正确率 19
5.8 画图实现展示界面 19
5.9对比实验 20
5.9.1每批数量的对比实验 20
5.9.2卷积核数量的对比实验 22
5.9.3卷积核大小的对比实验 24
第6章 结论与展望 26
参考文献 27
致 谢 29
第1章 绪 论
课题研究背景与意义
神经网络是从生物学发展到计算机学科的一门交叉研究领域。因为他具有并行处理、分布式信息处理和学习能力,从而被应用到许多领域中。
如今,随着科学技术的进步,生活也越来越智能化,数字手写体的识别在人们的平常生活中的应用也更加广泛,例如在快递分拣、金融等有关数字识别的领域中都有较多的应用,这也使得越来越多的人投入到手写数字体的识别研究中。
手写数字体的识别是利用机械或是计算机自动识别手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。该技术随着全球信息化的快速发展和对自动化程度要求的不断变高,手写数字体识别的应用需求急切,因此,研究一种准确又高效的识别方法有着深刻的意义。[18]
而手写数字体的识别正是应用卷积神经网络的特性实现的。首先应用卷积神经网络进行图像的识别,从而延伸到对手写数字体的识别。而手写数字体因为并非完全的标准数字体,会有各种人为的因素干预其中,对其造成影响。所以如何解决人为因素的影响,从而正确的识别出数字便是主要的目的。这使得即使是同一个数字,在识别时也会遇到巨大的困难。因此,人们选择了通过神经网络(即CNN)来解决这一问题,因为它的容错性好,分类的能力强,而且还具有自我学习的特性。
1.2 研究现状
自2001年初以来,卷积神经网络在图像和区域的检测和识别方面取得了巨大的成功。这些都是图像数据相对丰富的任务,如交通标志识别、生物图像的分割尤其是连接组学、自然图像中的面部、文字、客流和人体的检测。卷积神经网络最近的一个重大实际成功是人脸识别。[12]
近年来,而在手写数字体的识别中,国内外的学者对数字的识别技术的每个环节做了广泛而深入的研究,将当前的数字识别工作分为两种识别方式,分别为联机和脱机识别。联机识别是指将写的字通过传感器上传到电脑等设备进行识别,如今研究已经比较成熟,而脱机识别是指通过手写的阿拉伯数字的图片样式进行识别,经过多年的研究,人们提出了许多的鉴别方法,按照使用的特征不同,大致可以分为两类,一类为基于结构特征的鉴别方法,另一种为基于统计特征的鉴别方法。
课题研究内容
本课题主要是在数据集上进行分析实验,通过改变不同的参数,看对手写数字体识别的性能影响。通过LeNet-5模型改进,之后在这个改进的模型基础上进行向前和反向的传播算法,再进行分析实验。
这个课题的基础是改进LeNet-5的模型,在池化层、全连接层以及输出层等进行数据的调整以达到目的。而在训练时,要对网络中的所有权重和偏置随机初始化,使模型能正常地进行后续的迭代训练。然后是多次前向传播和反向传播过程的迭代,每进行一次该过程都会将上一次迭代生成的权重和偏置全部刷新。在完成设置次数的迭代训练后,将最终生成的各层权重和偏置保存到数据文件中,以便在实时的数字识别中省去长时间的训练过程,达到识别目标的准确性、稳定性和快速性。[8]
第2章 需求分析设计
主要的内容为卷积神经网络的手写数字体识别,需要使用到经典的Lenet-5的模型来实现。因为需要学习python语言来理解相关的代码,同时对Lenet-5的经典模型有一定的理解,通过上网查阅资料以及老师提供的文献进一步的学习。同时另外需要的就是MNIST手写数字体的数据集,这个数据集很经典很简单,里边有大量的手写数字体的样本文件来进行实验。
2.1 功能性需求
要实现卷积神经网络对手写数字体的识别,能体现出这个具体过程,而且能给出结论。这个手写体识别是从提取mnist数据集开始的,然后输出载入了多少个样本以及他们的尺寸大小。最后输出的内容包括最主要的acc(正确率)以及loss(丢失率),还有就是逐渐通过训练产生的变化要有具体的体现。最后输出的内容包括训练集和测试集的准确率和错误率,test_acc、test_loss、train_acc和train_loss这四项数据是展示出来的,通过50次的迭代学习得出的最高准确率的数据呈现出来。最后就是可视化的界面,把这四项数据通过曲线的方式展示出来,观察现象。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: