基于卷积神经网络的手写数字识别算法研究文献综述
2020-04-23 19:54:26
1.1研究目的
人类的视觉系统有着庞杂的体系,在我们的大脑的左右半球中,都拥有主视觉皮层,只单单一层就包含了1.4亿个神经元,它们之间有着极其复杂的联系,因此,依靠这个复杂的视觉系统,在人类的视觉世界中,我们中的大多人可以轻易准确地识别出手写数字,相反,当我们试图编程使机器模仿人的视觉去识别这些手写数字时,我们才意识到我们的视觉系统解决的是一件多么复杂的事情。人类可以根据“数字8大致由两个上下封闭的圆形”迅速而简单的识别出数字8,而我们试图制定精确的规则时却发现不是那么容易,因为人的笔迹及书写习惯可能导致数字书写不是那么规范,比如我们在书写时常常会出现数字8上面的那个圆不是完全封闭的情况,这使得我们很快陷入了各种例外的泥潭之中,使得事情变得复杂。
因此本次毕业设计的目的是学习Python和神经卷积相关算法,建立一个可以自动识别手写数字的系统,神经网络可以根据已有的例子自动推断识别手写数字的规则,通过增加训练图片的数目,进一步提高识别的准确率。
1.2国内外研究现状分析
目前,国内外研究者们提出了许多识别方法,按使用的特征不同,这些方法可以分为两类:基于结构特征的方法和基于统计特征的方法。统计特征通常包括点密度的测量、矩、特征区域等;结构特征通常包括圆、端点、交叉点、笔划、轮廓等。
目前国内外对手写数字识别的研究主要存在两大难点:
1)识别精度需要达到更高的水平。手写数字识别与文字识别不同,没有上下文联系,每个数字都是独立的,而且数字识别经常涉及金融、财会、快递等领域,数字代表的意义差一字而远千里。因此,当前国内外许多研究者致力于提高识别准确率。
2)识别的速度需要达到更高的水平。数字识别的输入通常是大量数据,需要较高的数字识别速度与之匹配,而高精度与高速度是相互矛盾的,因此,当前国内外许多研究者致力于提高识别速度同时保证准确率。
一些新的理论例如基于BP神经网络、基于Hopfield 神经网络、小波技术以及支持向量机的研究应用于建立手写数字识别系统平台,并在国内外服务数据库中取得了很好的测试结果。进行该方面研究一方面有利于银行等部门更好地进行手写数字数别,降低金融活动的风险;另一方面,手写数字识别的研究将有助于模式识别、机器理解、机器人技术的发展,对今后研究如何更好地进行人机交互,使计算机具有和人一样的能力有很大的理论价值。随着国家信息化进程的加速,手写数字识别的应用需求将越来越广泛。