基于神经网络的手写汉字软件系统设计文献综述
2020-04-10 16:30:17
文 献 综 述
1、概述
基于神经网络的手写汉字软件系统是近些年提出的新方法,相比较于传统技术,它具有速度较快,分类能力强,具有良好的容错能力、并行处理能力和自学习能力。其目的就是力图通过对人脑功能和结构的模拟来实现字符的高效识别[3] 。
人工神经网络是一门新兴的交叉学科,它继承了生物神经网络特征的一部分,简化的模拟了生物神经网络的工作过程。简单的说,人工神经网络是一个并行的分布处理结构,它由处理单元(即人工神经元)及其称为联接的无向讯号通道组成[1]。这些处理单元具有局部内存,并完成局部操作。每个处理单元有一个单一的输出联接,这个输出可以根据需要被分支成希望个数的许多并行联接,且这些并行联接都输出相同的信号,即相应处理单元的信号,信号的大小不因分支的多少而变化。它处理信息的方式完全不同于以往的符号逻辑系统,具有一些独特的性质:如信息的分布式存储和并行处理、信息存储与处理的合一、具有自组织、自学习能力,它已经被广泛应用于模式识别、信号处理、知识工程、专家系统、优化组合、智能控制等各个方面[2]。
手写汉字体识别是模式识别和人工智能领域中的重要研究内容,在人际自然交互和文字信息自动处理等领域有着广泛的应用。目前,在完全自由书写的手写体汉字识别上海存在困难。统计-结构方法是解决这一难题的新途径[4]。手体汉字识别指用机器自动辨认人们手写的汉字,分为联机和脱机两种。其中联机手写体汉字识别是在人们手写汉字的过程中进行实时的识别(主要是用手写板作为手写工具);脱机手写体汉字识别则是对于已经处于图像形态的手写体汉字进行识别,没有利用图像信息的时序信息[5]。)从理论上讲,汉字手写体较之其他文字的识别更难,这是汉字本身的一些特点造成的:1)结构复杂,2)规模庞大,3)相似模式较多,4)汉字字体众多,5)有时会存在连笔或者断笔甚至多余笔画的情况[4]。
2、研究方法和内容
目前使用的手写汉字字体有很多种,字体本身具有灵活性、多变性等特点,这样就增加了手写汉字字体的苦难。文字信息和数据信息包含了阿拉伯数字及少量特殊符号组成的各种编号和统计数据。进而说明很难有那种识别器能够达到如此完美的境界。在过去的几十年中,科研者使用了很多的方法,但是主流的方法有一下两种:基于结构特征的方法和基于统计特征的方法[6]。字字符识别属于模式识别的范畴,但又是一个具体问题,它除了要求识别精度高和工作可靠外,还要求其识别效率高,识别速度快。这就需要精确的建立数学模型。由于数字识别难于建立精确的数学模型,而神经网络所具有的自学习,自组织能力使我们能在与外部世界的交互作用下,实现无法用当前的计算理论表达清楚的功能。因此,神经网络有着独特的优势[7]。
目前研究的神经网络字符识别系统可划分为两大类:第一类系统实际上是传统方法与神经网络技术的结合。这类系统分为两块,第一块主要完成样本模式预处理和字符特征抽取任务;第二块是前面获得的模式特征来训练神经网络分类器,从而达到识别字符的目的。这类系统充分利用了人的经验来获取模式特征以及神经网络杰出分类能力来识别字符,是人们通常采用的方法。第二类系统省去了特征抽取工作,整个字符直接作为神经网络的输入。这类系统的神经网络结构的复杂度大大增加了,首先输入模式维数的增加导致网络规模的庞大,使得网络的训练、学习非常困难;此外神经网络结构上要消除模式变形的影响。通常这类网络都采用局部连接的方式减少网络的复杂度,并采用共享连接权的策略增强网络抗变形(输入模式)的能力[ 9]
神经网络可以笼统的分为四大类:功能上:连续型与离散型、确定性和随机型、静态与动态神经网络;连接方式:前馈型和反馈型;逼近特性:全局逼近型和局部逼近型;学习方式:监督学习、无监督学习和强化学习神经网络[10]。
神经网络在手写数字识别方面的应用多采用多层前馈神经网络,其学习算法主要依靠反向传播算法(Back Propagation A1gorithm, BP算法) [1,15,16],BP算法是目前应用最为普遍的一种神经网络训练学习方法。但采用BP算法对网络训练时存在一些缺点,因此,有人提出将遗传算法与前馈网络结合起来。下面是对这两种算法的简单介绍: