基于BP神经网络的数字识别系统设计文献综述
2020-05-14 22:33:33
文 献 综 述
数字识别的用途广泛,前景广阔,不仅可以用于表格、电话号码、车牌、成绩单等多个项目,更是在交通、银行、教育和邮政等领域发挥了巨大作用。还可以对现有的老旧设备进行智能改造,加入数字识别的功能,大大提高工作效率。实现数字的快速自动识别为人们提供了很大的方便。
在信息化时代的今天,有大量的数据、信息的传递是通过图片进行的,然而计算机并不能直接用图片中的数据来进行处理、统计,人工处理需要花费大量的时间与精力,但是通过数字识别系统,可以快速准确的将图片中的数据转为文本输出,节约时间与成本,提高工作效率,应用非常广泛。
下面就相关技术作简要介绍:
数字识别系统主要分为两个部分,一个是负责对处理对象进行采集和修改的图像采集部分,另一个这是负责智能识别的BP人工神经网络部分。
一、图片采集
顾名思义,将图片中需要识别的数字提取出来,便于后面步骤的识别。但是图片中会有大量不确定因素来干扰采集、识别,如数字的字体、倾斜与颜色,背景的颜色、图案以及一些毫无意义的色素干扰点。因此在采集、识别前,要经过大量的处理与修改。如何将需要识别的部分提取出来,并将提取出来的部分处理成可识别的图片,已是当前研究热点之一,国内外各大公司和研究机构为此做出了大量的工作。如何有效地去除其中的干扰,对待识别的数字后续处理及应用都至关重要。对于不同的干扰需要进行不同的处理方式,例如二值化可以解决颜色的问题,利用梯度锐化、斜率矫正等技术可以解决倾斜的问题。为了得到可以快速进行识别的图片,需要原图片在经过多道程序消除种种干扰因素,并将需要识别的数字提取出来之后,才能把它们送到BP人工神经网络。
二、构建BP人工神经网络
BP神经网络(BP neural network),是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。
由于在各种不同的字体中,阿拉伯数字或多或少都有一些细小的不同,如果采用传统的模板匹配的方法进行识别则需要大量模板并且识别的速度必然有所影响。而采用BP神经的优势在于BP神经网络是一种高度非线性关系的映射。在没有任何已知的数学知识描述输入与输出关系的情况下, BP神经网络可以通过对训练样本的自学习、自适应建立这种映射关系, 从而较好地反映系统内部的本质特征, 对未知样本做出的评价更具有客观性。学习成功后的BP神经拥有非常强的自主性与适应性,对任意的数字样本, 只需利用训练过的BP神经网络模型对其进行计算与联想, 均可以根据样本的输出结果作出综合的识别,大大提高识别的准确率与速度。所以BP神经在识别领域具有广泛的适用性。
BP神经网络在实际应用中,主要分学习训练和模式识别决策两个过程。