登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 电子信息工程 > 正文

基于神经网络的手写英文识别系统毕业论文

 2021-03-21 22:41:21  

摘 要

在信息时代迅速发展的今天,大量重要的纸质档信息需要通过图像处理的方式用数字化的形式保存在计算机。目前存在有大量的英文文档信息需要处理。手写英文字符的识别系统能够很快地把这些繁琐的工作完成。因此,研究如何实现基于手写英文字母的识别系统具有很强的实用性。

本文设计的是基于神经网络的手写英文识别系统。该系统主要由图像处理、图像分割、图像归一化、BP网络的创建、训练和识别这几个部分组成。具体实现步骤如下:

首先手写输入图像,通过运用二值化处理和开闭运算处理图像。然后对图像进行分割处理。采用投影法分割,通过对每一行的像素点求和,再与图像的宽度作对比,判断行的开始和结束区域。在对每个区域的每一列像素点求和,与区域的高度做对比,判断列的开始和结束区域。把字母提取出并保存字符。

把分割好的字母保存到一个特定的文件夹里作为训练样本并为识别做准备。本文通过自定义归一化算法,对字母统一归一化处理为64×64像素的图像,使图像更利于识别。

提取输入样本的特征向量,然后输入训练样本对BP神经网络进行训练,训练完成后提取测试样本进行测试,最终得出测试结果。

通过大量的实验表明,本系统的正确率平均在85%以上,有时候可达到96%,说明本次设计具有较强的实用性和稳定性。

关键词:图像分割;投影法;BP神经网络;图像识别

Abstract

Today, in the rapid development of the information age, a large number of important paper file information needs to be digitally stored in the computer through image processing. There are a lot of English documents that need to be processed. Handwritten English character recognition system can quickly complete these cumbersome work. Therefore, it is very practical to study how to realize the recognition system based on handwritten English letters.

This paper designs a handwritten English recognition system based on neural network. The system mainly includes image processing, image segmentation, image normalization, BP network creation, training and recognition. Specific implementation steps are given as follows:

First, the image is input by handwriting, and the image is processed by using binarization and opening and closing operations, and then the image is divided. We are using the projection method of segmentation, by summing the pixels of each row, and then compared with the width of the image to determine the beginning and end of the line area. We sum up each column of pixels in each region, and compare the height of the region to determine the start and end regions of the column. Then we extract the characters and save the characters.

The letters are saved to a specific folder for training and recognition. In this paper, the normalized normalization algorithm is used to normalize the letters to 64×64 pixels, so that the image is more suitable for recognition.

The vector of the input samples is extracted, and then the training samples are trained on the BP neural network. After the training is completed, the test samples are extracted and tested. Finally, the test results are obtained.

Through a large number of experiments show that the accuracy of the system on average more than 85%, sometimes up to 96%, indicating that the design has a strong practicality and stability.

Keywords: image segmentation; Projection; The BP neural network; Image recognition

目录

第1章 绪论 1

1.1课题的背景及意义 1

1.2与课题相关的国内外的研究分析 1

1.2.1光学字符识别技术的现状 2

1.2.2人工神经网络的研究情况 2

1.3本文的主要内容安排 3

第2章 人工神经网络 4

2.1人工神经网络概述 4

2.2 BP神经网络原理 4

2.2.1 BP神经网络模型及其基本原理 4

2.2.2 BP网络的学习算法 5

2.3 本章小结 7

第3章 字符图像处理与分割 8

3.1字符图像预处理 8

3.1.1 开运算和闭运算 8

3.2 字符图像的分割 9

3.2.1 投影法分割概述 9

3.2.2 分割算法的实现 10

3.3 字母提取结果分析 11

3.4本章小结 12

第4章 手写英文字母识别 13

4.1图像的归一化 13

4.2基于神经网络的手写英文识别模型 14

4.2.1 BP网络的构建 14

4.2.2 网络的训练 15

4.2.3 网络的测试和识别 15

4.3 本章小结 17

第5章 系统的调试与实现 18

5.1系统的整体设计思路 18

5.2系统存在的问题即解决方法 18

5.3系统的程序实现 20

5.4本章小结 21

第6章 总结与展望 22

6.1总结 22

6.2 展望 22

文献参考 24

致谢 25

第1章 绪论

1.1课题的背景及意义

随着当今社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是我们平常生活工作所用到的文字信息。正因如此,文字信息快速输入计算机的要求就越来越迫切,急需一种能够快速将文字信息输入计算机的方法[8]。目前,能实现文字信息高速且自动输入的方法只能是光学字符识别技术[8]。字符识别(CR)在过去的半个世纪中得到了广泛的研究,并发展到足以产生技术驱动的应用程序的水平。现在,快速增长的计算能力支持了目前的CR方法的实现,并在许多新兴应用领域中有越来越多的需求,这些领域需要更高级的方法。书写,这是一种最自然的收集、储存和传播信息的方式,在过去的几个世纪里,它不仅为人类之间的交流提供了服务,而且也为人类和机器的交流提供了服务。在CR领域进行的深入研究不仅是因为它在模拟人类阅读方面的挑战,还因为它提供了诸如此类的有效应用。自动处理大量文件,将数据转换成机器,并将web界面转换为纸质文档。

很多理论性的东西都是慢慢发展到现实生活中的应用的,字符识别也是如此。由于目前存在许多实时数据都十分的复杂并且非常庞大,而现有的能未被受存储容量限制的计算机少之又少。正是由于以上的种种问题导致促使人们去解决,慢慢的由神经网络应用过渡到模式识别。模式识别不止满足于此,还将大力推进其实用性,手写体识别就是在发展中推进的一个重大产物。

字符识别能够在应用上得到广泛普及,得力于人工神经网络的迅速发展。神经网络中存在着各种各样的关系,比如说神经元间存在复杂的连接关系,而非线性方式由各神经元来传递信号的。而后输入和输出就产生了一定的客观的、确定性的或模糊的规律,用来描述那些无法精确的机理模型。这就是所谓的黑箱模型。

通过建立一款能够使计算机自动识别的手写英文母识别系统,可以大大减少通过人工手动录入的工作量。每个人的手写体都不一样,差异较大,通过识别系统识别出不同的手写英文,使文字信息能够更快的输入,使用起来更方便。

1.2与课题相关的国内外的研究分析

字符识别的历史可以追溯到1900年初,俄罗斯科学家tyuring试图发展视觉残疾人援助。第一个字符识别器出现在二十世纪四十年代中期随着数字计算机的发展。在早期机器打印的文本或一组杰出的手写文字或符号已经列入自动识别字符的工作范围。机器印刷CR系统在此期间通常使用模板匹配的图像进行比较的图像库。手写的文字,低层次的图像处理技术已经应用于二进制图像提取特征向量,然后美联储统计分类的水平。成功的,但受限的算法已经实现主要用于拉丁字符和数字。然而,一些研究在日本、中国、印度、斯拉夫语,希伯来语,希腊,在机器打印和手写的阿拉伯语字符和数字的案件也有发生。

研究一直到1980遭受强大的计算机硬件和数据采集设备缺乏。随着信息技术的爆炸,先前开发的方法,发现在许多应用领域快速增长的一个非常肥沃的环境,以及CR系统的开发。结构方法开始在许多系统中的统计方法。CR研究主要集中在形状识别技术,而无需使用任何语义信息。这导致了识别率的上限,这是不够的,在许多实际应用中。CR研究和发展在此期间的历史回顾可以分别发现在离线和上线的情况下。

直到1990年,CR系统的真正进步,使用新的开发工具和方法。在20世纪90年代初,经过图像处理和模式识别的有效地结合到人工智能(AI)方法。研究人员开发复杂的CR算法,它接收高分辨率的输入数据,并要求在实施阶段大量的数字运算。如今,除了更强大的计算机和更精确的电子设备,如扫描仪、照相机和平板电脑,我们有有效的方法,如神经网络(NNS),现代使用隐藏的马尔可夫模型(HMM),模糊推理和自然语言处理。最近系统的机器打印脱线和有限的词汇,用户依赖的联机手写字符是相当满意的限制应用。然而,为了使人类阅读的更加顺畅的机器模拟的最终愿望,仍然有很长的路要走,特别是对无约束的在线和离线手写。

1.2.1光学字符识别技术的现状

脱机识别和联机识别都是被输入设备下延伸的字符识别。之所以OCR有较容易识别的能力,是因为人们能够使用手写输入到计算机中,它就能通过数据来获取字体的基本情况。OCR能够通过正常的书写方式输入计算机中进行识别操作,相对于其他的识别方式更便捷,使用起来更广泛。任意一种能够采集图像的设备都能为OCR所使用,例如扫描仪、数字相机等是最常用的工具。采集设备采集到图像后,使用者经过处理相应的信息输入到计算机中,然后进行图像的识别。目前OCR还存在这一个比较严峻的问题,相对于联机识别能够获取字符中相对完整的信息,而它只是一幅简单的图像。

在1960年,为了解决英汉翻译的问题,脱机字符识别的研究开始研究。随着时代的发展字符识别的研究开始转向手写识别。慢慢的,越来越多的字符能够识别,不再成为书写的限制。人们开始不断地接受ORC,并开始进行学习和研究,逐渐成为科研人员研发的重点。

1.2.2人工神经网络的研究情况

一些没办法用传统方法解决的问题不仅能被人工神经网络作为工具去解决,而且还含有推理、联想等功能。在发展的日益壮大的今天,应社会的发展机会渐渐增多,它成为炙手可热的焦点。BP算法是Romelhart和Mc-clelland在1986年提出的。BP网络存在很多优点比如由于简单的结构、稳定的工作状态以及硬件易于实现等。不仅如此,特别是字符识别和分类、诊断故障、处理相应的图像、使预测优化、生成函数等,这些应用都使用很广。

随着不断进行的深入研究,人工神经网络在很多领域上已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。

1.3本文的主要内容安排

本文主要的研究内容包括手写英文图像的图像处理、图像分割、字母的提取、字母的识别这四个部分。根据所设计的思路,对图像进行处理分割,并进行保存,从而能创建一个训练库,为之后的字母识别做准备。以下是本文设计的手写英文识别系统的研究内容和章节安排:

  1. :简单的介绍了课题的背景以及目的和意义,介绍目前国内外的现状,并进行总结与概述,针对研究的内容提出相应的章节安排。
  2. :详细介绍了人工神经网络的原理,BP神经网络的原理及算法,对比了不同的算法得出适合本次设计的自适应学习算法来训练样本。
  3. :介绍了预处理中开运算和闭运算的算法,通过二值化和开闭运算进行图像处理。对处理后的图像进行分割,利用投影法把图像中的字母提取并保存,作为训练样本。
  4. :本章介绍了处理后图像的归一化,BP网络的建立以及各种参数的选取,并实现了网络的训练和测试。
  5. :本章主要介绍了系统的整体思路,指出了系统存在的一些问题,并提出了解决问题的方法,分析系统的实验结果。
  6. :对整篇文章进行总结概括,对今后的发展提出了建议。

人工神经网络

2.1人工神经网络概述

随着外界的刺激影响到生物的神经元,就会产生输出端传输响应的信息到另外的神经元中。一般情况下神经元的非线性关系式输入和输出。神经网络的处理信息的方式是模拟生物的神经网络方式。神经网络是模仿生物神经网络建立起来的,并且含有许多元件和不同的层次组织。不仅存在处理并行、分布式存储的能力,还有能够处理很多问题的功能。跟人的大脑一样能够自主学习、自主处理问题、适应不同的环境,是一个十分复杂的非线性网络系统。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图