离线手写数字的识别毕业论文
2022-07-24 10:12:26
论文总字数:20966字
摘 要
随着金融市场化的快速发展,支票、发票等需要处理大量字符录入的票据增多。通过离线手写数字识别技术,实现信息的自动录入,在很大程度上利于解决存在于传统的人工处理方式中的问题,如成本高、工作量大以及效率低等。
本文实现了离线手写数字识别系统,主要包括图像获取、预处理、特征提取、识别这几个步骤。预处理主要做了二值化、字符分割以及倾斜校正,二值化的阈值由直方图获取,字符分割根据最小外接矩形分割,而倾斜校正是基于最小外接椭圆判别法确定倾斜角度,然后进行旋转校正;特征提取是纹理特征为主,端点及分叉点特征辅助;识别方法是模板匹配法,根据欧式距离矩求相似度,与模板相似度最高的为识别结果。
实验表明,本文实现的数字识别系统对质量中等的完整字符识别效果好,具有较高的识别率。
关键词:手写数字 特征 预处理 模板匹配
The Recognition of Offline Handwritten Digits
Abstract
With the rapid development of the financial market, checks, invoices, etc. need to deal with an increase in the number of character entry notes. By offline handwritten digital identification technology, automatic entry information exists largely help solve the traditional manual handling problems, such as high cost, low efficiency and workload.
This paper implements offline handwriting digits recognition system, including image acquisition, preprocessing, feature extraction, recognition these steps. Pretreatment mainly do two values, character segmentation and skew correction, binarization threshold segmentation method is adopted, character segmentation based on minimum bounding rectangle split, and tilt correction is based on the minimum bounding ellipse discrimination method to determine the tilt angle and rotation correction ; characteristic texture feature extraction is mainly characterized by secondary endpoint and bifurcation; identification method is template matching method, moment seeking similarity, the highest similarity with the template for the recognition results based on Euclidean distance.
Experiments show that the implementation of the digital identification system for medium-quality full character recognition is good, with high recognition rate.
Key Words: Handwritten digits; Feature; Pretreatment; Template Matching
目 录
摘要 I
Abstract II
第一章 绪论 1
1.1课题研究的目的和意义 1
1.2论文选题的国内外研究现状 1
1.3本文的主要工作和安排 2
第二章 离线手写数字的识别系统概述 4
2.1 离线手写数字的识别系统的基本构成 4
2.2 离线手写数字的识别系统的相关概念 4
2.2.1 图像采集 4
2.2.2 图像预处理 5
2.2.3 特征提取 5
2.2.4识别 5
2.3 本文的离线手写数字识别系统 5
2.4 本章小结 7
第三章 手写体数字图像的预处理 8
3.1 灰度化 8
3.2 二值化 8
3.2.1 二值化方法概述 8
3.2.2 本文的阈值的选取 8
3.2.3 二值化的实现 9
3.3 倾斜校正 10
3.3.1 倾斜校正方法概述 10
3.3.2本文的倾斜校正方法 10
3.3.3倾斜的实现 10
3.4 字符分割 11
3.5 本章小结 12
第四章 特征提取与识别 14
4.1 手写数字的特征及特征提取 14
4.2 本文选取的特征及特征提取 14
4.2.1 纹理特征及提取 14
4.2.2 端点、分叉点的提取 16
4.3 特征提取的实现 18
4.3.1 纹理特征提取的实现 18
4.3.2 端点、分叉点特征提取的实现 20
4.4 识别 22
4.4.1 手写数字特征识别方法 22
4.4.2 本文的方法 22
4.4.3 识别的实现 23
4.5 本章小结 23
第五章 结果与分析 24
5.1 实验环境 24
5.2 测试过程与结果 24
5.3 分析 27
第六章 总结与展望 29
6.1 总结 29
6.2 展望 29
参考文献 31
致谢 33
第一章 绪论
1.1课题研究的目的和意义
在计算机科学领域目前占据了重要地位的图像的识别和分类,在近几年快速发展已成为独立的学科。无论是在人工智能,军事目标识别,系统控制等领域,还是在经济和社会发展等,都被非常广泛的应用。图像识别是使用计算机来代替人来完成工作,实现了图像的分类和区别。
本次毕业设计,主要研究离线手写体数字的识别。其意义在于:在社会快速发展过程中,票据业务的增加,本课题研究的相关技术被广泛运用。如支票,发票等有很多这些字符需要注释输入处理,是非常依赖于数据信息的输入。打印时间长,不易于管理,因为管理手段落后,它需要大量的人力和物力,各种票据的整理和装订,归类各类票据及这些凭证的事后监督。
如果可以使用手写识别技术来解决数字信息输入的问题,信息自动输入,这是毫无疑问大大有利于解决人工处理方式的问题,如工作量大,效率低等等。
1.2国内外研究现状
通过电子计算机等设备能够正确的识别出手写的数字,这是手写数字识别的主要研究内容。在几十年里,研究人员利用基于统计特征的方法[1]、基于结构特征的方法[1]、基于神经网络的方法[2-3],解决了手写体数字的识别问题,取得的成果令人十分满意。
请支付后下载全文,论文总字数:20966字