手写汉字几何结构特征提取算法与实现毕业论文
2021-04-21 22:31:56
摘 要
随着模式识别技术的快速发展,手写体汉字鉴别和手写汉字识别的研究已经备受人们的重视。和其他文字识别技术相比,手写汉字汉字有着其自身的特点,手写汉字的字符种类多,其字形也比较复杂,还存在着不同书写人书写风格各异的问题。为了使得不同应用情况下的需求得到满足,更加深入的研究手写体汉字鉴别和字符识别是有着实际意义和广泛的应用价值。
本文研究的主要内容针对离线手写汉字识别或笔迹鉴别需要,能初步实现手写汉字的几何结构特征提取算法。离线手写汉字鉴别及识别技术一般经历图像预处理、手写汉字特征提取和手写汉字分类器设计这三个步骤。在预处理阶段,本文采用OTSU(最大类间方差法)来对手写体汉字图像进行二值化处理,然后在图像去噪时使用中值滤波对手写体汉字进行处理,之后进行轮廓提取操作。在特征提取阶段,本文选择了基于轮廓方向特征的离线手写体汉字特征提取方法,在分类器设计阶段,对特征向量的相似度本文利用了加权的距离度量来处理。
最后采用HIT-MW库手写汉字图像做了手写体汉字鉴别及识别实验,和其他结构特征相比,实验结果验证了本文方法的有效性,在实验中取得到了优秀鉴别效果。
关键词:手写识别;汉字;结构特征提取
Abstract
With the rapid development of pattern recognition technology, more and more attention has been paid to the study of handwriting Chinese character handwriting identification and character recognition. Chinese characters have their own characteristics: there are many types of characters, and the characters are complex. However, handwritten characters have different writing styles. In order to meet the needs of the application, it has extensive application value to deeply study the handwriting recognition and character recognition of handwritten Chinese characters.
The main content of this paper is aimed at the need of off-line handwritten Chinese character recognition or handwriting identification, and can initially realize the geometric structure feature extraction algorithm of handwritten Chinese characters. Off-line handwritten Chinese character identification and recognition techniques generally include three modules: image preprocessing, feature extraction, and classifier design. In the preprocessing stage, the grayscale image is binarized using the OTSU threshold method, then the binarized image is denoised and then the contour is extracted. In the feature extraction phase, this paper selects an off-line handwritten Chinese character extraction method based on the contour direction feature. In the classifier module, the weighted distance metric is used to calculate the similarity of the feature vector.
Finally, the system is tested on a handwriting database of HIT-MW database,Compared with other structural features, the experimental results verify the effectiveness of the proposed method. In the experiment, we achieved excellent identification results.
Key Words:Handwriting recognition;Chinese characters;Structural feature extraction
目录
第1章 绪论 1
1.1 研究的背景及意义 1
1.2 国内外研究现状 1
1.3 主要研究内容及文本安排 3
第2章 手写体汉字的预处理 5
2.1 图像的灰度化及二值化 5
2.1.1 手写汉字图像灰度化 5
2.1.2 手写汉字图像二值化 6
2.2 手写汉字图像去噪 7
2.3 手写汉字图像轮廓提取 9
第3章 手写体汉字特征提取 13
3.1 特征提取分类 13
3.2 网格微结构特征 14
3.3 轮廓方向结构特征 15
第4章 分类器设计及实验 17
4.1 基于距离度量的最近邻分类 18
4.2 加权距离公式 19
4.3 实验 20
4.3.1 分类器实验 20
4.3.2 特征提取实验 20
4.3.3 实验结果分析 21
第5章 总结与展望 22
5.1 总结 22
5.2 展望 22
参考文献 23
致 谢 24
第1章 绪论
1.1 研究的背景及意义
伴随着各种模式识别技术的快速发展,手写汉字识别及鉴别技术在许多领域有着广泛的应用场景。例如,在财务和办公自动化领域,作为用户的身份识别,手写签名已经被广泛使用,而且公司之间签署的协议、正式文件、银行支票等,都要求当事人签字才能生效。特别是在银行里,每天都要确认大量签名支票的真实性。高效的手写汉字识别将简化过程,提高效率。
如下图1.1为手写汉字识别及鉴别的应用场景图: