英文字母的识别毕业论文
2022-06-06 22:34:46
论文总字数:27868字
摘 要
英语在当今世界中有着极其广泛的应用,对英文字母的识别自然成为字符识别的一个重要部分,又因为识别的种类比较少,这使得深入分析并验证一些新出现的理论和方法更加方便,所以字母的识别很容易推广到各个相关领域,比如车牌号码识别、票据识别、船舶箱体识别等,具有非常广阔的应用场景,有较大的研究价值和意义。
字符识别的步骤主要有图像预处理、图像增强、图像定位分割、图像的识别,本文对预处理、定位分割和识别部分进行了较为深入的研究,在此基础上基本实现了一个识别率较高的大写英文字母识别系统。预处理部分本文进行的工作主要有彩色图像灰度化、灰度图像二值化、图像的定位与分割。二值化这里着重讨论了全局阈值法以及局部阈值法几种阈值选取方法。图像的定位部分对图像进行了膨胀腐蚀处理,最大的连通区域即为字符区域,并据此进行字符分割。特征提取部分将字母分成5*7的子图,统计每一块子图的灰度值,形成1*35的特征向量;字符识别部分,针对本课题字母图像的特点,本文构建了特征向量与模板特征向量作比较,当距离最小时则将该模版字符作为当前字符的识别结果。
实验表明,本文的方法能在较短时间内有效地识别大写英文字母。
关键词:预处理 大写英文字母 定位与分割 识别
Recognition of the English Letters
Abstract
Because of the wide application of English in the present world, the recognition of English letters is becoming an indispensable part of the Character Recognition. At the same time because the types of recognition is little, which makes it more convenient for us to analyze and verify some emerging theories and methods deeply. In addition, English letters are everywhere in our daily life, so the letter recognition is easy to be promoted to a number of related fields, such as automobile license plate recognition, ship box number identification and notes recognition, which have a wide range of application scenarios as well as strong research value and significance.
The main steps of character recognition include image preprocessing, image enhancement, image positioning segmentation and image recognition. We have carried out an in-depth study on preprocessing, character segmentation and recognition. On the basis of this, a capital letter recognition system is implemented. The main part of the paper includes the grey scale of color image, gray image binarization, image positioning and segmentation. Several threshold methods including global threshold method and local threshold method are mainly discussed in the part of binarization. The image is processed by the expansion and corrosion in the positioning part of the image, the largest connected region is the character region which is the fundation of how the characters are segmented. The feature extraction section divides each letter into 5*7 subgraghs.Then each subgragh is counted to form the gray value into 1*35 feature vector. Basic principle of the character recognition and several commonly used algorithms are studied in this paper. Finally, the nearest neighbor classification method of the statistical pattern recognition method is applied. Based on the features of the letter image of this subject, the feature vector and template feature vector are compared and the template character is recognized as the result of the current character when the distance is minimal.
Experiments indicate that the method in this paper can identify the capital letters in a short time effectively.
Key Words: Pre-processing; Handwritten English letter; Location and Segmentation; Image Recognition
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 课题的研究背景和意义 1
1.2 字符识别国内外现状研究 2
1.3 本文的主要工作和安排 3
第二章 字符识别概述 4
2.1 字符识别系统简介 4
2.2 字符识别的相关概念 4
2.2.1 图像采集 4
2.2.2 图像预处理 6
2.2.3 特征提取 6
2.2.4 图像识别 7
2.3 数学形态学基础 7
2.3.1 膨胀 7
2.3.2 腐蚀 8
2.3.3 开运算与闭运算 8
2.3.4 图像面积和移除对象 9
2.3.5 连通标注与选择 9
第三章 大写英文字母块图像的预处理 11
3.1 图像的灰度化 11
3.2 图像的二值化 12
3.2.1 阈值选取方法概述 12
3.2.2 本文的二值化方法与实现 14
3.3 字母图像的定位与分割 17
3.3.1 图像定位的实现 17
3.3.2 图像分割方法概述 19
3.3.3 字符分割的实现 21
3.4 字符的归一化 25
第四章 大写英文字母的特征提取与识别 26
4.1 大写英文字母的特征及特征提取 26
4.1.1 特征及特征提取概述 26
4.1.2 统计特征 26
4.1.3 特征提取的实现 28
4.2 特征库的建立 30
4.3 大写英文字母的识别 31
4.3.1 常用识别方法 31
4.3.2 本文的方法 37
4.3.3 字符识别的实现 37
4.4 结果与分析 39
第五章 总结与展望 41
5.1 总结 41
5.2 展望 42
参考文献 43
致谢 45
第一章 绪论
1.1 课题的研究背景和意义
在日常生活中人们总是不经意地应用着模式识别。什么叫模式识别?举例来说,人能够轻而易举地分辨出猫和狗,分得清白天的太阳和夜晚的月亮,在很小的时候就能分出谁是爸爸谁是妈妈,能够进行正常的阅读,到一个新的城市能迅速地分辨出房屋、街道、雕像,甚至光听脚步声就能知道来者是谁,这些都是人类习以为常的能力。如果没有这些模式识别能力,人类会失去基本的生活能力,在这个世界里举步维艰。在计算机出现前,没有人对这些看似普通实则神奇的能力表现出惊奇和敬畏,更没有人想到过研究人类的模式识别能力。直到计算机出现,模式识别随着人工智能的发展也逐渐热门起来,当科学家们发现无论怎样用机器模仿人类的模式识别能力都达不到人类所呈现的完美时,人们才意识到这个问题的难度[1]。今天,模式识别相关技术已经成为许多重要领域的核心技术,比如神经学、人工智能、宇航科学、地质勘探等。相信随着科技的进一步发展,模式识别技术一定能有更广阔的发展空间、更多样的应用场景。
模式识别是对以各种形式表现出来的事物或者信息进行分析、解释的过程。图像处理一般运用计算机对数字图像进行分析,模式识别与图像处理的研究有着交叉关系,图像的识别是模式识别的一个应用方面,而字符识别又是图像处理的一个非常重要的应用方面。字符识别不仅是模式识别非常热门的一个研究方向,也是科学家们研究的比较深入的课题之一。这是因为字符识别研究的几个关键步骤相较其它方向的识别而言是比较基本的,它的研究有利于模式识别领域中的其它应用课题,它的进步能促进模式识别的进步。每个人都可以看到,在计算机技术飞速发展的同时,字符识别在不断地改进创新。应用在文档扫描录入方面,字符识别技术使得数量庞大的资料也能高效及时地输入计算机,既完成纸质信息的电子化,又节省了大量的人力、物力。
请支付后下载全文,论文总字数:27868字