登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 电子信息科学与技术 > 正文

自然场景图像中文本识别毕业论文

 2021-03-29 22:35:21  

摘 要

本文借助MATLAB软件首先对自然场景图像进行灰度处理、边缘检测,然后运用形态学运算去除边缘周围的噪点。利用投影法对图像文字区域进行检测和分割,将分割后得到的文本区域图像进行二值化以及滤波处理,再利用像素统计法把文本区域中的字符分割成字母,最后利用模板匹配的方法进行文字识别,选取相似度最高的字符作为识别结果输出。识别结果对提取图像信息有重要指导意义。

论文主要研究了自然场景图像里英文字符的识别及图像去噪,文本检测及文字识别。

研究结果表明,对图像进行灰度化、滤波等预处理并不能很好地消除文字区域中的噪声,所以在完成文本切割后,需要对文字区域进行图像增强处理,对倾斜的文本进行校正。在文本切割中,切割出来的区域会因噪声干扰而有偏离,所以在的定位时将垂直方向上的坐标上移能够调整偏差。

本文特色:在文本分割过程中利用上移垂直方向上的坐标的方法进行调整,以得到完整切割文本区域的目的。先对图像分割之后得到的文本区域进行形态学等去噪处理再进行字符切割与识别。

关键词:文字分割;文字识别;自然场景

Abstract

In this paper,after the image about nature scenes were transformed into gray-scale images and their edge detection,the noise around the edge were moved by morphological operation in MATLAB.By the means of projection,the text region was detected and segmented. And the segmented image including text was binarized and filtered.Then the character was separated from the text region in pixel statistic.Finally,the character was recognized in a way of template matching and outputted as recognition outcome which has maximum similarity.

The main study in this paper is about the recognition of English character in nature scene image , images’ denoising,detection and segmentation of text.

The results show that the preporcessing about gray-scale images and filtering didn’t make a good effect on denoising,so it is necessary for text region to be made an image enhancement and adjustment for slant text region.In the segmentation of text,there is deviation in the cut region because of noisy disturbance.

Feature of this paper is that we make an adjustment in vertical direction by moving up the coordinate for getting total text region when segmenting the image.Before characters’ segmentation and recognition,we make morphological operation to the segmented text region.

Key Words:Character Recognition , Text Location , Nature Scene

目 录

摘 要 Ⅰ

Abstract

第1章 绪论 1

1.1 课题研究背景和意义 1

1.2 自然场景文本识别国内外研究现状 1

1.3 研究内容和目的 3

第2章 图像预处理 4

2.1 图像噪声的种类及特性 4

2.2 图像增强处理 4

2.2.1 滤波去噪 5

2.2.2 形态学分析 7

2.3 图像灰度化与二值化 7

2.3.1 图像灰度化 8

2.3.2 图像二值化 8

第3章 图像分割与识别 10

3.1 图像分割 10

3.1.1 边缘检测 10

3.1.2 阈值分割 12

3.1.3 纹理分析 13

3.2 文字识别方法 13

3.2.1 统计模式识别 13

3.2.2 人工神经网络 14

第4章 文字识别的实现 18

4.1 仿真 18

4.1.1 图像灰度化 19

4.1.2 图像滤波去噪 20

4.1.3 图像分割 22

4.1.4 文字识别 25

4.2 结果分析 27

第5章 结论 29

参考文献 30

致 谢 31

第1章 绪论

1.1 课题研究背景和意义

图像包含大量信息。文字作为信息传递的载体。对计算机而言,一幅图像仅仅是数据,而不能提取其中的有用信息。因此,计算机视觉和模式识别成为许多研究者长期研究的对象。一旦计算机能像人类一样提取图像中有用的信息,人们的日常生活、工业生产和国防科技将会发生翻天覆地的改变。如果自然场景图象中文字识别的研究取得很大进展,则必将推动以下领域的飞速发展。

交通管理系统。通过对车牌号码识别,建立车牌交通违法违规记录和档案,公安人员根据车牌锁定可疑车主,系统自动跟踪可疑车辆。这为公安机关办案减轻了很大的负担。通过获取路牌信息及路边商铺信息,无人驾驶汽车可以实时获取道路交通状况并作出反应。普通用户可以将路牌拍照上传,即可获得所在位置及周边环境信息。如果用户出国旅游,用户将照片上传后,系统将图片中的文字自动翻译并显示相关信息。

视觉系统。视觉受损的人无法获取周围环境中的信息。通过对路牌及周围环境中文字的识别并转化为盲人或弱视者能理解的语义,视觉受损的人能够实时获取周围环境信息,从而使其生活和出行更为便利。

图像检索。通过识别图像中的文字,用户可以搜索到精确度和相关性更高的图片。在图像分类上,系统根据图像中包含的文字信息来对图像的内容进行分析,从而进行更符合主题的分类。网上购物时,用户可以根据输入产品的配料来检索到更多成分类似的商品。这在购买化妆品、药品等某些成分起主要作用的商品上起着重要作用。通过对身份证等证件或者票据上的文字识别,可以自动并快速地处理这些证件。

1.2 自然场景文本识别国内外研究现状

图像中文字识别的准确性受到许多因素的影响,如复杂的背景、光照环境、字体的风格以及排列方式。复杂的背景以及光照的变化会随机产生许多噪声,这对文字的定位造成极大的干扰。此外,拍摄角度的不同而造成的几何变形会对识别结果造成很大的影响。例如,当拍摄者将相机倾斜一定角度拍摄物体时,图像中的文字便会朝一侧倾斜;或者当拍摄者利用广角镜头拍照或者拍摄圆柱形的物体时,导致图像中的字体中间大两头小。就字体本身而言,各国文字不一样,例如中文、韩文、阿拉伯文。当图像中的只有一种文字时,系统是否能够识别出来。当图像中有多国文字时,系统又能否识别出来。这给文本识别工作增加了极大的难度。即使是同一种文字,字体的风格也会发生变化,例如中文有楷体、行书、小篆等,英文有意大利斜体、罗马铭刻体、安塞尔字体、埃及体等。除此之外,文字的排列方式有横排和竖排的变化。由此看来,要准确地识别各种条件下图像的文字是一件很有挑战的事情。就目前的方法来看,一般把文本识别分成三个步骤:图像预处理,文本切割,文字识别。

图像在采集、传输和处理过程中会受到各种各样噪声的干扰,抑制噪声的效果直接影响文字识别结果的质量。常用的图像滤波方法有均值滤波、中值滤波、形态学滤波和小波阈值滤波等方法。这些滤波方法容易模糊图像的边缘等细节信息。而图像中的文本往往与背景有极大的差异,在检测和识别中比较依赖于图像的边缘信息。对比较昏暗的图像或者文字与背景相差很小的图像而言,这些方法并不能取得很好的效果。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图