一种象形图识别系统的设计毕业论文
2020-04-11 17:39:36
摘 要
本次论文的目的是在于设计并实现一个象形图识别的系统,能够实现对于获取的象形图的图像使得系统自行判断和识别的功能。基于Matlab程序代码的简单性和便利性,使用Matlab软件设计本次论文的象形图识别系统。本文对图像识别系统的意义以及现阶段的发展状况进行了调查研究,在这个条件的基础上进行了需求分析以及系统算法的设计,采用模块化设计方法,编写了摄像头输入,直接读取图片这几个模块。利用摄像头等工具将象形图输入到计算机里,完成对象形图图片的采集亦或者使用计算机里原有的象形图图片,对象形图图片进行预处理,结构特征提取,分类识别,最终以文本的形式输出文字,从而实现象形图的识别。
本次论文的研究最终将实现基本的象形图检测工作,有助于象形图的识别和历史文化遗产的保存。
关键词:图像处理;特征提取;二值图像
Abstract
Pictograms are also known as hieroglyphics. They can be considered as an art form. They can also be considered as a written language. In most modern cultures,hieroglyphics are often used as simple,graphic,and representative symbols. The pupose of this article is to design and implement a system that can recognize pictograms. Due to the familiarity of Matlab software and the simplicity and convenience of Matlab program code, it was decided to create a pictogram recognition system based on Matlab software. The purpose of this paper is to design a pictogram recognition algorithm that can realize the function of judging and recognizing the system through the image processing of acquiring pictographic images. This paper investigates the significance of the image recognition, the requirements analysis and the system algorithm are designed. Using the modular design method, the camera input is programmed and the image is read directly. Several modules. Using pictographs and other tools to input the pictograms into the computer to complete the collection of the object map images, and to design a pictogram recognition algorithm, the object map images, and to design a pictogram recognition algorithm, the object map image preprocessing, structural feature extraction, classification and identification, and finally in the form of text Outpuy text to achieve pictogram recognition.
Key Words: Image Processing; Feature Extraction;Binary Image
目录
第1章 绪论 1
1.1 研究背景 1
1.2 课题研究现状及发展趋势 1
1.3 课题研究目的及意义 2
1.4本次论文组织构成 2
第2章 象形图识别系统构成及原理 4
2.1 图像识别基础知识 4
2.2 象形图识别系统构成及原理 5
2.2.1 预处理 6
2.2.2 图像分割 9
2.2.3 特征提取 10
2.2.4 分类识别 10
第3章 象形图识别系统的实现 11
3.1 开发工具介绍 11
3.2 程序主界面 13
3.3 基准库的选择与建立 14
3.4 象形图识别系统设计 15
3.4.1 摄像头输入模块的设计 15
3.4.2 读图模块设计 17
3.5 系统性能评价以及结果分析 18
第4章 总结 20
参考文献 21
致 谢 22
第1章 绪论
1.1 研究背景
图像识别是一种处理、获取和仔细观察图像的方法。它能够存储从现实世界收集的高维数据。一旦收集了数据,就将其用于生成符号或数字信息。全球图像识别市场在未来可能会出现爆炸。行业需求的增长是推动全球市场增长的主要原因。此外,就业机会的增加也推动了全球图像识别市场的增长。此外,廉价劳动力成本也在推动全球市场的增长。除了驱动因素之外,使用先进的图像识别技术也是推动全球市场的重要原因之一。最后,图像识别在不同行业的应用越来越多,也推动了全球市场的增长。图像处理的基本定义是指对数字图像的处理,即使用数字计算机去除图像中存在的噪声和任何种类的不规则性。噪声或不规则性可以在其形成期间或在变换期间蠕变到图像中。在过去的四至五十年中,在图像处理中发展了各种技术。大多数技术是为了增强从无人驾驶航天器、空间探测器和军事侦察飞行中获得的图像而开发的。由于功能强大的个人计算机、大型存储设备、图形软件等的容易获得,图像处理系统正在变得流行。
1.2 课题研究现状及发展趋势
图像识别是计算机领域最古老的研究领域之一。大多数人在听到这个词时都会想到大规模的项目,比如可以识别大类物体的引擎。区分草坪上的狗和沙发上的猫,然后正确地给动物贴上标签和设置的能力,就是今天的图像识别能力。将这样的标签应用于图像称为“图像分类”。谷歌( Google )等公司和斯坦福( Stanford )等学术大学编写的算法将图像识别推向了这一步。许多用例需要比简单分类更强大或更精确的计算机反馈。例如,公司使用视频分析来识别人体大小物体的移动,当知道相机的位置和位置时,这是一项相对容易的任务。现如今图像识别技术致力于识别对象、人员、建筑物、场所、徽标以及对消费者和企业有价值的任何其他内容。配备相机的智能手机和平板电脑将这项技术从主要的工业应用(例如水果分拣)推向了消费应用。例如,标识、汽车、地标、葡萄酒标签以及书籍和专辑封面可以由消费者智能手机识别,使用移动应用访问云中的图像识别软件。图像识别有可能将图片转换为指向Internet上某个内容(例如信息、服务、优惠券或视频)的超链接。它也可以用来启动搜索——这是谷歌和亚马逊一直在投资这项技术的主要原因之一。此外,图像识别在安全和内容管理方面也有应用。我们对图像识别的定义不包括视频分析或视频搜索,尽管视频分析经常包含图像识别技术。
图像识别市场预计将从2016年的159.5亿美元增长到2021年的389.2亿美元2016年至2021年的复合年增长率为19.5 %。机器学习和使用高带宽数据服务的进步推动了这一技术的发展。电子商务、汽车、医疗保健和游戏等不同行业的公司正在迅速采用图像识别技术。根据市场和市场的报告,图像识别市场分为硬件、软件和服务。以智能手机和扫描仪为主的硬件领域在图像识别市场的增长中可以发挥巨大作用。越来越需要具有创新技术的安全应用和产品,例如监视摄像机和面部识别。
1.3 课题研究目的及意义
图像识别领域在学科上分类的话属于人工智能的范畴,图像识别其本质问题是类别空间与模式空间之间关系的问题,目前图像识别有着多种的方式包括了统计,结构与模糊等模式的识别。在过去的几十年里,图像识别技术发生了巨大的变化。图像识别问题最初是从1965年开始研究的,从最初的文字识别演变到数字图像识别到现在的现实中具体的物体识别,图像识别已经走过了一段相当漫长的路程。但是现在的图像识别算法还有许多的不足之处,例如其自适应的能力低下,如果与样本库里面的目标图像相比有噪声污染导致的差别的话,那么对于最终结果也会有很大的差别。
本文的目的在于设计一种象形图识别的算法,能对获取象形图片通过图像灰度化,二值化等步骤处理之后,再选取合适的阈值对经过处理之后的图像进行图像分割,获取到目标对象之后对目标对象与样本库里面的样本想对比,判断目标对象的类别并以文本的形式输出目标对象的含义。
象形图(pictogram),也称为pictogramme,象形文字,或简单的picto,和计算机使用中的一个图标,是通过其与物理对象的图画相似来表达其意义的表意文字。象形图已经在网络和软件中被广泛使用,更好地被称为在计算机屏幕上显示的“图标”,以帮助用户导航计算机系统或移动设备。象形文字是一种书写形式,它使用代表性的图画,类似于楔形文字。象形文字今天仍然是普遍使用的,作为图画,代表性的标志,指示或统计图,它们广泛用于表示公厕,或机场和火车站等场所。在如今,一些有着历史文化意义的象形文字正面临着断代遗失的风险,这些象形文字残缺不全,象形图识别系统可以通过一些地方特征与现有的象形图进行比对,从而实现象形文字的识别,对于历史文化的研究有着深远的意义。
1.4本次论文组织构成
本次的设计论文的主要内容是设计一种象形图识别系统,能实现通过对获取象形图片的图像处理达到系统自行判断和识别的功能。该系统可以应用在文字识别的方面,期待能够增强对象形图意义的理解。通过以上的各个需求,本次论文的主要内容如下所示:
第一章,绪论。在第一章中主要介绍了象形图识别的研究背景以及意义,接着对图像检测做一个概述,具体分析了现如今国内外的研究状况,最后决定了本文的研究目的和需求,并进行接下来的设计。
第二章,象形图识别系统构成及原理。在本个章节中对象形图识别系统的构成做了一个简要的概述,并且介绍了图像识别的基础的一部分知识,在此之后还对本次的象形图识别系统所利用到的关键技术做了一部分的讲解识别。
第三章,象形图系统的实现。设计系统需要的相关的硬件和软件,故而首先对象形图识别系统所利用到的硬件和软件做了一个简单的介绍。本次论文设计实现的软件环境是Matlab,所以会对Matlab这款非常有效率的简便图像检测软件做一个介绍。之后对象形图识别系统的主要界面还有相关模块的部分代码构成做了相关的介绍,并且利用Matlab软件实现系统的仿真设计。最后对系统的性能进行了综合性的评价以及对相关结果做出了分析,并做出相应的改进和更深入的思考。
第四章,总结。对本次的系统设计做了一个自我分析与总结,思考系统的不足之处,并且考虑未来的改进,考虑这个系统的应用以及未来的发展前景。
第2章 象形图识别系统构成及原理
2.1 图像识别基础知识
图像处理(image processing)就是用计算机分析处理图像,然后获取自己想要结果的一项技术,又被称之为是影像处理。图像处理通常来说意味着数字图像处理。数字图像的意义是指用照相机,摄影机等相关工具通过照相得到的一组由二维数组组成的图像,而像素就是这个数组的元素,灰度值也就是这个像素的值一般都是整数。图像处理技术包括了众多功能,例如对图像进行压缩处置,对图像的复原或者增强,匹配类似的图像、对图像进行描述和识别图像等。对于图像处理的方法有许多,我们通常使用的图像处理方法包括了图像分割,图像增强,图像数字化,图像复原,图像分析,图像编码等[1]。
图像分割是图像处理中的关键问题之一。图像分割是将原始图像划分成对象和背景两个部分的一个过程。图像分割的方法可以划分成为两种,第一种是境界法,它用有一种边缘检测的技术,可以根据原始图像边缘的像素梯度的不同对图像进行划分[2]。第二种则是区域法,它是将一个图像当成两个部分获取的对象以及背景,根据这两个部分的不同计算其阈值,将对象和背景区分开来。阈值并不是一个固定的值,用一个固定的阈值不能总是得到令人满意的图像,因此可以将整体划分为几个部分,根据局部的各自不同来确定各自的阈值,这个阈值又被称为是自适应阈值。图像阈值技术用于图像分割[3]。
图像增强的作用相当重要,它可以使图片的质量得到增加,可以通过改变对比度消除原始图片中包含的噪声和不清晰的地方,增加图片的特点,修正图片的不足之处[4]。
图像数字化则是指将一个原始图像(自然存在的图像)利用取样和量化这两个功能将将这个图像输入到计算机里面(图像以二进制的形式存在)。这个图像在计算机内部的存在形式则是一个数字类型的矩阵,这个矩阵中有众多元素,这些元素被称为是像素。可以通过相关的硬件设备实现图像数字化的功能,其中最常见的硬件设备就是摄像头和扫描仪了。在本次系统设计之中就是利用USB数字摄像头将图像转换为计算机里面的数字形式。
图像复原是在假设已经知道模糊或者噪声的模型的时候,企图用噪声和模糊在计算出原图像的一种技术[5]。
图像分析指的是从图像里面选择出一些有某种作用的度量,数据或者信息。图像识别,描述和匹配则是对图像进行对比和配对,通过选取图像的一些特征和相互之间的关系,获取到图像符号化的描述,之后再将其与模型进行对比,确定其分类。图像配对企图创建两张不同图片之间的几何对应关系,度量这两张图片之间的类似或者不相同的程度。
图像编码的意义是对图像包含的信息进行编码,并以此来实现传送以及存储的需求。编码具有压缩图像的信息量的作用,但是这个过程并没有使得图像的质量发生多少变化。