基于形状描述的图像检索方法与实现毕业论文
2020-04-13 13:05:04
摘 要
信息检索技术在互联网时代的背景下,随着互联网与信息技术的迅速发展而越来越重要,同时,该技术的地位也越来越凸显。在诸多的信息中,由于视觉获取信息占人类可获取所有信息的百分之七十之多,图像又在视觉信息中扮演了最主要的角色,因此,图像检索技术必然成为了互联网发展过程中的不可或缺的一部分。本文围绕着基于形状特征的图像检索展开了探索研究。
本文的主要工作如下所示:
- 主要分析了图像处理过程中图像的特征,特征包括颜色特征、亮度特征、形状特征和纹理特征。但是形状特征能处理复杂的形状,可用于检索形状类似的图像。
- 主要设计了基于形状特征的图像检索的方法;阐述了这种方法的原理,并结合仿真实验结果和分析,对系统进行设计和实现,并在数据库上实验验证了本文所用的检索方法的有效性。
关键词:图像检索;形状特征;特征提取;
Abstract
Information retrieval technology is becoming more and more important with the rapid development of Internet and information technology in the background of the Internet age. At the same time, the status of the technology is becoming more and more prominent. In a lot of information, because the visual acquisition information accounts for more than seventy percent of all the information that human can obtain, the image plays the most important role in the visual information. Therefore, the image retrieval technology will inevitably become an indispensable part of the development of the Internet. In this paper, we focus on image retrieval based on shape feature. The main work of this paper is as follows:
1. It mainly introduces the characteristics of image in the process of image processing, including features of hue, brightness, shape and texture. But shape features can handle complex shapes and can be used to retrieve similar shapes.
2. The chapter introduces the image retrieval method of shape feature, introduces the principle of this method, and designs and implements the system with the result and analysis of the simulation experiment, and experiments on the database verify the validity of the retrieval method used in this paper.
Key Words:image retrieval;shape feature;feature extraction、
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 2
1.3 图像检索技术研究存在的问题 4
1.4 本文的主要工作 5
第2章 图像目标的特征 6
2.1 颜色特征 6
2.2 亮度特征 7
2.3 形状特征 9
2.4 纹理特征 9
2.5 斑点特征 11
2.6 本章小结 12
第3章 基于形状特征的图像检索算法研究 13
3.1 图像检索的原理 13
3.2 图像库建立 13
3.3 图像检索流程 14
3.3.1 识别目标及识别内容 14
3.3.2 图像检索的仿真实现 15
3.3.3 图像预处理 15
3.3.4 图像去噪 16
3.3.5 图像增强 18
3.3.6 图像二值化 19
3.3.7 特征提取 20
3.3.8 特征匹配 21
3.4 本章小结 22
第4章 总结及展望 23
参考文献 24
致 谢 26
第1章 绪论
1.1 研究背景及意义
随着互联网时代的到来,人们使用网络俞加普遍。图片作为人类摄入信息的主要来源之一,其数量以极其惊人的速度飞快增长。突然猛增的信息量使得人们获取真正所需的信息变得更加困难,传统的文字检索功能已然不能满足人们的需求,诸如对已注册商标的查重、数字图书馆的检索、医疗军事方面的定向搜寻等等,如何才能在海量的图片中准确、快速地寻找到所需内容呢?图像检索相关技术就成为人们亟待解决的热点问题。
信息检索技术在互联网时代的背景下,随着互联网与信息技术的迅速发展而越来越重要,同时,该技术的地位也越来越凸显。在诸多的信息中,由于视觉获取信息占人类可获取所有信息的百分之七十之多,图像又在视觉信息中扮演了最主要的角色,因此,图像检索技术必然成为了互联网发展过程中的不可或缺的一部分。如今,大数据以及相应的基础研究成为了数据科学家们热衷的研究对象。大数据科学是一个包含多门学科诸多领域的新兴交叉学科,该技术横跨了系统科学、社会科学、信息科学、网络科学、经济学、心理学等。数据也随着全球信息化高速发展,而走向极大数量、极大丰富,所以,新时代的计算机视觉领域新的挑战必然是要面对这些数据量大、价值高、传播速度快、种类复杂的数据,并且还能从中准确检索到所需要的信息。在互联网Web2.0时代,文本,语音,图像,视频等数据每天都以难以置信的高速增长 [1]。
随着网络技术的迅速发展,每天都有数量难以想象的视频、音频、文本以及图像数据产生。于此同时,大量的客户对于网络内容服务的需求也在日益增长。这既是挑战也是机遇,互联网的大规模数据为对进行此方面深入研究提供了基础。如何处理大规模数据和发现其规律成为了当今的大数据科学方向的研究热点之一[2]。同时大数据的研究可以解决许多科学领域的难题[2]。由于其巨大经济效益和社会意义,使得各个国家的知名高科技企业及学术研究机构大量投入,推动了大数据科学研究的发展。
目前,大数据科学研究正受到越来越多的关注。针对图像数据的检索研究,作为大数据科学极为重要的组成部分也受到数据科学领域的广发关注。利用图像数据的检索研究可以从大规模数据中得到有效的信息,具有巨大的实际意义,因此这方面的研究受到数据科学领域的广泛关注。在十九世纪七十年代,基于文本的图像检索技术引领了一波潮流,但其存在的缺陷也是十分明显的。人工标注受限、工作量过大、主观性占主导地位、机器无法自动更新标签等缺点使得其应用十分局限。基于内容的图像检索研究克服了上述的缺点,成为大数据科学方向的热点方向。它使得图像检索更加智能化,也极大提高地了图像检索的准确性和响应速度。随后,研究学者开始将形状特征引入到图像检索技术中,基于形状特征的图像检索技术有着更快的速度,对硬件空间的需求也大幅降低。而且形状特征图像检索技术在面对海量数据时,有着巨大优势[3]。因此,其发展前景也是不可估量的。
在巨大的数据量面前,使用传统的机器学习方法处理已经无法满足需求。此时在数据科学专家不断地努力下,学习方法应运而生。在大多数使用了学习的领域中,深度学习取得了极大的成功。学习方法是机器学习领域中一系列试图使用多重非线性变换对数据进行拟合的算法。这是一个很有建设性的进步,学习方法的出现给数据科学带来了翻天覆地的变化。
随着科技发展,基于形状特征图像检索技术在不断进步,该方法科学研究的成果已广泛应用于工业,并取得巨大成功,这些都侧面印证了此方法的有效性。它更好地满足了快速图像检索对于执行时间以及存储空间苛刻的要求。因此对该方面的研究是十分有价值的。
1.2 国内外研究现状
图像检索技术最初是基于属性的图像检索,直到上个世纪70年代,主要的图像检索技术才进化为基于文本的图像检索,这种方式虽然有易于理解、操作方便、检索速度快、实现简单等优点,但同时也存在工作量大、主观性强、无法自动更新等缺点。为了解决这几个缺陷并且得到更高的检索精度,基于内容的图像检索方法(CBIR方法)被提出,并且以其快速而精确的特点被众多大学实验室、大型互联网公司所应用[14]。在应用CBIR方法之前,传统搜索引擎的图片搜索方法都是基于文件名建立的索引来实现搜索功能,而现在盛行的搜索引擎如雅虎、谷歌、微软等图像搜索无一例外都是基于内容的图像检索,这种搜索技术的条件是图片本身的特征信息,同时,数据库的搜索索引也是图片的底层特征信息。
在国外最早成功应用CBIR技术的是IBM研发的QBIC商用图像检索系统,此系统结合了传统的基于关键字查询和基于内容查询方法,能够更快更精准定位到用户所需的视觉信息[4]。不仅如此,QBIC系统还使用K-L变换对高维的图像特征进行降维处理以解决高维特征难以索引的问题。
除此之外,比较著名的CBIR系统还有UIUC大学研发的多媒体分析检测系统MARS,该系统是一个基于内容的集成反馈图像检索系统,用户在查询之后,查询结果会根据用户的相关反馈,自动进行更新并且完善成新的结果。MARS的核心技术主要建立在两个CBIR的挑战上,一是高维和低维特征之间的差距,二是算法必须结合人类对视觉信息的主观性和计算机的客观性。
与MARS相近的还有MIT的Photobook系统,这是一个基于图像内容对图像数据库执行查询的工具。它通过比较与图像相关的特征而不是图像本进行检索工作。这些特征不仅可以是每个图像的特定模型的参数值,比如颜色,纹理和形状, Photobook可以使用任何模型的特征并且与Photobook提供的匹配算法库中的一个进行功能比较。在第五版中,这些算法包括欧几里德,mahalanobis,散度,矢量空间角度,直方图,傅里叶峰值和小波树距离,以及它们的任何线性组合。版本6通过动态代码加载,允许用户定义匹配算法。由于没有适用于所有任务的最佳图像模型,并且很难确定哪些模型适合于某项任务,Photobook和FourEyes选择使用一种交互式学习方法,可根据用户的示例选择和组合模型。这使得Photobook不同于像QBIC,Virage,SWIM和CORE这样的工具,它们都支持各种功能的搜索,但在为特定任务实际选择一个功能时提供的帮助很少。相比之下,FourEyes允许用户直接解决他们的意图。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: