登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 通信工程 > 正文

基于Matlab的场景图像分类算法研究与实现毕业论文

 2021-04-21 00:36:51  

摘 要

随着网络技术的飞速发展,对图像的使用呈爆炸式增长,如何对图像进行快速有效的检索与分类成为一个热门问题。本文是基于现今的词袋(Bag of Words,BOW)模型在场景图像分类中的应用,进行场景图像分类算法的研究与实现。

BOW模型在图像方面的应用是将图像看作一个文档,并由多个视觉词汇组成,视觉词汇由图像特征转化而成,然后统计视觉词汇出现的频率得到图像的表示。BOW模型分为训练阶段和测试阶段,训练阶段将图像的特征向量进行聚类得到视觉词汇表,然后通过分类训练得到训练模型,测试阶段用训练模型对测试图片进行预测,得到分类结果。

在BOW模型中,首先,先对训练图像进行SIFT特征提取,通过K-means聚类算法,聚类得到视觉词汇表,再通过SVM分类器得到训练模型;对测试图片同样进行特征提取后输入到训练模型中,得到对测试图形的分类结果。

关键词:场景图像分类;BOW模型;SIFT特征提取;K-means算法;SVM分类器

Abstract

With the rapid development of network technology, the use of images has grown exponentially. How to quickly and efficiently retrieve and classify images has become a hot issue. This paper is based on the application of today's Bag of Words (BOW) model in scene image classification, and the research and implementation of scene image classification algorithm.

The application of BOW model in the image is to treat the image as a document and consist of multiple visual vocabularies. The visual vocabulary is transformed from image features. Then the frequency of visual vocabulary is counted to get the image representation. The BOW model is divided into training phase and test phase. The training phase clusters the feature vectors of the image to obtain the visual vocabulary. Then the training model is obtained through the classification training. The test model is used to predict the test picture in the test phase and the classification result is obtained.

In the BOW model, firstly, the SIFT feature extraction is performed on the training image, the visual vocabulary is clustered by the K-means clustering algorithm, and then the training model is obtained by the SVM classifier; the feature extraction is performed on the test image and input to In the training model, the classification result of the test pattern is obtained.

Key Words: Scene image classification;BOW model;SIFT feature extraction;K-means algorithm;SVM classifier

目 录

摘 要 I

Abstract II

第1章 绪论 1

1.1 研究目的及意义 1

1.2 国内外研究现状 1

1.3 研究内容 2

1.4 论文章节安排 3

第2章 基于BOW模型的场景图像分类 4

2.1 BOW模型介绍 4

2.1.1 特征提取 5

2.1.2 图像表示 6

2.1.3 图像分类 6

2.2 BOW模型中关键技术 7

2.2.1 SIFT特征提取算法 7

2.2.2 K-means聚类算法 10

2.2.3 SVM分类器 10

第3章 整体方案设计与系统实现 12

3.1 系统平台简介 12

3.2 整体设计思路 12

3.3 系统实现方法 12

3.3.1 标准图库 12

3.3.2 VLFeat库 13

第4章 系统测试与结果分析 15

4.1 系统测试 15

4.2 结果分析 21

第5章 总结与展望 23

5.1总结 23

5.2展望 23

参考文献 24

致 谢 25

第1章 绪论

1.1 研究目的及意义

进入21世纪以来,信息呈爆炸式增长,图像作为信息的一种视觉载体,是人们获取信息、传递信息的重要手段。随着数字技术的发展与数字设备能力的提升,图像的应用与数量呈几何式发展,人们迫切的需要通过计算机来自动从图像中提取相关信息,以此来实现对图像的自动管理与分析。如何从图像中快速有效的获取有用信息,并能准确,高效的对图像进行分类与检索,成为图像研究的热点与重要方向。

在图像处理中对场景图像的分类是一个重要的研究方向。 场景图像是对某个场景进行描述的图像,例如我们所常见的街道,高楼,厨房,卧室等图像。场景图像往往是由多个对象组成,且这些对象之间具有一定的关系。出现在同一类场景的对象基本相同,只是由于拍摄的远近、拍摄的角度等等不同而造成图像的不同。因此,同一类场景的多幅图像之间存在着很多相似性[1]。如何从多幅图像中区分出具有相似场景特征的图像,并正确地对这些图像进行分类,就是场景分类。

开始场景图像的分类办法是通过人的肉眼观察,进行人工标注来对图像进行分类与管理。这种人工标注的方法不仅需要较多的人力,还容易发生错误,特别是在如今海量图像的情况下,人工标注的方法已经完全不能满足要求,更好的方式是通过计算机来自动识别场景图像并对其分类。随着计算机运行速度的不断提高,图像获取设备的不断完善和各种图像处理技术的提出,使得计算机能实时的对场景图像进行分类,这也使得场景图像分类成为计算机视觉领域的热门课题。并且场景图像分类在多个领域中都有应用

(1)图像检索[2]:这是场景分类中最直接的一个应用。根据场景图像的语义信息,将图像进行分类,通过计算机的图片搜索引擎来找到所需要的场景图片。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图