基于词袋模型的图像分类系统设计开题报告
2023-09-12 08:55:49
1. 研究目的与意义
本课题研究的现状及发展趋势:
2. 研究内容和问题
本课题研究的基本内容:
1、研究词袋模型的理论方法,采用一种密度sift描述子进行特征提取,并选用k-means聚类方法构造视觉词典,对视觉词汇进行频率统计形成词袋模型,最后用svm分类器进行分类。
2、针对svm分类器用到的rbf核和hi核在词袋模型的基础上分别进行研究,通过训练svm分类器来比较基于这两种核的分类效果,并通过混淆矩阵和准确率来分析比较。
3. 设计方案和技术路线
本课题的研究方法:
主要用到的方法是以词袋(bow)模型为基础实现的。词袋模型首先选用密度尺度不变特征变换方法来 提取图像的局部特征,在特征空间上采用k-means聚类方法,将视觉特征分成若干类,其中每个聚类中心即是一个视觉词汇,再统计各个视觉词汇出现的频率,形成基于视觉词汇表的直方图矢量,可得到场景图像的视觉词包描述,最后训练svm分类器,即是整个词袋的 方法步骤。
而在词袋模型的基础上,加入空间金字塔匹配核(spm),进一步利用视觉词汇的空间位置信息。空间金字塔匹配算法主要包括局部特征的聚类,特征向量量化,同类视觉特征的匹配。在匹配的过程中只有类型相同,并且位置对应的特征之间才能匹配,这样局部特征间的空间信息便被引入到图像的表示和匹配中,使分类的效果更加显著。最后,结合svm分类器的rbf核和hi核,分别研究在不同核下的结合空间金字塔的词袋模型的分类效果,并以混淆矩阵的形式比较在不同方法下的分类准确率。
4. 研究的条件和基础
数字图像是一种比文字更为直观的信息表达方式,它包含丰富着的信息,如人物信息、 物体信息、场景信息等,数字图像的发展己呈现复杂化和多样化的趋势,更高效并更准确的 实现对数字图像的分类和检索己成为研究的热点。
图像的研究主要是对其进行语义的理解与分析。传统的人工标注分类法效率低下,己不 能在海量数据下对图像进行快速分类,因此需要一种智能的自动分类技术对图像进行分类与 处理,即运用计算机来智能的自动分析和处理大量图像数据,因此场景图像的分类及处理也 成为了计算机视觉的重要技术。场景图像分类就是在这种背景下产生的。
图像分类技术不仅需要图像处理的相关知识,同时也涉及机器视觉学习的相关理论。其 中,特征提取、场景图像检测分割与分类是须要研究解决的主要内容。对于视觉系统而言, 特征提取是图像分类的关键,它对分类的结果具有直接的影响,而衡量图像特征提取的主要 标准是准确性和高效性。