基于SIFT算法的图像目标检测分析开题报告
2020-04-14 15:07:07
1. 研究目的与意义(文献综述)
人类通过眼睛来观察世界,认识世界,探索世界。眼睛看到的客观世界通过视觉系统在大脑中转换得到的视觉称为图像。通过眼睛产生的图像,人类能获取到外界物体的形状、大小、位置和颜色等信息,从而进行一系列的判断和操作。这就是我们人类与生俱来的图像处理技术。
在这种背景之下,研究图像处理技术对我们日常生活和社会发展具有重要的意义。比如说在物体识别、视频跟踪、三维重建、图像拼接和机器人定标等方面具有重要的研究意义。当我们对同一个场景获取两幅或多幅图像时,我们就要采用图像配准方法来对图像进行处理,来获得该场景的更多信息。
图像配准是寻找在不同时间点、不同的视角下或由不同传感器拍摄的关于同一场景的两幅图像或多幅图像之间的空间变换关系,并对其中的一幅或多幅进行匹配和叠加的过程。图像配准可简单地理解为一个寻找空间映射的过程,重新排列一幅图像的像素点位置,并与另一幅图像的对应像素点保持空间上的一致性。图像配准是遥感图像处理、目标识别、图像融合、图像拼接、图像重建、机器人视觉等众多图像分析领域中的关键技术之一,是图像处理领域中的研究热点。图像配准可分为基于特征和基于区域的配准,其中基于特征的图像配准方法由于其只对特征进行操作,计算量较少,因此应用较为广泛。基于特征的图像配准方法的基本步骤为特征检测、特征匹配、匹配函数设计和图像的变换及重采样,图像配准操作围绕图像的特征展开。因此,如何提取具有良好不变性的特征成为基于特征的图像配准的关键所在
2. 研究的基本内容与方案
2.1 研究的基本内容
本文研究的基本内容是基于sift的图像目标检测,首先要解决的图像的检测识别,然后解决的是基于sift特征的检测。其中图像目标检测识别主要有图像预处理、图像分割和特征提取。而特征提取我们采用的是sift—尺度不变特征。
SIFT特征检测主要包括以下4个基本步骤:
1. 尺度空间极值检测:搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。
2. 关键点定位:在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。
3. 方向确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。
4. 关键点描述:在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。
2.2 研究的目标
基于前面所说的,我们研究的目标有图像目标检测和sift特征检测。
图像目标检测的主要步骤如下:
1. 图像预处理
图像预处理需要对图像进行平移、旋转和缩放等几何规范,使得图像识别能够快速、准确。同时,图像滤波的主要目的是在保持图像特征的状态下进行噪声消除,其可分为线性滤波和非线性滤波。与线性滤波相比,非线性滤波能够在去噪的同时保护图像细节,是目前图像滤波方法中研究的热点。非线性滤波中具有代表性的是卡尔曼滤波和粒子滤波。
2. 图像分割
图像分割是实现机器视觉图像自动识别与分析的重要问题,其分割质量对后续图像的分析具有重要影响。快速、精确地将特征目标从复杂的图像中分割出来一直是国内外学者的研究重点。图像分割可采用 3 种途径,即区域分割、边界分割和边界形成分割。
3. 特征提取
作为机器视觉图像目标识别的一个中间节点,特征提取对目标识别的精度和速度具有重要影响。从复杂的图像信息中提取有用的特征,对实现机器视觉的目标识别起到决定性的作用。根据不同分类方法,可将图像特征分为多种类型,例如可根据区域大小分为全局特征和局部特征,根据统计特征分为矩特征、轮廓特征及纹理特征等。与全局特征相比,用局部特征在复杂的背景下对图像目标进行描述非常高效,常用的检测方法有稀疏选取、密集选取和其他方法选取。从现有的研究成果来看,这3 类方法都有一定的不足——对图像目标背景依赖性大,因此,采用多种描述子进行机器视觉的图像目标识别是一种发展趋势。
对于图像特征提取,不同的描述子被不断被提出,其中,GLOH(Gradient location orientationhistograms)和 SIFT(Scaleinvariantfeature transform)描述子性能稳定,应用较为广泛;SURF(Speeded-up robust features)描述子在图像目标特征明显时能够快速识别,应用效果较好。除此之外,不变矩和导向滤波器在低维描述子中表现较好.在本文中,我们主要选择SIFT特征。
SIFT特征匹配主要包括2个阶段:
第一阶段:SIFT特征的生成,即从多幅图像中提取对尺度缩放、旋转、亮度变化无关的特征向量。
第二阶段:SIFT特征向量的匹配。
SIFT特征的生成一般包括以下几个步骤:
1. 构建尺度空间,检测极值点,获得尺度不变性。
2. 特征点过滤并进行精确定位。
3. 为特征点分配方向值。
4. 生成特征描述子。
以特征点为中心取16×16的邻域作为采样窗口,将采样点与特征点的相对方向通过高斯加权后归入包含8个bin的方向直方图,最后获得4×4×8的128维特征描述子。当两幅图像的SIFT特征向量生成以后,下一步就可以采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图中的某个关键点,通过遍历找到图像中的距离最近的两个关键点。在这两个关键点中,如果最近距离除以次近距离小于某个阈值,则判定为一对匹配点。
2.3 全文路线技术框图
我们从一个图像库中随机选择图片,对其进行SIFT特征检测,其路线框图如下。
图像预处理 |
图像切割 |
尺度构建 |
关键点定位 |
关键的描述 |
确 定 图 像 |
方向确定 |
特征提取 |
3. 研究计划与安排
第1周——第4周: 查阅相关文献资料,明确研究内容,了解研究所需基础资料。确定方案,完成开题报告;
第5周——第6周:论文开题;
第7周——第12周:撰写论文初稿;
4. 参考文献(12篇以上)
[1] 计算机视觉特征提取与图像处理.(英)mark s.nixon.北京.电子工业 出版社.2014
[2] 图像检测与目标跟踪技术.李静.王军政.北京 北京理工大学出版社.2014
[3] 计算机视觉.(美)davida.forsyth.北京.电子工业出版社 2017