图像仿射不变特征提取方法研究
2024-01-09 08:57:12
论文总字数:13446字
摘 要
随着图像识别在社会各个领域的广泛应用,图像识别技术也逐渐成为计算机视觉和图像配准领域的主要研究方向之一。论文主要研究了仿射不变性在图像识别技术领域的应用。经过分析和比较,采用K-means算法,以颜色分量作为坐标参数,对景象图进行聚类、分割、匹配、识别。实验仿真结果表明:本方案对路标图像的识别、旋转、平移、斜视、缩放等几何变换具有很好的效果而且方法简单、准确,具有良好的适应性。关键词: K—means,仿射不变性,仿射变换,不变特征提取
Abstract: With the wide application of image recognition in all areas of society, image recognition technology has gradually become one of the main research fields of computer vision and image registration. This paper mainly studies the application of affine invariance in the field of image recognition. After analysis and comparison, the k-means algorithm, to the color component parameters as the coordinates of a scene graph, clustering, segmentation, recognition, matching. Simulation results show that: the scheme on the recognition, image rotation, translation, strabismus, scaling transformation has the good effect and the method is simple, accurate, this technology will have a good application prospect in the related fields.
Keywords: K-means,affineinvariant,affineinvariant,featureextraction
目录
1 绪论 6
1.1 研究背景 6
1.2 论文工作及组织结构 6
2 仿射理论基础 8
2.1 图像的预处理 8
2.2 图像分割技术 8
2.3 Hu不变矩 12
3 结构设计与方案选择 12
3.1 仿射不变性的特征提取系统结构 12
3.2 数据处理软件的选择 13
3.3 特征提取方案选择 13
4 识别方法 14
4.1 八向识别法 14
4.2 链码识别 15
4.3 Hu矩识别 16
5 识别结果分析 19
5.1 几何变换识别 19
5.2 加噪及缺损识别 21
6 总结与展望 22
6.1 工作总结 22
6.2 工作展望 22
参考文献 23
致谢 23
附录 25
1 绪论
1.1 研究背景
随着科技的发展,人们对生活的要求已不只是停留在追求美的层面之上,图像识别在社会各个领域也得到了广泛应用,图像识别技术[1]也逐渐成为计算机视觉和图像配准领域的主要研究方向之一。
仿射不变性是指如果一个图形具有某个量或者某种性质,在平行射影的条件下,如果没有改变,则称这个量称为仿射不变量,这个性质为仿射不变性质。经过仿射对应它们也是不变的。仿射不变性质主要有同素性、结合性。即仿射对应把共点的线变成共点的线,把共线的点变成共线的点。如平行四边形在仿射对应下的象还是平行四边形。
本文从国内和国外两个角度对仿射不变性这一概念的发张进行了描述,首先从国外说起,在国外首先是由Witkin提出的尺度2空间[2],此后分别由Lindeberg、 Lowe提出的Laplace 和Hessian 算子和Difference2of2Gaussian特征点算法。并且Lindeberg还在此基础上研究了二阶矩阵,同时在国外除了上述几位重要的贡献者以外,还有就是2002 年Matas提出的分水岭算法。
仿射不变性的特征可分为全局仿射不变特征和局部仿射不变特征。全局仿射不变性是指整体图像都呈现不变的特性,局部不变特征的研究主要包括两个基本的问题:第一个问题是在哪里提取特征,也就是说需要在图像中首先确定提取特征的位置或局部区域;第二个问题是提取什么特征,即在前面提取的位置或局部区域计算某种局部不变特征描述.
论文从不同的角度研究仿射不变性并探究了仿射不变性在图像识别技术领域的应用。其中主要使用了K-means,以颜色分量或者几何性状作为坐标参数,对景象图进行聚类,然后在聚类后的特征点提取的基础上进行匹配,从而达到仿射不变性的特征提取。
1.2 论文工作及组织结构
1.2.1 论文的主要工作
论文主要的工作首先是对路标进行识别;其次是证明仿射不变性的特征;再次是学会识别相同路标的变换后的仿射不变性以及不同的路标;最后要求能够在有效的提取路标图像的特征点的基础上加以匹配。
1.2.2 论文的组织结构
论文的整体思路是首先介绍仿射不变性的研究背景及其大概发展历程,其次介绍论文所用的理论基础,对路标进行识别并与基础理论进行对比从而确认一个大致研究框架与步骤,主要是探究如何对仿射不变性的特征进行提取,再次是介绍三种不同算法的识别方法,最后主要谈谈该论文的总结与展望。具体安排是:
第一章介绍仿射不变性的研究背景及其大概发展历程,概括了论文的主要工作及其组织结构。
第二章主要介绍论文的基础理论,从导入图像开始到匹配识别图像结束即为顺序结构理论。首先讲的是图像进行预处理的方法,第一步导入图片,然后要做的便是预处理,滤波技术的方式和多样性随着数字图像技术的高速发展也逐渐增多,同时,计算机只能识别简单的0、1数据所表示的图像,从而可见二值化是必不可少的,而最后经过预处理所得到的图像,要想有效的快速的对特征点进行提取,那么算法设计是必要的,同时理论基础更为重要。而在对图像进行分割时,分割所用到的技术便是聚类,K-means聚类法是对图像进行分割是有效聚类方法,而且可以得到想要处理的图像,K-means理论基础所涉及的数据较为复杂同时计算难度也较高。仿射不变就是仿射不变性的特征,而几何变换是仿射不变的基础。目前,几何变换处理非常有效的方法是Hu不变矩,论文不仅介绍了Hu不变矩的由来而求介绍了Hu不变矩的生成形式。最后,本章节还着重介绍了仿射变换的由来,所涉及的包括从物体到相机以及成像的变换等,从而提高对仿射不变性理解的直观性,以及了解仿射不变性特征提取过程所需工作。
第三章是在与第二章所介绍的理论基础进行比较分析的的基础上绘制出一个大概的框架与步骤,并选择最简单、有效的方法,对所做路标进行识别。即对所做路标识别制定出一个符合理论基础的框架、步骤。主要就是分析了MATLAB软件的优缺点,在多次比较分析的基础上,考虑到MATLAB的实用性、便捷性。最终,确定MATLAB编程工具为本论文的最佳软件。
剩余内容已隐藏,请支付后下载全文,论文总字数:13446字