基于深度学习的三维图像特征提取与识别研究文献综述
2020-04-14 17:23:24
1.1 目的及意义
近几十年来,三维图像基本特征提取与识别技术以其唯一性、稳定性、通用性以及不易盗取等优点引来了广大研究者的关注,大量的三维图像识别算法被提出,三维图像识别领域获得的成果也在不断增多。然而,这些算法在复杂情况下仍存在着很大的缺陷,且特征的选取与提取成为制约其识别正确率的两大核心的因素。
深度学习方法在特征的选取与提取方面有着自身的优势,它可以对图像进行多层次的抽象学习,在最高层得到图像的高层抽象表示,这种方法更符合人类视觉系统具有抽象性的特点,且能够是计算机以深入理解图像的方式达到智能化识别的目的。例如,将二维图像及模型深度图作为识别系统的数据源,可以降低识别算法对外部因素的敏感度,从而达到提高识别正确率的目的。同时,将二维模型特征与深度特征进行结合,能够使所提取的特征包含模型的立体信息,从而达到提高识别率的目的。
本课题拟采用MATLAB实现对三维图像特征的提取,通过已经存在预训练的CNN架构,将图像作为训练数据,基于CNN网络对物体图像进行训练,对图像特征进行描述,得到图像的特征,对图像进行识别。
1.2 国内外的研究现状
自2006年Geoffrey Hinton等人在《science》上提出“深度学习”这个概念以来,深度学习得到蓬勃发展,现已成为试下最热门的研究领域之一。
深度学习技术就是建立在深层的人工神经网络模型的技术上对信息进行提取的技术,在高层的网络层,提取的特征越稀疏,深层轴向特征在网络的最上层产生。
无论是二维图像识别技术,还是三维图像识别技术,特征的提取都是影响识别正确率的决定性因素。目前,三维图像识别领域的研究核心已不再是便准的、单一的样本识别,而是在变化的拍摄角度、不同的光照及姿态等情况下的三位同学识别研究。深层结构满足了对这些非线性变化问题很好的表示能力,对其特征进行自动抽象的特点成功避免了特征选择对识别结果的影响,尤其深层卷积网络模型,可直接将二维数据作为输入,且在参数训练优化上有着一定的优势。随着多为采集设备的推广,三维图像识别以其符合人类视觉三维的、立体的特点成为三维图像识别的趋势,且利用模型深度信息可增强识别系统对外在因素的鲁棒性。因此,将三维图像识别技术和深度学习方法尤其深层卷积网络模型相结合有这广阔的研究空间与价值。
{title}
2. 研究的基本内容与方案
{title}如前所述,本文的重点是基于深度学习利用MATLAB对三维图像进行特征提取,并通过已经存在预训练的CNN架构,将图像作为训练数据,基于CNN网络对物体图像进行训练,对图像特征进行描述,得到图像的特征,对图像进行识别。
2.1 图像的特征提取
在进行三维图像的特征提取时,首先需要对图像进行边缘检测、角点特征检测等操作,之后通过SURF算法将得到的RGB图像进行特征提取。
2.1.1 图像的边缘检测
图像的边缘:指图像周围像素灰度急剧变化的那些像素的集合,存在于目标,背景和区域之间。首先检测图像中的边缘点,再按照某种策略将边缘点连接成轮廓,从而构成分割区域。可以分为俩种,一种为阶跃状边缘(边缘俩边像素的灰度值明显不同),另外为屋顶状边缘(边缘处于灰度值由小到大再到小变化的转折点处。可利用edge函数对输入的灰度图像进行边缘检测。