基于自编码器的图像特征提取算法设计与实现文献综述
2020-04-14 19:48:38
图像特征提取在智能识别等领域中起着重要的作用,是图像处理和识别的基础步骤。在计算机中,图像按照有序的多维矩阵进行存储,通过颜色可将图片分为两类:一类是用二维数组存储像素值的灰度图片,另一类是用三维数组存储三个通道颜色的像素值的彩色图片。当图像的数目较少时,能够利用矩阵作为图像的特征进行一些需要的操作,但是在实际的应用场景中,数据量是非常庞大的,如果直接用图像的存储矩阵作为图像特征来进行各类运算处理,则将会浪费大量的存储空间和计算资源。所以,根据人们的经验,数据中存储的巨大信息量对于计算机来说也并不是都需要的,会有一定的信息冗余。因此就能够通过一定的方法来对图像降维,也称为从图像中提取特征。因为只保留了图像中的重要特征信息,所以能够利用特征值对图像进行更多的操作和进一步处理。利用图像特征进行运算,明显降低了存储和运算复杂度。传统的图像特征提取主要是根据特定的目人为的设计特定的算法将图片转化为一定维度的数据进行表示。随着机器学习的出现和不断发展,使图像处理有了新选择,提高了效率,为图像特征提取提供了更好的方法。使用自编码器(autoencoder)就为图像的特征提取提供了更好的解决方案。
自编码器是神经网络的一种,1986年由Rumelhart提出,是一种无监督学习方法,使用了反向传播算法,目标是使输出和输入尽可能相等。自编码器内部有隐藏层,可以产生编码表示输入。自编码器目前已成功的应用在降维和信息检索任务中。降维是表示学习和深度学习的第一批应用之一。它是研究自编码器早期驱动力之一。例如,Hinton and Salakhutdinov (2006) 训练了一个栈式RBM,然后利用它们的权重初始化一个隐藏层逐渐减小的深度自编码器,终结于30个单元的瓶颈。生成的编码比30维的PCA产生更少的重构误差,所学到的表示更容易定性解释,并能联系基础类别,这些类别表现为分离良好的集群。因此此次设计将采用自编码器的方式对图像进行处理,而自编码器主要作用在于通过复现输出而捕捉可以代表输入的重要因素,利用中间隐层对输入的压缩表达,达到像PCA那样的找到原始信息主成分的效果。
设计的意义是(理论或实际):
图像特征提取主要的应用领域有:(1)临床医学影像处理的应用,例如CT图像病变区域特征识别,超声波图像处理识别等,都需要用到图像的特征提取;(2)生活场景中的应用,例如物体识别、人脸识别、车辆牌照识别等,也需要图像特征提取技术的应用;(3)公共安全领域的应用,例如罪犯追捕、公共监控、卫星图像处理等,同样离不开图像特征的提取技术。基于自编码器的图像特征提取在图像处理领域中会发挥巨大的作用,它将输入的图像通过自编码器自动地实现图像降维,而低维表示可以提高许多任务的性能,这样就提高了图像特征提取或分类的效率和准确率,且实现了小空间的模型消耗更少的内存和运行时间。因此,基于自编码器的图像特征提取在生产生活中拥有很好的应用价值。
{title}2. 研究的基本内容与方案
{title}2.1研究目标
利用Python开发语言,完成基于自编码器的图像特征提取算法设计与实现。图像特征提取在图像识别和处理领域中应用广泛,是图像处理、分类和识别的基础步骤。通过研究图像特征提取可以为图像处理领域提供一些更好的处理方法,解决一些基本的、共性的问题。将自编码器应用于图像特征提取中,由于它是一种无监督学习方法,使用了反向传播算法,目标是使输出和输入尽可能相等,所以就可以对自编码器进行训练,利用中间隐层对输入进行压缩表达,通过复现输出而捕捉可以代表输入的特征信息,达到像PCA那样的找到原始信息主成分的效果。这样就可以利用计算机构建一个自编码网络,提取图像特征,并使用特征重新构建图像,使图像处理更加节省时间和精力,提高工作效率。
2.2研究内容
研究自编码器在图像特征提取中的应用,采用Python开发语言,学会在Pytorch里搭建几种常用自编码器,利用如稀疏自编码器等自编码器对特征提取,比较它们的提取效果和优缺点。学习主流的、基本的聚类算法和图像处理算法,实现对自编码器进行训练,利用中间隐层对输入进行压缩表达,通过复现输出而捕捉可以代表输入的特征信息,达到像PCA那样的找到原始信息主成分的效果,并能够通过特征信息对图像进行重建,输出重建图像。
2.3拟采用的技术方案及措施