基于深度学习方法的图像分类研究文献综述
2020-05-05 17:28:23
文 献 综 述 一.图像分类在国内外应用现状与发展趋势 图像分类是计算机视觉领域十分重要的一个组成部分,其研究一直受到了国内外研究机构及大型互联网公司的广泛重视[1]。
包含深度学习的视觉图像分类的新算法不断刷新一些基准数据集的计算机视觉的任务记录:如Pascal VOC数据集上目标检测任务、KITTI自动驾驶数据集的车辆检测任务、FDDB人脸检测数据集人脸识别任务、Caltech 200-2011飞鸟数据集的精细分类任务、CIFIA-10及100微小图片数据集的分类任务、Microsoft COCO数据集的分类任务等等[2],体现了巨大的学术研究价值和工程应用价值。
图像分类的核心步骤是特征提取。
因此,计算机视觉特征提取算法的发展直接反映了图像分类研究的进展,其研究主要经历以下 3个阶段:第一阶段可以概括为基于采用底层视觉特征的图像分类算法。
这要采用的特征为颜色特征、纹理特征、形状特征以及局部特征等。
第二阶段可以概括为基于中层语义特征的图像分类算法。
中层语义特征是在原有的底层特征的基础上进一步进行编码、统计及变换,形成更为有效的图像特征表示模型。
第三阶段可以概括为基于深度学习的图像分类算法。
深度学习是一种多层神经网络结构,采用多层结构对输入进行非线性特征提取与变换,提取的特征层次深,表达能力强,典型的方法有深度置信网络、自稀疏编码器、栈式自稀疏编码器、深度波尔曼兹机、递归神经网络、卷积神经网络、生成对抗网络等[3]。
目前,基于深度学习的研究极大的促进了图像的分类算法的性能提升,同时也促进了相关算法的实际应用,受到了学术界及工业界的广泛关注。