面向网络图像分类任务的深度卷积神经网络设计与实现文献综述
2020-04-29 18:49:55
1.1课题研究的背景及意义
随着社会的进步与科技的快速发展,近年来出现在人们生活中的图像数量迅猛增长,人们需要快速、有效地、合理地对这些图像数据进行分析和处理并对分析后的图像进行识别和分类,传统的图像特征提取算法更多的是针对特定的问题,进行专门的人工设定,这种方法泛化能力弱,可移植性差,准确度相对较差。20世纪60年代,Hubel等人通过对猫的大脑视觉皮层研究发现,生物的视觉系 统是通过多层次的感受野(Receptive Field)逐层激发实现的。对动物视觉机理的深入研究启发研究人员思考是否可以设计出类似的算法,赋予机器识别理解图像的能力,由此卷积神经网络(Convolutional Neural Networks,CNN)应运而生。
卷积神经网络(Convolutional Neural Network,CNN)是人工神经网络(ArtificialNeural Network,ANN)的一种,它的权值共享网络结构减少了传统全连接型神经网络所需的训练参数的数量。多层次的网络结构保证了输入图像的特征提取的充分性,并且特有的输入信息特征提取的方法(卷积和子采样)不仅避免了识别算法对信息复杂的处理过程,还在处理含有不同种类和程度变形的图像或语音信息时也有着很高的识别率。
卷积神经网络依靠网络本身,通过对训练数据的学习,提取数据特征。随着大数据时代的到来,卷积神经网络在图像处理中越来越体现出不可替代的优越性,在图像识别、目标检测、图像分割、目标追踪等领域取得了飞跃性的进展
1.2国内外研究现状
二十世纪六十年代,Hubel和Wiese1通过对猫视觉皮层细胞的研究发现视网膜输出的神经信号并不是直接传入脑部的,其在传递过程中经过了复杂的神经元间的信号交换过程,随着信号的传递,单个神经元的输出受到更大范围内的视觉信号的影响,受该研究结果的启发他们提出了感受域的概念。在八十年代,基于感受域的概念日本学者Fukushima提出了神经感知机可以作为卷积神经网络的第一个实现网络的观点,他发现将神经网络中前序层中不同位置上的小区域在一组相同参数的神经元作用到后序层时数据能够具有一定的位移不变性,当物体发生位移或扭曲时神经认知机也能通过内部的位移不变性对物体进行识别。
图像分类是近年来才发展起来的一门新兴科学技术,它的主要研究内容为图像的分类与描述。一个图像分类系统主要由图像信息的获取、信息加工和处理、特征抽取、判断或分类等部分组成。图像分类的方法目前主要可以分为两大类:基于图像空间的分类方法和基于特征空间的分类方法。卷积神经网络已经在很多领域上得到了广泛的应用,由于卷积神经网络可以把原始图像直接作为输入而不需要对图像进行处理,从而避免了传统图像分类算法中复杂的手工特征提取和数据重建工作,使其特别适用于图像分类。
卷积神经网络有许多优点,但是目前也存在一些问题,实践中,具有类标号的数据较少,而不具有类标号的数据非常丰富,为每个数据人工设置类标号是非常费时和枯燥的。然而,为了使得监督卷积神经网络通过训练具有较高的泛化能力,需要大量具有类标号的训练样本,这也是制约临督卷积神经网络在实践中应用的主要因素,也是目前卷积神经网络需要解决的一个问题。
{title}2. 研究的基本内容与方案
{title}2.1研究的基本内容
随着深度学习在计算机视觉和模式识别领域的快速发展,与之相关的人工智能技术取得了很大的进步。其中,卷积神经网络作为深度学习算法中的一种,具有结构简单,适应性强,训练参数少等特点,近年来被广泛应用在图像分类识别领域中。本设计拟将对深度卷积神经网络在网络图像分类领域进行研究,设计合适的分类方法,提高图像分类的精准率,降低错误率。