深度学习中特征自编码技术研究开题报告
2020-05-28 07:01:38
1. 研究目的与意义(文献综述包含参考文献)
文 献 综 述
1.自编码技术的内容、意义与应用
auto-encoder[1]自编码算法是一种基于神经网络算法的无监督学习算法,与神经网络算法的不同之处是将输入值作为输出节点的输出。自编码算法的另一个特征是隐藏层节点的个数一般少于输入输出节点的个数,这样的意义是将输入的特征通过神经网络的非线性变换到节点数更少的隐藏层,因此可以通过自编码神经网络对给定的样本进行训练学习,从而得到输入数据降维后的特征即为隐藏层的节点数,省去了人工特征提取的麻烦。auto-encoder网络结构包括输入层、隐含层和输出层,其输入层维数与输出层维数d相等。也就是说,auto-encoder通过学习一个恒等函数, 实现样本特征的重新表述。那么,当设置隐含层神经元的数目小于d时,即可实现输入层到隐含层的数据降维。为了进一步提高网络的学习特征能力,受人类视觉系统多级信息处理机制启发,可通过增加隐含层,形成” 深度” 学习模型,提取样本更加本质的特征。传统的bp算法无法实现深度模型的学习, auto-encoder深度模型一般采用无监督自我训练的限制玻尔兹曼机[2]多级互连的深度堆叠结构和逐层训练、整体微调的训练方法[3],提出了一种用于自动提取特征的 auto-encoder深度学习方法,通过构建具有很多隐层的深度学习模型对训练数据进行编码/解码学习,提取能够更加反映样本本质的高级抽象特征,保证在重构误差最小策略下实现数据降维,提升分类或预测的效率。目前, auto-encoder方法已成为数据降维与高维特征提取领域的研究热点。李远豪[4]将其应用于人脸特征提取中,取得了良好分类效果。他用深度自编码器编码网络提取人脸美丽特征,并用 svm 分类器分类预测,预测的平均识别率为 77.3%. 可以看到,运用深度自编码器编码网络提取的特征作为人脸美丽特征是可行的,但自编码器训练学习是一个复杂过程,这项研究结果所学到的特征鲁棒性仍不太高,这也有待于后续深入研究。秦胜君等[5]提出运用auto-encoder自动提取文本特征, 通过实验分析了sea算法中的隐含层单元数和dbn算法的微调次数对分类精度的影响,最后,将sd算法与支持向量机算法比较,得出结论在样本数较多的前提下,sd算法分类的效果要优于传统的支持向量机算法结果表明该方法,但是目前,并没有快速设置隐含单元个数的方法,只能通过经验以及不断地实验来寻找最优的隐含单元数目;王勇等[6]将该方法应用于林火图像分类,结果显示其性能高于b p网络; 林洲汉[7]将该方法用于高光谱图像特征提取,提出了一种基于像素邻域的主成分分量来提取空间信息的方法,并在此基础上融合光谱特征和这种空间特征,利用堆栈自动编码机-逻辑回归分类器进行空谱联合分类。实验表明,基于空谱联合的分类方法能够进一步超越支持向量机和之前基于光谱信息的分类方法,达到更高的分类精度。
2. 研究的基本内容、问题解决措施及方案
1.本课题要解决的问题
深度学习方法中的两种”构造模块”,包括自编码器和限制玻尔兹曼机,方法中的两种”构造模块”,它们都可用作表达转换的途径,也可看作相对较新的非线性降维方法。对于视觉特征的理解,自编码器是否是一个好的表达转换途径。主要评估单层自编码器的表达能力,并与传统的pca进行比较。基于原始像素和局部描述子的实验验证自编码器的降维作用、自编码器表达能力的稳定性以及基于自编码器的转换策略的有效性。
2.本课题拟采用的研究手段