基于稀疏自动编码器的非监督特征学习开题报告
2020-02-20 10:23:52
1. 研究目的与意义(文献综述)
1.1课题研究的目的及意义
我们处在一个科技高速发展的时代,越来越多的信息与数据充斥在我们的生活中。然而在对数据进行分类时常常会面临这样的一些问题:缺乏足够的先验知识,导致很难人工进行分类;又或者人工分类所需花费的代价太大。于是人们开始思考利用计算机来代替人类完成各类工作。
这些存在于生活中的事物与现象往往都是十分复杂的,而我们则希望以更加简单明了的方式来描述一个复杂表象下事物的本质,即通过多个主要变量来描述一种事物,这些变量就是所谓的特征,特征正是机器学习里的基础。一个算法的优劣很大程度上取决于数据特征的表达,当一个数据能够较好的被表现成特征时,那么这个算法才能算得上成功。在我们的生活中,数据大多都是高维的,在不进行降维处理的情况下,分类很难得到理想的结果,因此,深度学习框架和非监督学习方法的结合一直是机器学习和人工智能领域研究的热点,而自编码器在数据降维方面表现了很高的性能和表达能力的稳定性。在稀疏自动编码器中,稀疏性的意思即当一个神经元的输出接近于1时,我们认为它被激活,而当其输出接近于0时,我们认为它被抑制,使得神经元大部分时间都被抑制的限制我们称其为稀疏性限制。之所以要将隐含层稀疏化,是因为如果隐藏神经元的数量较大,不稀疏化我们无法得到输入的压缩表示。具体来说就是,如果我们给隐藏神经元加入稀疏性限制,那么自编码神经网络即使在隐藏神经元数量较多的情况下仍然可以发现输入数据中一些有趣的结构。
2. 研究的基本内容与方案
2.1设计的基本内容、目标
处理数据的关键在于如何降低数据的维度以便进行进一步的分析与处理,对于降维,我们常用的方法即特征提取和特征选择,而稀疏自动编码器是进行特征提取的一种有效手段。因此,设计的主要内容如下:
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
[1]abolhasanzadeh b. nonlinear dimensionality reduction for intrusiondetection using auto-encoder bottleneck features[c]// 2015 7th conference oninformation and knowledge technology (ikt). ieee, 2015.
[2]sainath t n , kingsbury b , ramabhadran b . auto-encoder bottleneckfeatures using deep belief networks[c]// ieee international conference onacoustics. ieee, 2012.
[3]hinton g e , krizhevsky a , wang s d . transforming auto-encoders[j].2012.