稀疏编码在自然图像特征提取中的应用毕业论文
2021-03-15 21:03:19
摘 要
在大数据时代背景下,作为机器学习的主要成员,稀疏编码具有非常重要的研究价值和广阔的应用前景。对稀疏编码的研究不仅有利于研发更多高效的机器学习方法,也有助于推动实现利用计算机来模拟视觉系统这一设想。半个世纪以来,人们对稀疏编码的研究逐渐深入,许多算法和模型被提出,但也有许多疑问和难题等待解决。
本文详细介绍了稀疏编码的数学原理和工作机制,描述了其整体架构和推导过程,并且介绍了稀疏编码的实际应用,提供了一些实践技巧,然后构建了稀疏编码模型并在Matlab软件上实现了从自然图像中提取特征的稀疏编码算法。此外,采用不同的优化方法以及对比拓扑和非拓扑方式下的实验结果,验证了超完备基向量能够更有效地找出隐含在输入数据内部的结构与模式这一结论,同时证明稀疏性思想能在很大程度上解决退化问题。
关键词: 稀疏性,KL散度,交叉优化,反向传播算法,拓扑稀疏编码
Abstract
In the era of big data, as an important branch of machine learning, sparse coding is of great research value and has a widespread application prospect. The research on sparse coding is not only helpful to the development of more effective machine learning methods, but also promotes the realization of the simulation of the visual system by the use of computers. In the past half century, the research on sparse coding has been deepened, many algorithms and models have been proposed, but there are still many queries and problems waiting to be solved.
In this thesis, the mathematical principle and mechanism of sparse coding are introduced in detail, the overall structure and the derivation process are described. In addition, some application examples of sparse coding are illustrated. Finally, an algorithm for extracting the features of natural images is implemented on the Matlab software. The topological and non topological sparse coding methods are compared with different optimization methods. The results have proved that the over-complete basis vector more effectively reveals the inner structure and pattern of input data and the idea of sparsity is to some extent an effective solution to the degradation problem.
Keywords: sparsity, KL divergence, crossover optimization, backpropagation algorithm, topological sparse coding
目 录
摘 要 I
Abstract Ⅱ
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究历史与现状 1
1.3 课题研究内容 4
1.4 论文结构和章节内容 5
第2章 稀疏编码的基本原理 6
2.1 稀疏编码基本思想 6
2.2 稀疏编码代价函数的数学推导 8
2.2.1概率解释 8
2.2.2 代价函数应用到算法中 12
第3章 稀疏编码的算法实践方法 14
3.1拓扑稀疏编码 14
3.2稀疏编码实践技巧 15
3.2.1 样本分批 16
3.2.2 优化s初始值 16
第4章 在MATLAB上实现算法 17
4.1初始化和样本处理 17
4.2 代价函数的实现和检验 18
4.3 迭代优化部分 18
4.4 实验结果分析 20
4.4.1 代价函数检验 20
4.4.2 迭代优化后的代码运行 22
4.4.3 不同迭代方法比较 24
4.4.4 不同实验参数的结果比较 25
总结与展望 26
参考文献 28
附录1 29
附录2 34
致谢 40
第1章 绪论
1.1 研究背景及意义
在当今这个大数据时代,我们面临的一个重要问题是:如何高效地处理这些数据?稀疏编码(sparse coding)是一个比较流行而有效的方法。稀疏编码是一种无监督机器学习方法,它通过寻找一组“超完备”基向量的方式来更高效地表示样本数据。它的编码方式并不依赖于输入数据的类型,而是依靠感知特性,因此具有空间的方向性和局部性以及频域的带通性。在诸多统计方法中,它具有优秀的自适应性。
稀疏编码来源于神经科学,生物学家认为,在生物漫长的进化过程中,发展出了快速而准确地表达自然图像的能力。例如,人眼能在一瞬间捕捉大量图像。基于此,研究人员提出一种设想,以最小的代价和最简单的方式将图像重构表达,从而提高处理速度,这便是稀疏编码的基本思想。
1.2 国内外研究历史与现状
近半个世纪,不少神经生理学家在神经视觉方面上进行了全面深入的研究,其中不乏对稀疏编码感兴趣并且深入探索的人,在他们的努力之下,这一领域也取得了一些有重要意义的研究成果。
1959年, Toresten Wiese和David hubel[1]通过研究猫的视觉细胞感受野,得出了这样一个结论:视觉皮层V1区神经元会以稀疏表达的方式来表示感知到的视觉信息。
1969 年, D.J.Willshaw等人[2]提出了基于赫布理论稀疏表达思想。
1972年,Barlow[3]指出环境的统计特性必然是有稀疏性的联系的。后来这个论点被人们不断的探究所证实,人脑的统计特性确实具有稀疏性。
1988年,Michison[4]确立了神经稀疏编码的概念,后来经过一些学者的引用,这一概念被正式认同。