登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 通信工程 > 正文

基于流形嵌入的多视觉聚类研究文献综述

 2020-04-15 20:30:21  

1.目的及意义

在现实社会中,许多纷繁复杂的数据都是有价值的,人们总是希望能够从中获取有价值的信息。面对看似杂乱的数据,通过聚类分析可以有效的将数据划分为若干个类别,每一个类别可能真实的反映了原数据中一种类型的对象。聚类分析是机器学习领域一种重要的无监督学习方法,在数据标签未知的情况下,将数据分类,每一个类别称为聚类成为聚类分析的一个分支,受到许多研究者的关注。多视图数据是一种有多个侧面、多个视角的数据集,例如,不同的图像特征可以作为图像数据不同视图,不同传感器可以获得同一数据源的不同视角数据。多视图聚类考虑视图间的差异性和互补性,最终获得一致性划分。数据往往是以多种视角的方式存在着,不同的视角表达着事物不一样的特征。在传统的聚类学习中,人们只对数据的单个视角进行分析,所以往往不能得到数据的全貌,存在着以偏概全的问题。于是多视觉学习应运而生,它能深挖数据的内涵,帮助人们了解事物的本质,已经是机器学习的一个迅速发展的方向,有良好的理论基础和巨大的实践成功。


多视觉学习起源于1998年Blum等人提出的协同训练算法,对两个视角进行协同训练,交换彼此的信息,从此,多视觉学习越来越受到人们的重视,越来越多的研究者投入到该领域的研究中,探索并改进多视觉学习的方法。发展到现在,大致存在着三种多视角学习方法:协同训练(Co-trianing),多核学习(Multiple Kernel Learning)和共享子空间学习(Shared Subspace Learning)。

Co-trianing是在假设两个视角充分冗余的情况下,按照一致性原则将未标记样本予以类标,在一定程度上提高了分类精度。Kumar等人较早的将Co-trianing改进应用于多视图聚类中,在多视图聚类中实现不同视图之间分歧最小化。他们还提出可以将视图中包含的信息以正则化方式嵌入到学习过程中来共享视图中的信息。Zhou等人提出了Tri-training算法,其通过训练存在贡献差异的特征来提高学习性能,避免了Co-trianing算法的缺陷。

核方法(KL)作为一种解决机器学习领域中非线性模式问题的有效方法,可将线性不可分的模式映射到高维特征空间,以达到线性可分的目的。多核学习(MKL)是KL的延伸,其主要思想是针对结构异构的样本,构造满足Mercer定理的多个核函数,并将其组合以提高学习性能。2002年Lanckriet等学者提出了用于半监督学习的多核算法,此后,研究人员相序提出GMKL,SPG-GMKL和SMO-MKL等算法。

单视角子空间学习是指在保持原有数据本质结构不变的情况下,通过线性或非线性变换将高维数据映射到一个合适的低维子空间,已达到增强学习性能的目的。不典型相关分析(CCA)是一种较早应用于多视角数据的方法。该算法将不同视图从高维空间投影到一个共有的子空间,这个子空间使得相似的数据更为的靠近,不相似的数据更为远离。之后在这一子空间上使用一些典型的聚类算法即可得到高性能的聚类效果。2010年Rasiwasia等人将CCA应用到图像跨模式检索中,实验结果表明组合多种不同的视觉特征,能提高低维空间表示的判别性。

共享子空间学习因为其计算简单、分类能力强,能够在保持数据分类和决策能力的情况下进一步完成多维数据的分类和压缩,现在已经成为来研究的热点。现有的方法由于不能获得比较准确的共享子空间结构,导致聚类的性能存在上限。因此本文提出基于灵活流形嵌入的方法,来学习更为准确的共享子空间结构,提高聚类的性能。


{title}

2. 研究的基本内容与方案

{title}

本课题在MATLAB平台上构造设计一个基于流形嵌入的多视觉聚类算法,学习更为准确的共享子空间结构,提高聚类的性能。

局部线性嵌入(Locally Linear Embedding, LLE)是无监督非线性降维算法,是流行学习的一种。LLE认为,在高维中间中的任意一个样本点和它的邻居样本点近似位于一个超平面上,所以该样本点可以通过其邻居样本点的线性组合重构出来。我们将数据用LLE进行预处理,得到一致性系数矩阵和流形数据,再将其作为非负矩阵多视觉聚类的输入,对每一个视角数据进行非负矩阵的分解,再利用协同正则化对每个视角进行约束,找到最小化分歧的共享子空间,然后使用确保每个视图满足流形假设。算法流程如图1所示。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图