多视角特征选择的降维方法研究开题报告
2020-04-13 17:06:55
1. 研究目的与意义(文献综述)
1.1课题研究的目的及意义
在客观世界的许多实际应用中,通常会产生大量的数据信息,而这些数据具有多种的形式和来源,形成了具有多样维度和关联的数据集。这些数据被称为多视角数据。通常,多个视角为数据本身提供了相互关系上的互补或相容的信息。例如在生物计算、医学图像、信息检索等领域。这些领域的产生的信息,如文本、图像、视频。这些领域产生的高维度的数据之间的相关性往往很低或者存在一定的冗余。
降维方法一直是机器学习领域的热点研究问题,特征选择是降维方法的主要方法。相较于特征提取,特征选择方法没有改变样本特征的表示方式,而是找到一个最大限度保留原本特征集的信息的特征子集,可解释性更强。由于多视角数据对某类数据中的每一个样本从不同的视角进行了描述,呈现为对样本的多个特征集合的表示。这些特征的集合从不同的角度描述了某类数据的不同的属性和特点。通过利用多视角数据的这些特点,进行特征选择,剔除与数据分析任务无关和冗杂的特征,降低数据的维数、减少在训练模型和学习任务的时间耗费、提高学习性能。
2. 研究的基本内容与方案
2.1研究的基本内容、目标
通常,降维方法和多视角数据一直是机器学习领域的热点研究问题。多视角数据的分析的第一步为降低数据的维度以便随后的进一步分析和处理,而降维方法的基本手段是特征提取和特征选择,特征选择相较于特征提取有更好的可解释性。因此,本次研究的主要内容如下:
1. 学习处理多视角数据的降维方法的各种算法和算法特点,对特征选择的算法的结构和框架进行阐述,针对多视角特征,采用非监督学习、自适应学习、半监督学习等方法实现多视角特征选择;
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
[1] l. du andy.-d. shen. unsupervised feature selection with adaptive structure learning. inkdd, pages 209–218, 2015.
[2] m. qian andc. zhai. unsupervised feature selection for multi-view clustering on text-imageweb news data. in cikm, pages 1963–1966.acm, 2014.
[3] m. qian andc. zhai. robust unsupervised feature selection. in ijcai,2013.