多标签数据特征选择的降维方法研究开题报告
2020-02-20 10:23:55
1. 研究目的与意义(文献综述)
1.1课题研究的目的及意义
随着大数据近些年来兴起,许多研究对于数据的研究也越来越深。原来,我们对于一个实例仅仅只是与一个标签相关联,但是,随着我们对于数据挖掘需求的加深,在某些应用当中,一个实例可与多个标签相关联。例如,一个文档可以有多个主题,一段基因可以生成多个蛋白质,一张图片可以包含多个场景。事实上,多标签学习在生物信息学、多媒体内容注释、信息检索和网络挖掘等许多应用中经常遇到。
多标签数据特征选择的降维方法的目的是通过标签间关联性降低输出标签空间维度,优化模型,并建立一个能够预测来自给定标签集的位置实例所对应的标签子集的函数。其中,传统监督学习是多标签学习的退化,是多标签学习将每个实例对应的类标签数量限制为一。
2. 研究的基本内容与方案
2.1研究(设计)的基本内容、目标
多标签学习是近些年来兴起的新兴内容,它与之前的标准监督学习不同,许多在标准监督学习的经典算法不能应用到多标签学习当中来。最重要的原因是因为标签数量由一个变为多个,那些仅仅对于单个标签的经典算法不能处理多标签所带来的标签间关联性、算法评估标准等复杂问题。因此,本文的基本内容如下:
1. 学习多标签学习算法中有关标签关联性的各种算法,并利用标签关联性建立基本模型,并通过正则化来防止模型过拟合。
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
[1]z.-h. zhou and m.-l. zhang. multi-label learning. in: c. sammut, g. i. webb, eds. encyclopedia of machine learning and data mining, berlin: springer, 2017, 875-881.
[2]y. zhu, j. kwok, and z.-h. zhou. multi-label learning with global and local correlation. ieee transactions on knowledge and data engineering, 2018, 30(6): 1081-1094.