基于粗糙集属性约简的多分类器集成系统研究开题报告
2020-05-28 06:59:04
1. 研究目的与意义(文献综述包含参考文献)
分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型,即我们通常所说的分类器(classifier)。传统的分类方法通常只能使用某种单一的特征描述和特定的一个分类器来进行分类。而不同的分类算法可能得到不同的分类性能,且没有一种分类算法能对所有的应用都取得较好的结果。因此同时使用多个分类器可能提高分类精确性,即多分类器集成就是通过融合大量的基分类器来获得更好的分类性能。集成学习是利用多个学习机来解决同一个问题的一种方法,其目的就是进一步提高学习系统的泛化能力。目前,除了上述线性组合方法外,非线性集成方法主要有粗糙集方法等。像周志华等人采用的遗传算法选择合适的分类器进行集成。
1.目的以及意义
选题的目的:为提高优化多分类器系统的性能,本文提出了一种多分类器集成方法mcs_ars。该方法首先利用样本子空间和粗糙集子空间对训练集进行划分来构建差异性基分类器,然后构建分类器结果表,最后利用决策结果之间的相似关系进行多分类器集成。实验结果表明,相较于经典的集成方法,本文方法可以获得更高的分类准确率。
2. 研究的基本内容、问题解决措施及方案
课题研究内容
理解数据挖掘和知识发现的基本概念,了解粗糙集的提出与发展、现状和发展前景,通过深入理解粗糙集理论及其相关定义和概念、属性约简和求属性核的方法,提出算法使用c语言程序的具体实现,之后再研究粗糙集理论在人们实际生活中具体应用的可行性,并通过选取人们生产、生活中很具体的几个例子,反复试验,将试验结果与标准数据进行比对,比对无误将说明该理论确实是实际可行的、有用的和可靠的,该理论的应用也是同样可以推广到诸多其他领域的。
课题研究方法