基于神经决策森林的数据挖掘与分类任务书
2020-04-29 18:50:37
1. 毕业设计(论文)主要内容:
神经网络和决策树是人工智能和机器学习中最常用的两类数据挖掘算法。神经网络模拟人脑神经元的工作原理,通过“学习”,能够自适应地挖掘出数据中隐含的非线性关系,然而“黑箱结构”使得其可解释性差,即使是神经网络的设计人员也难以解释其工作机理。相反,决策树算法对数据特征进行分层次挖掘,可解释性强。同时,在数据挖掘中,决策树算法的结构能够天然地处理非数值特征,从而减少人工数值化带来的误差,而以多个决策树构建的决策森林能够进一步提高模型的泛化能力。本课题拟结合神经网络和决策树的各自优点,在决策树的每个中间节点中嵌入一个神经网络构建的分类超平面,形成神经决策树,进一步构建神经决策森林,并实现对多个uci数据集及图像数据集的挖掘和分类。
1、多平面近似支持向量机的概念、特性及数学模型的研究;
2、斜决策树的学习与研究;
2. 毕业设计(论文)主要任务及要求
1. 通过本课题的训练,培养学生动手能力、分析问题及解决问题的能力;
2. 翻译与本课题相关的英文资料(不少于3000中文字符);
3. 查阅文献资料,撰写开题报告(不少于5000中文字符);
3. 毕业设计(论文)完成任务的计划与安排
1-2周,完成开题报告和文献翻译,完成开题答辩;
3-4周,学习神经网络的概念、特性及数学模型;
5-7周,学习决策树及决策森林的概念、特性及数学模型;
4. 主要参考文献
[1] manwani n ,sastry ps, “geometric decision tree,” ieee transactions on systems, man, andcybernetics, part b (cybernetics) volume: 42, issue: 1, feb. 2012.
[2] ol mangasarian,ew wild, “multisurface proximal support vector machine classification viageneralized eigenvalues,” ieee transactions on pattern analysis and machineintelligence, volume: 28, issue: 1, jan. 2006.
[3] l zhang, pn suganthan, “oblique decision tree ensemble viamultisurfaceproximal support vector machine,” ieee transactions on cybernetics ,volume:45, issue: 10, oct. 2015.