一种改进的随机森林分类器,用于多类分类外文翻译资料
2022-11-15 15:45:25
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
一种改进的随机森林分类器,用于多类分类
作者链接打开覆盖面板Archanaensp;Chaudharyensp;aSavitaensp;Kolheensp;bRajensp;Kamalensp;c
显示更多
https://doi.org/10.1016/j.inpa.2016.08.002获取权利和内容
根据知识共享许可
抽象
本文提出了一种改进的RFC(随机森林分类器)方法,用于多类疾病分类问题。它由Random Forest机器学习算法,属性评估器方法和实例过滤器方法组合而成。它旨在提高随机森林算法的性能。性能结果证实,所提出的改进的RFC方法比随机森林算法表现更好,多级花生病数据集的疾病分类准确度提高了97.80%。改进RFC方法的性能在五个基准数据集上测试其效率。它在所有这些数据集上都表现出卓越的性能。
关键词
花生病
改进-RFC
机器学习
多级分类
1 。介绍
疾病,害虫和不均匀的降雨是作物减产的重要原因。许多国家都记录了病虫害造成的重大作物损失ensp;[1],[24],[38]。由于某些疾病导致的产量损失达到70%[14]。由于疾病造成的经济损失程度远远超过报告的全球产量损失6亿美元[28]。花生(Arachis hypogaea L.)是一种重要的油籽作物和蛋白质的重要来源。据报道,超过五十五种病原体和病毒会影响花生作物。有些疾病分布广泛,造成更多的经济损失,而其他疾病仅限于分配,目前认为不合理。正确诊断疾病是规划疾病智能系统的第一步[27]。植物部分的症状以及适宜的气候条件可用于识别大多数疾病[43],[44],[45]。
分类是机器学习领域的基本任务。它是对实例的类别标签的识别,通常由数据集中的一组属性(特征)描述。分类的目的是准确地预测属性值已知的实例的类标签,但类的标签是未知的[12]。机器学习领域的分类任务是二进制,多类,多标记和分层。疾病诊断是一个涉及高维数据集的多类分类问题。具有疾病诊断问题的分类任务是将疾病标签分配给特定实例。高维数据集具有存在不相关或冗余特征的问题,这通常会降低机器学习算法的性能。因此,使用合适的特征选择方法对于处理高维数据的分类任务变得至关重要[11],[21]。
几种机器学习算法成功地用于分类和预测的问题[2],[30]。机器学习算法用于识别奶牛养殖领域的乳腺炎[26],[35]ensp;和Estrus [31],预测牛奶的产量[29]并找出剔除的原因[30]ensp;。的机器学习算法应用于作物病害叶褐斑病,稻瘟病,鞘腐病,细菌性的准确识别疫病,褐斑病