样本缺失值填补算法研究开题报告
2020-04-15 17:14:34
1. 研究目的与意义(文献综述包含参考文献)
研究的目的和意义
在各个领域的研究调查中,由于各种已知或者未知因素的影响,经常会导致数据缺损的情况出现。此时,由于残缺数据的存在,不仅会增加我们分析任务的难度,也会造成分析结果的偏差,从而降低统计工作的效率,因此如何考虑这些残缺数据的影响就变得及为重要了,为了有效地解决这个问题,本课题采用了一种处理方法,那就是将残缺的数据进行填补,形成完整的数据集。
缺失值在许多研究领域都很常见但又难以解决,比如人工智能,机器学习等研究领域。理想情况下,数据集中的每条记录都应该是完整的。然而,存在不完整的、含噪声的数据是大型的、现实世界数据集的共同特点。在各种实用的数据库中,数据缺失的情况经常发生甚至是不可避免的。造成数据缺失的原因也是多方面的,主要可能有下几种:
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
研究目标
该课题掌握均值填补,最近邻填补等缺失值算法,通过编程实现这些算法并对各个算法进行对比。
研究内容
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付