基于Hadoop的分类算法的实现开题报告
2020-05-16 20:19:26
1. 研究目的与意义(文献综述包含参考文献)
1.课题背景 今天,互联网的应用、商业智能数据分析、科学数据处理等具有海量数据挖掘需求的应用变得越来越普遍,如何高效管理、分析这些海量数据成为当前急需解决的问题:本文基于apache的开源云计算平台,运用分布式文件系统、并行编程模型以及并行执行引擎实现了数据分类挖掘算法:贝叶斯算法。
并运用设计好的分类器,做了简单的文本分类程序。
从结果分析来看,并行计算的优势得到了充分体现。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
一.研究目标 (1)建立一个hadoop集群,理解hadoop的各个组件。
(2)掌握map/reduce相关概念,以及hdfs文件系统的维护与监控。
(3)实现基于hadoop的分类算法。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付