基于Hadoop框架的大数据挖掘开发任务书
2020-04-12 15:56:42
1. 毕业设计(论文)主要内容:
-
随着社交网络、电子商务、在线视频等新一代互联网应用的发展,大数据应运而生,hadoop框架是解决大数据挖掘开发的平台;
-
了解基于hadoop框架的大数据挖掘的mapreduce并行算法;
-
对大规模数据集,进行分析建模,采用分布式存储,实现分布式并计算,并对结果进行评价
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!2. 毕业设计(论文)主要任务及要求
1、查阅不少于15篇的相关资料,其中英文文献不少于3篇,完成开题报告。
2、完成不少于5000字的英文文献翻译工作。
3、收集相关的原始数据,并进行数据的预处理工作。剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!3. 毕业设计(论文)完成任务的计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
11-13周:编码和测试
14-15周:写论文,提交初稿,给老师检查,修改定稿,答辩。4. 主要参考文献
[1]蔡斌雷,任家东,朱世伟,郭芹.基于hadoop mapreduce的分布式数据流聚类算法研究[j].信息工程大学学报,2014,(4): 472-478[2]白云龙.基于hadoop的数据挖掘算法研究与实现[d].北京邮电大学,2011
[3]杨宸铸.基于hadoop的数据挖掘研究[d].重庆大学,2010
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付