登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 任务书 > 计算机类 > 计算机科学与技术 > 正文

基于hadoop的聚类算法的实现任务书

 2020-05-14 22:14:32  

1. 毕业设计(论文)的内容和要求

hadoop是一个分布式系统基础架构,由apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。在hadoop中实现了google的mapreduce算法,它能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点上执行或重复执行。此外,hadoop还提供一个分布式文件系统用来在各个计算节点上存储数据,并提供了对数据读写的高吞吐率。

要求基于hadoop实现聚类算法,主要完成如下工作:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 参考文献

[1]万川梅, 谢正兰.hadoop应用开发实战详解[m]. 北京:中国铁道出版社, 2013.

[2]tom white. hadoop 权威指南[m]. 清华大学出版社, 2010.

[3]王宏宇. hadoop 平台在云计算中的应用[j]. 软件, 2011, 32(4): 36-38.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)进程安排

起讫日期

设计(论文)各阶段工作内容

备 注

12.9-12.15

学生与导师见面,布置学生查阅文献确定选题

2015年

12.16-1.4

导师下达任务书、攥写开题报告

2016年

1.4-1.15

检查、修改开题报告

1.15-2.4

学习Hadoop相关知识

2.5-3.2

学习Map/Reduce相关知识

3.3-3.24

建立一个Hadoop集群

3.25-4.16

实现基于K-均值的聚类算法

4.17-5.8

实现基于Hadoop的K-均值聚类

5.9-5.16

算法测试以及最后修改

5.17-5.25

攥写论文

5.26-6.5

论文修改、打印、装订、答辩

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图