基于Hadoop的大数据存储策略研究任务书
2020-02-18 15:28:44
1. 毕业设计(论文)主要内容:
大数据时代,全球数据量呈现爆炸式增长。
面对海量数据的存储需求,云存储等大规模分布式存储系统应运而生,有效地整合和利用分散在网络上的各个节点资源,满足用户随时随地存储、访问和分享数据的需求。
hadoop分布式文件系统(hdfs)是一个开源的、面向大数据的、适合运行在通用硬件上的分布式文件系统。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。(2)完成开题报告及任务书。
(3)完成hadoop的安装以及hdfs运行环境配置,设计并实现数据分发、副本存放、节点修复、数据读写等多个存储系统模块。
(4)完成系统的整体测试与性能分析。
3. 毕业设计(论文)完成任务的计划与安排
(1)第1-3周:查阅相关文献资料,明确研究内容,了解研究所需的理论知识。确定方案,完成开题报告。(2)第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用;
(3)第6-9周:实现系统各功能模块设计。
(4)第10-12周:完成系统测试和性能分析。
4. 主要参考文献
[1] 马东, 邵维专. 一种hdfs元数据分级存储策略[j].现代计算机, 2018, (8): 26-30.[2] ap. hadoop环境下大数据存储技巧[j]. 电脑知识与技术-经验技巧, 2017, (5): 109-110.
[3] 李娜,黄平运. 云计算环境下数据安全存储关键技术研究[j]. 现代信息技术,2017, 1(1):219-220.
[4] zhou w, feng d, tan z, et al. improving big data storage performance in hybrid environment[j]. journal of computational science, 2018, (26): 409-418.