登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 信息工程 > 正文

基于Rack模型的分布式存储系统研究文献综述

 2020-04-14 17:19:28  

1.目的及意义

1.1目的及意义

近年来,随着日新月异的新一代信息技术的发展,以及计算机在不同领域的普及以及应用,社会各行各业每天所产生的数据量以指数级的速度快速增长,例如淘宝每天产生的数据量超过50TB,百度公司每天处理数据量更是达到惊人的PB级,Google、Facebook和Amazon等公司应用产生的数据量更是达到PB甚至EB级。如何安全便捷的管理和使用海量数据成为各企业IT部门的一个首要问题,传统的存储方式成本过高、效率低下,无法满足用户需求的增长速度,因此它们将被新的高效智能的存储方式所取代,大规模分布式存储系统也因此应运而生。

分布式存储技术可以通过多种方式实现,一种典型的实现方式就是分布式文件系统,而基于Rack模型的分布式存储系统更是被大部分的公司所采用。分布式存储系统主要由如下几个特征:高性能、高可靠性、高可扩展性、透明性、自治性。在分布式存储系统中,数据通常需要先进行分片切割处理,然后再将分片处理后的数据块通过某些特定的数据存放策略,将数据分散地存储到系统中不同的存储节点中。由于完整的数据被切割分成了多个数据块,任何一块数据的丢失或者错误,都将影响用户数据读取的完整性和正确性。因此,分布式存储系统必须考虑合理的冗余存储模型,为每个用户的数据块提供多个冗余存储副本,以保证数据存储的可靠性和安全性。与集中的数据存储方式相比,分布式存储系统海量数据被存储在分布于不同地理位置的存储节点,充分利用存储网络的可用存储空间,同时降低数据被非法获取的可能性,提高存储系统的安全性。然而分布式存储系统中的单个存储节点并不可靠,通常容易发生数据失效和异常,对数据的可靠性服务造成影响。所以,本课题针对数据容易发生错误这一特点,研究如何设计适用于Rack模型的节点修复机制、Rack修复机制和数据重构机制,在基于Rack模型的分布式存储系统中,优化存储开销、修复带宽等重要系统性能参数,提升用户数据的完整性和可靠性。

1.2国内外研究现状分析

目前,很多的分布式存储系统都采用基于对象的存储设备管理磁盘数据块的分配,并提供对象的读写接口。文件对象的数据被分解为多个对象并以分布式方式分布在整个存储集群之中,系统内数据块以对象列表方式替换以简化存储系统数据层,而低级的数据块分配问题由各设备单独管理。因此,采用合适的数据分布策略,在分布式存储系统将数据分布于大规模的存储节点上是对象存储技术的基本问题。

张薇等人[8]针对数据密集型的存储系统,提出了一种可靠而高效的数据分离算法,可应用于对可生存性要求较高的分布式存储系统。该数据分离算法主要利用线性方法来进行数据分离,实验证明其存储量和运算都比较小。刘翔、汪海玲[9]研究了动态网络环境下基于分布式存储系统的数据存放策略,分析了现有的数据存放策略,提出了一种基于Gossip算法的放置策略,该策略在一定程度避免服务端节点故障造成的数据丢失,提高了系统的容错能力,保证了数据的可靠性。张玮琪等人[14]提出了一种基于权值跳表的分布式数据定位策略,以解决数据定位的效率问题。

目前的分布式存储系统一般采用增加冗余副本的方式来提升系统的可靠性,该技术的基本思想是为数据对象创建多个相同的副本,并把每个副本分散存储到不同的节点。当部分数据节点失效后,系统能够自动定位和读取有效存储节点中保存的数据块副本,实现用户数据读取。用户数据存储的组织结构方式,以及数据分块存储的复制策略,是数据复制技术的主要研究内容。其中,数据组织结构研究用户数据分块,及数据分块冗余副本在不同存储节点中的存储管理方式,而用户数据分块的复制策略,则主要研究冗余副本在不同存储节点中的存放数量,以及数据副本的创建时机和存放位置等问题。目前基于分布式存储系统的研究,最重要的还是怎样保证数据的完整性和可靠性,以及如何减小修复数据所需的带宽,以达到节约成本的目的。

{title}

2. 研究的基本内容与方案

{title}

2.1研究的基本内容

本课题主要研究如何设计适用于Rack模型的节点修复机制、rack修复机制和数据重构机制,并通过软件仿真分析系统的性能。

2.2研究目标

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图