Gossip算法及其实现开题报告
2020-04-07 08:41:45
1. 研究目的与意义(文献综述)
在过去的十年中,我们看到计算机之间的连通性发生了革命,并导致了从集中式计算到高度分布式系统的转变。例如,具有数百万台服务器的大规模对等(p2p)网络正在被用于或被设计用于分布式信息存储和检索,并且硬件的进步正在导致我们的物理环境中传感器网络的规模增加到由数十万个小型传感器节点组成。这种大规模分布式系统的应用程序具有两个个突出的特性,可以将它们与传统的集中式或小型分布式系统区分开来。
首先,大规模分布式系统的动态往往明显不同。例如,在p2p网络中,大量机器通常处于可随时加入或离开网络的状态中(如用户电脑关机)。传感器网络通常也会涉及部署在不稳定的环境中(例如战场),容易使得传感器故障。因此,整个系统必须具有高度容错性,因为节点和链路故障或临时通信中断是常态而非例外。
第二,由于系统规模庞大,整个网络(或其中很大一部分的节点)的数据集合函数的值通常比单个节点上的数据更重要。例如,在具有温度传感器的传感器网络中,我们通常对一个区域中的所有传感器测量的平均或中值温度更感兴趣,而不是单个传感器上的单个测量;在p2p系统中,我们可能对文件的总数,存储的文件的平均大小,或有关机器磁盘上可用空间量的分位数感兴趣。同时,通信带宽通常是限制节点间数据交流的重要障碍,因此计算聚合应该只涉及小型信息的交换。特别是,在一个给定节点上收集所有节点数据的任何协议都会在该节点上产生通信瓶颈或消息爆炸。
2. 研究的基本内容与方案
① 1 基本内容:
利用gossip算法计算类p2p网络上全部或部分节点的可共享文件数量的总和、平均、最大和最小数目,分析算法的收敛性和收敛速度。
② 2 预期目标:
3. 研究计划与安排
1. 3月1日到3月15日:理解毕业设计要求,收集、查阅相关资料后,完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
2. 3月16日到4月12日:完成系统的框架和方案设计,完成已有先进算法的测试与评估,熟悉算法的实现过程与基本原理,为后面的算法改进做前期准备工作。
① 3. 4月13日到5月15日:进行算法改进工作,对算法实现进行编码、调试、测试等工作。撰写并修改毕业论文。
4. 参考文献(12篇以上)
[1]d.kempe,a.dobra, and j.gehrke. gossip-based computation of aggregate information, inproc. of the 44th annual ieee symposium on foundations of computer science(focs’03), 2003
[2]m.bawa,h.garcia-molina, a.gionis, and r.motwani. estimating aggregates on apeer-to-peer network. technical report, stanford university, 2003. http://dbpubs.stanford.edu//2003-24.
[3]发布/订阅系统中gossip路由算法的设计及实现[j]. 郭伟,秦华旺. 通信技术. 2016(09)