动态风险意识的OSPF网络的路由外文翻译资料
2023-01-14 14:16:28
动态风险意识的OSPF网络的路由
摘要载波网络的设计提供高可用性的通信服务。不幸的是,在失败的情况下,恢复机制的介入只有经过失败:行政长官不能防止交通流的某些影响。然而,经常有预警迹象表明,网络设备将停止正常工作。基于嵌入式和实时风险水平评估、主动的故障管理可以进行隔离故障的路由器的路由拓扑结构,从而完全避免对服务可用性的不利影响。我们的新方法使路由器来预防引导流量远离危险的路径时间调整OSPF的链路成本。在稳定性和可用性方面的后果估计的基础上的分析模型和模拟测量提出的主动自愈功能的预期收益。最后,该功能已被实现在一个实验原型,以有效吃了概念证明。
持续的需求为可靠的服务,推动网络运营商提供始终较高的服务质量(服务质量)和可用性保持竞争力。因为可用性是一个严格的承诺,网络运营商必须使用保护和恢复机制处理故障。保护可以恢复路径非常迅速,但由于需要消耗资源的闲置产能;而乐恢复可以更便宜,但产生较长的中断。此外,即使性能不同,所有这些机制的反应,因此不能完全屏蔽的作用对最终用户业务失败的影响。为了改善这种情况,我们研究了由内部网关协议提供IP恢复机制的延伸(IGP)如开放最短T路径优先(OSPF)和中间系统到中间系统(IS)。一个失败的OSPF收敛的结束意味着丢包的发生之间的时间,临时路由环路或路由黑洞,破坏了运营商的路由拓扑。事实上,回收机制只涉及故障发生后,只允许限制故障影响交易交通,但不能消除它完全。我们提出了一种互补的方法,消除这个缺点,预测失败的风险评估模块(内存),以取代缓慢的恢复机制。这允许完全消除故障发生率在交通上进行重新配置操作几秒钟前的故障。故障预测功能是前用提供的风险感知路由(RAR),动态调整链路度量引导车辆远离危险的网络元素,因此隔离故障才造成损害对交通。许多工程已经完成的故障预测任务,但他们没有兴趣如何正确地利用这样的信息。我们不同的是证明一个现实的方法来利用一个足总杯失败的预测,并对运营商的预期效益评估,以证明实施故障预测功能的网络设备的兴趣。
本文首先介绍了知识产权恢复及其相关的作品在美国证券交易委员会。二,然后通过描述在美国证券交易委员会的自我修复功能。生病了,并解释了其与OSPF公关整合协议在美国证券交易委员会。第四部分是对美国证券交易委员会的评估。v定义分析模型来衡量我们的机制对网络的可用性和路由稳定性的影响性。随后,该模型对网络实例和仿真实验比较分析了SEC的实例化。为了完成秒。七描述了一个实验原型设计设置验证在真实的网络环境和SEC的概念的可行性。第八章结束本论文的结论性发言。
语境与相关工作
目前的故障管理系统,特别是在电信基础设施,处理中断的反应方式,因为它是最容易的方式来解决这个问题。但是一种反应性的方法包括只有在失败发生后才行动,因此它永远不允许移除所有的失效后果。事实上,目前的IP恢复必然导致丢包只要OSPF收敛过程没有结束。这个过程包括4个主要阶段[ 1 ]:故障检测和故障检测时间,链路状态通告(LSA)驱驱为LSA时间短测试路径优先(SPF)计算与SPF计算时间,和路由表和转发表更新表的更新时间。由此产生的收敛时间在OSPF的考评克拓扑结构是不一致的计算如下:= 。由于它的停机时间,由于收敛过程的故障的停机时间是几秒钟的顺序,这是氮服务质量流量可接受的服务。
以前的作品都集中在减少这些阶段的持续时间。特别是,一个著名的问题,涉及的故障检测时间[ 2 ]短定时器的设置导致网络的路由不稳定性和长久增加流量损失。稳定约束规定的经营者设置合理的计时器的一秒钟以上,在快速恢复的费用。虽然一秒故障检测是通过使用链路层检测或硬件实现BFD协议在数据层面解决,这些机制并不总是可用的,最重要的是,不要在控制平面中,不允许检测到软件故障。不幸的是,软件故障已成为非常重要的[ 3 ],无视这样的失败是不可能的了。在其他的硅德,IP快速重路由(IP FRR)技术[ 4 ]提供了一种方法来绕过( )前一定备份路径计算的延迟,但检测时间仍然是最影响和艰难NG的因素。
我们正在研究一个新的,互补的方法,通过增加一个预防机制,以目前的技术。这种积极的方法实时评估失败的风险,并创建一个时间窗口在此,可以采取预防措施,例如调整路由行为,以避免即将到来的故障的不利影响。以往的研究已经提出的路由功能考虑到失败的风险。在[ 5 ]中长期链路故障统计被用来选择最佳路径能够满足特定的可用性。我们从这些不同的建筑作品动态估计网络元件故障的实时计算风险。在先前的文章[ 6 ]适用于GMPLS恢复探讨后,本研究关注的纯IP路由这是一个更不可控的环境。观察设备的健康,使适应的路由方案,结合故障的风险的演变。
使用risk-assessment自愈机制
尽管所有的努力,以提高网络基础设施的可靠性,其固有的复杂性使得故障不可避免。故障的起源已经演变[ 3 ],但一些网络监视器荷兰国际集团的技术使他们的一些预测:故障跟踪,症状监测,错误报告或未被发现的错误审计[ 7 ]。这些技术依赖于多个参数的监测在当前网络管理器中已可使用的网络设备。
网络故障的起源可以是多种多样的,可以通过适当的手段来检测。首先,一个可以引用硬件传感器,如温度的处理单元,电源电压,我信息可以通过高级配置和电源接口(ACPI)或硬盘驱动器状态指示的自我监测,分析和报告技术(SMART)。我们也有网络接口中的比特差错率或丢包率等网络性能指标。和软件故障,这已经成为主要的[ 3 ],可以检测到的各种症状如异常日志、系统错误,未锁定文件,文件描述符泄漏,数据损坏,或不正常使用的CPU、内存和I / O最后,与外部通信外部系统,如入侵检测系统(IDS)或网络管理系统(NMS)还设想。
观测数据的基础上,提出了风险评估模块的通用的自主网络架构(假名)[ 8 ] [ 7 ]使用机器学习技术,如贝叶斯网络,时间序列分析是,支持向量机或半马尔可夫作出预测,尽可能准确。这一风险的信息然后传播为了创建一个时间窗口前未能preventivel及时的交通,以避免危险的链接,这将阻止最终用户的流量从失败的后果。要主动路由的流量和避免危险的链接,可以增加缓解OSPF成本这些链接以使链路安全性较好。由于网络配置的备用容量和尺寸支持失败[ 9 ],这不会造成拥堵问题但只预测几分钟后,如果发生故障发生。
任何错误的检测会引发无用的路由从而将创建网络不稳定。因此,故障预测必须是可靠的,以避免这种行为。本文不研究在评价自己的失败预测的过程中,由于许多研究都集中在这方面的努力和良好的预测可以实现。我们需要的是识别特征在参与在线故障预测过程的不 同时段的故障预测分析(见图1)。检测失败风险的时间。是数据窗口时间而失败的预测可以用来预测即将到来的故障数据。被定义为预测和故障事件之间的最小时间段的时间段。警告时间设置主动式自愈操作所需的时间,它总是小于。预测期是一段期间,预测被认为是有效的。因为最好的辉吸引预测方法的文献考虑值的至少几分钟[ 10 ],我们更喜欢不受限制的故障预测方法和考虑的保证一小时。
失败的预测性能的特点是不可预知的故障(FN)和错误的预测(FP)。精度和召回是通常的指标,召回率是正确预测的故障(总P)的实际故障总数的比例。精确性是正确识别失败的比率的所有预测的数量。提出了在T他失败的预测领域允许超过90%的召回率和80%的精度[ 10 ]。作为一个结果,80%被选为最具竞争力的价值,这两个指标。
精度和召回,以及预测期间,在美国证券交易委员会的输入参数。V和VI,用于分析需要使一个有用的风险意识的常规故障预测性能NG。事实上,我们必须考虑的不确定性的故障预测,可以做召回和精度。但在评估我们的机制之前,我们需要详细说明它的运作。
动态risk-aware OSPF链路成本分配
什么是提出的,是一个风险感知路由模块依赖于一个连续的计算和评估失败的风险开发前的预防胎膜早破的实际失效时间窗铂流量,以避免危险的环节,并在这方面减轻失败的后果,最终用户的流量。在OSPF网络,可以进行这样的调整主动路由OSPF链路成本等交通流可以避免风险的一种方式。许多研究集中他们的努力,提出了故障预测机制,但忽视了如何利用这些信息只是作为重要的。因此,我们选择通过提出一个务实的和非常快速的激活的主动机制,利用故障预测和评估计划修复这一缺陷泰德收益,以及与之有关的约束的故障预测任务。
我们的方法的优点是双重的。首先,它不需要任何标准化的过程,它是完全兼容目前部署的协议,通过局部修改链接成本和人才资源的开发NG OSPF的驱油能力(潜在的所有链路状态协议)来宣传新的风险增强方案对整个网络的流量。其次,它是至关重要的,而不是改变使用的网络运营商目前的做法来设计他们的网络,通过配置环节成本之前,为了优化带宽、延迟、负载平衡、预防干预等。这是一个很短的时间内被限制在一个很短的时间内检测到失败的重要风险,并且只关注的权重值的设置的危险链路。我们的方法允许结合operator-d界定指标大部分时间和风险水平的指标只有在预期失败的情况下,权衡和优先级可以通过算子定义的策略。该方法包括在保持不他成本的可靠链路的低(即优先路由),并增加显着的成本的风险的链接,以引导流量远离他们走向更可靠的低成本路径。TH在目的,风险的链接的成本必须被分配在许多限制下,先前已详细的[ 11 ]。这种风险价值等于
这可能与OSPF最高的度量(即2),网络的拓扑结构和初始投资成本最高的链路度量(连接区)的初始度量风险环节我配置的操作。l有助于,一旦风险成本的值已被计算,在OSPF的链路成本从初始配置切换到风险值充电过程应平稳和迭代的方式做它在[ 12 ]为了避免路由环路描述OSPF收敛过程。接下来,我们开发了一个分析模型描述的机制特性。
五、分析建模
符号
网络被建模为一个有向图,其中的一组节点(路由器)和一组定向的边缘(链接)。我们定义了一套由网络传送的交通流,其中每一个交通流是由其入口节点的定义,其目的节点,其吞吐量。每个流量、路由协议(OSPF或IS-IS)所反对的子集定义的最短路径过境路由器保持有序列表。用RAR的机理,对节点n故障预测后,新的标准配置,更新一些最短路径也指出。这是研究没有考虑入口或出口节点失效的影响,因为没有办法保护或恢复在这样的情况下的交通流。在实际的网络中,这样的情况是由多归巢。每个节点具有故障的平均时间之间同时进行。对于风险感知建模,如在美国证券交易委员会。被定义为每个节点的值。变化的时间这些参数不考虑。对于一个平稳遍历过程,一个节点的概率是在一个失败的状态是:
当被认为是相同的路由器的情况下,考虑到故障概率,在氮中的所有这些参数的符号的依赖关系可以省略。对于每一个流程,当一个中转节点是失败,流程是恢复后的收敛过程,持续时间,如在美国证券交易委员会所提到的。
II.rar机制产生一个合理的振荡,不影响网络的数量,即使精度性能差。除二型拓扑结构差精度差的情况下性能达到一个振荡的日子,所有的人的情况下保持20个月的振荡的,任何网络运营商是非常可以接受。而回忆价值观有重要影响对RAR格式的可用性,性能,精度值的影响几乎可以忽略不计的自路由瓣保持相对封闭。超越这些图4。网络影响MTBF C缺乏性。参考条件的结果,是看着RAR行为一拓扑有趣(C)在故障率的演变和MTBF是最影响参数。图4显示了MTBF影响每个策略的无效性,虽然失败率提升性能的差异,各机制之间的比例保持不变。仅召回发生率N的可用性,这也是为什么RAR机制仅以三的曲线表示。图5为图5。对网络路由皮瓣影响MTBF。
重点研究了路由瓣率的变化,从而导致故障率的变化。在所有的配置、路由抖动增大很多时,平均无故障时间小于3000小时。它是注意到故障预测的性能起着重要的作用在路由瓣数量却大多是预测量也有用(TP和FP)是负责击溃皮瓣变化。这个数字可以开始识别限制模式。事实上,使用精度高,故障率高,意味着一个路由皮瓣率,运营商不准备接受。然而,即使网络的尺寸处理失败,大量的故障预测可产生拥塞,不是由我们的模型量化,也将制约的RAR机制利用模式。因此,只有仿真评估可以找出这个问题。
模拟实验来修复。关于失败的预测,预期的失败均选择以下查全率和虚假的预测均产生在模拟时间达到目标精度。使用相同的参数作为网络的拓扑结构和流量矩阵的分析评价,MTBF,MTTR,召回的影响,精度和ATP已使用7试验与模拟时间等于5 *分析(平均无故障时间 MTTR)。使用相同的配置比图2的分析实验,仿真结果与信心区间99%示于图6。这些模拟结果与分析结果的充分性,这支持了我们提出的分析模型的有效性。
但仿真实验的真正目的是要找出拥塞时出现的情况。什么是观察,对于三的拓扑结构,即平均无故障时间降低到1000豪你总是意味着拥挤。作为三的拓扑结构也有类似的行为,只有拓扑C是显示在图7,可以看出一个拥塞问题,1000小时的MTBF与三配置具有最低的精度性能标准(20%)。
当多个路由拥塞出现重叠和超过网络的能力,它发生在故障率变高或当预测期太长。图8说明率的问题与网络乙,这是最影响的拓扑结构。交通拥堵首先表现为精度不高,但也有其他情况,但最重要的信息该图是使用ATP应该被限制在一个小时的最大为了保存生成的iperf的研究。图9显示了不同的结果,与没有RAR M机制。而OSPF生成一个关于延迟服务中断,RAR机制允许完全删除从用户角度失败的影响。
我们还运行实验的高清视频流量。没有风险感知的路由机制,可以观察到在视频流中的中断,而激活的机制允许观看的合作完整的视频序列不中断。图10是一个实验的结果。像前面所强调的,失败是显然只有OSPF可见而RAR激活使T被失败所干扰。
结论
本文不同于一般的主动自我修复的贡献,专注于恢复力的行动和它的
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[153402],资料为PDF文档或Word文档,PDF文档可免费转换为Word