运维环境中时序数据异常检测方法研究与实现开题报告
2020-04-12 16:03:17
1. 研究目的与意义(文献综述)
1.1国内外的研究现状分析及背景
随着互联网特别是移动互联网的高速发展,web服务已经深入到了社会的各个领域,即人们使用互联网进行搜索、购物、付款和娱乐等等。因此,保障web服务的稳定已经变的越来越重要。 服务的稳定性主要靠运维来保障,运维人员实时监控各种各样的运维数据。因为运维数据如果发生异常,往往意味着与其相关的应用发生了问题。其中,关键性能指标(key performance indicator,kpi)是实时判断web服务是否稳定的重要风向标之一,一直受到广泛的重视。通过算法分析真实运维环境中的kpi等时间序列数据,判断系统是否出现异常行为,保证系统稳定运行,这同时兼具商业价值和科研价值。
目前国内外的研究现状中,对于时序数据的异常检测,由于数据的特征不同且存在各种各样的曲线类型,且数据维度也存在单变量和多变量的区别,目前存在针对于各种时序数据特征的机器学习异常检测算法,可以分为以下类型及对应存在的解决办法:
(1)针对周期型时序数据的异常检测算法:这种数据有规律地周期性波动,可以使用时间序列分解算法,这两种时间序列分析算法,就是根据有序随机变量或观测得到的有序数据之间相互依赖所包含的信息,用概率统计方法定量地建立一个合适的数学模型,并根据这个模型对相应序列做出预报或进行控制。
2. 研究的基本内容与方案
2.1基本内容
本次研究设计主要是针对运维环境中的kpi时序数据做异常检测,通过对各种各样的kpi时序数据的了解和特征提取来设计一个通用的异常检测系统,最后再通过计算f-score来分析和评估异常检测结果。
具体内容如下:
1) 了解kpi时序数据、异常检测的等概念和技术;
3. 研究计划与安排
(1)2018/1/14—2018/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2018/2/23—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
(4)2018/5/26—2018/6/6:准备答辩。
4. 参考文献(12篇以上)
[1] extreme value theory: siffer a, fouque p a, termier a, et al. anomaly detection in streams with extreme value theory[c]//proceedings of the 23rd acm sigkdd international conference on knowledge discovery and data mining. acm, 2017: 1067-1075.
[2] liu,s.,wright,a. hauskrecht,m.:onlineconditional outlier detection in nonstation ary time series in flairs conference (2017).
[3] laptev n,amizadeh s, flint i. generic and scalable framework for automated time-series anomaly detection[j].2015:1935-1947.