登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 信息工程 > 正文

混合数据离群点检测方法研究开题报告

 2022-01-13 22:08:13  

全文总字数:2907字

1. 研究目的与意义及国内外研究现状

离群点检测(outlier detection),也可被称为异常检测,是数据挖掘领域中重要的分支。其主要任务是检测得到数据特征与其他数据存在明显差别的异常数据。随着计算机网络技术、通讯技术和数据库技术的迅速发展,各个行业领域都累积了呈指数式增长的海量数据,对大数据的处理成为研究的热点。传统的数据处理的方式模式单一,处理性能较低且处理高维数据的时间复杂度较高,已经难以有效的从海量数据中挖掘有用的知识。如何更有效的从海量数据中挖掘出信息,是目前摆在研究人员面前的一大问题。通过离群点检测可以有效地对异常数据进行分析,例如用于银行信用卡的欺诈行为检测、网络检测、气候异常检测、金融风险评估、检测框架缺陷、时间流序列监视等许多其他领域也有着重要的使用价值。通过对检测出的异常数据进行研究分析,往往能够获取大量能用于决策支持和趋势预测的有用的知识。因此,对离群点检测进行研究是相当有意义的。

国内外研究现状

离群点检测作为数据挖掘中的一个重要研究课题,在学术界和应用领域都得到广泛的关注。并且,随着科技的不断进步,信息化的逐步提高,国内外的领域专家与学者针对不同的数据源、不同的应用需求提出了许许多多不同的离群点检测方法。下面根据离群点检测的方法分类来介绍近年来关于离群点研究的进展。

胡彩平在《一种基于密度的局部离群点检测算法 dlof》提出了一种判定离群数据对象的dlof算法,采用加权的距离来计算密度,通过信息熵得出数据的离群属性,给离群属性大的数据对象以大权重,提高了检测的准确度。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

本文以混合数据离群点检测方法为研究背景,介绍了关于数据挖掘、离群点及检测方法的理论内容,并针对一种基于密度的DBSCAN聚类算法对混合数据的离群点检测方法展开研究

3. 实施方案、进度安排及预期效果

本次设计以混合数据离散点检测方法为对象,利用dbscan算法,主要运用了对比分析、案例分析的方法对几种常用的离散点数据处理防范进行了介绍,并对该方法在实际应用中的优缺点进行了评价。

2018年12月15日前下达任务书;

2019年1月8日前撰写开题报告;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]袁钟,张贤勇,冯山.邻域粗糙集中基于序列的混合型属性离群点检测[j].小型微型计算机系统,2018,39(06):1317-1322.

[2]陈瑜. 离群点检测算法研究[d].兰州大学,2018.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图