登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 计算机类 > 计算机科学与技术 > 正文

基于层次策略的聚类算法实现与分析开题报告

 2022-01-13 21:34:22  

全文总字数:2786字

1. 研究目的与意义及国内外研究现状

随着计算机技术与互联网技术对人类生产生活的应用,大量的数据也随之产生。如何利用这些数据更好地推动和改进人类的生产生活方式成为具有实际意义的需求,数据挖掘技术应运而生。数据挖掘,就是从大量无序的数据中发掘隐含的、有效的、有价值的、可理解的模式,比如规则、表、树、图等,进而发现有用的知识,并得出时间的趋向和关联,为用户提供问题求解层次的决策支持能力。

聚类是数据挖掘的重要方法之一。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的而分类所要求划分的类是已知的。分类是基于标记的数据进行划分,但是生产生活中更多的是没有标记的数据,聚类就是对这些没有标记的数据进行统计分析,进而发掘这些数据潜在的规律与价值,所以聚类具有很强的现实需求和实际意义。

层次聚类是聚类算法的一种,因为在聚类过程中采用层次结构的思想而得名。层次聚类算法相对其他的聚类算法而言,有比较优秀的特征与性能。基于层次的聚类算法大部分可伸缩性良好,大部分可以适用于任意形状的数据,对于“噪声”数据都表现良好。基于层次的聚类算法在对本身具有层次结构的数据进行聚类时表现相当好,这种层次的数据选用层次聚类最为合适。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

(1)本文先对数据挖掘进行概述引出聚类分析,再对聚类分析中的层次聚类进行概述。

(2)针对层次聚类的发展,对著名的层次聚类算法:agnes、birch、cure、rock、chameleon进行原理分析与对比。

(3)实验论证了层次聚类算法的实际效果,并对实验结果进行分析,并对比层次聚类算法的效果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 实施方案、进度安排及预期效果

(1)实际研究过程中采取先收集资料,阅读大量文献,了解研究背景,然后才是确定研究角度与策略,接着基于研究完成实验并对实验结果进行分析,最后总结整个过程。

(2)进度安排,2019年1月收集完资料,2019年2月确定研究角度与策略,2019年3月完成实验,2019年4月中旬完成论文。

(3)预期效果:能按时保质保量地完成既定论文研究与撰写。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] xu r, wunsch d (2005) a survey of clustering algorithms[j]. ieee trans neural netw 16:645–678

[2] dongkuan xu(2015) yingjie tiana comprehensive survey of clustering algorithms[j].ann. data. sci. (2015) 2(2):165–193 doi 10.1007/s40745-015-0040-1

[3] zhang t, ramakrishnan r, livny m (1996) birch: an efficient data clustering method for very large databases[j]. acm sigmod rec 25:103–104

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图