基于K-means的聚类分析及改进开题报告
2020-04-13 13:16:12
1. 研究目的与意义(文献综述)
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类无论在商务领域,还是在生物学、web文档分类、图像处理等其他领域都得到了有效的应用。目前聚类算法大体上分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法、基于模型的方法以及模糊聚类。k-means算法是聚类算法中主要算法之一,它是一种基于划分的聚类算法。该算法有很多优点:
(1)是解决聚类问题的一种经典算法,简单、快速;
(2)对处理大数据集,该算法保持可伸缩性和高效性;
2. 研究的基本内容与方案
一、研究的基本内容及目标
1、掌握k-means算法的基本原理;
2、运用python语言实现k-means算法聚类;
3. 研究计划与安排
(2)完成开题报告 2018-01-20至2018-03-25
(3)收集资料,实施研究及完成初稿 2018-03-26至2018-05-15
(4)阶段性报告 2018-05-16至2018-05-20
(5)完成修改并定稿 2018-05-21至2018-06-05
(6)完成答辩 2018-06-06至2018-06-08
4. 参考文献(12篇以上)
[1] gonzalez t. clustering to minimize andmaximum intercluster distance[j]. 38(2-3):293-306.
[2] pal n.r., bezdek j.c.. ieee transactions on fuzzysystems: a publication of the ieee neural networks council[j]. 370-379.
[3] han jiawei, kamber m,范明, et al. datamining concepts and techniques[m]. 北京:机械工业出版社.