一种改进的k-means聚类算法文献综述
2020-05-02 17:08:53
K-means算法是最常用的一种基于划分的聚类算法,由Steinhaus 1955年、Lloyed 1957年、Ball amp; Hall 196由Steinhaus 1955年分别在各自的不同的科学研究领域独立提出。但该算法需要事先指定K值,有随机选择初始聚类中心等的缺陷,从而影响了K-means聚类结果的稳定性。
Aristidis Likas等人提出在多项式时间内最小的值和对应的聚类划分能够得到,并于2002年提出了全局最优的K-means聚类算法。
刘涛等人提出了基于半监督学习的K-means聚类算法的研究,用粒子群算法以及迭代搜索的思想找到优质的聚类中心进行聚类。
李飞等人提出了基于遗传算法的全局搜索能力来解决初始聚类中心选择的敏感性问题。
K-means聚类算法被提出来后,在不同的学科领域被广泛研究和应用,并发展出大量不同的改进算法。虽然K-means聚类算法被提出已经超过50年了,但目前仍然是应用最广泛的划分聚类算法之一[1]。容易实施、简单、高效、成功的应用案例和经验是其仍然流行的主要原因。
影响K-means聚类算法性能的主要原因有:样本集中孤立点以及随机选择初始聚类中心而造成聚类结果的不稳定以及不准确。针对这种不足,本论文运用一种新思想,研究K-means算法的改进。经过改进的算法准确度高,聚类效果较好,能更好地应用于各个学科领域的研究。
{title}2. 研究的基本内容与方案
{title}(1)基本内容:
学习K-means算法的基本设计、完成程序的编码来实现相应算法。完成改进k-means算法的编程与实现。掌握K-means算法的核心思想,并提高自己的科研编程能力。
(2)预期目标:
对看K-means聚类算法进行初步的了解和认识,并实现改进的K-means聚类算法, 提升个人科研编程能力及文献编篡能力。