登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 电子信息工程 > 正文

K-均值聚类算法研究毕业论文

 2021-03-13 00:00:01  

摘 要

近年来信息技术快速发展,人们每天要处理的数据信息量都十分庞大。为了能快速从这些庞大的数据信息中提取出重要的信息,数据挖掘(Data Mining,DM)应运而生。而聚类分析作为数据挖掘的重要方法,在实际的应用中更是不可或缺。它在图像处理、市场评估、生物学等诸多领域都有研究应用。

聚类算法大概有以下几种分类:层次算法、划分算法、基于网格的算法、基于密度的算法和基于模型的算法。而本文所研究的算法就是划分算法中的K-均值聚类算法。文中先对聚类算法进行系统的介绍,而后针对K-均值聚类算法的原理及算法流程进行分析,并介绍如何通过MATLAB对算法进行实现。接着又通过结果分析了该算法的优点和存在的缺陷。针对其聚类结果易受初始中心影响的特点,对算法进行了改进。对初始聚类中心的选择进行优化,并将准则函数改为绝对误差函数,由此也在一定程度上消除了原算法对于孤立点和噪声点敏感性的缺陷。在算法的应用上,选择图像分割为应用方向,通过分别用原算法和改进后的算法用MATLAB实现对图像的分割处理。从结果来看,改进后的算法能更好的达到图像分割的效果。

关键词:聚类分析;K-均值聚类算法;数据挖掘;图像分割

Abstract

In recent years, the rapid development of information technology, people every day to deal with the amount of data is very large. Data Mining (DM) came into being in order to quickly extract important information from these large data sources. And clustering analysis as an important method of data mining, in the practical application is indispensable. It is in image processing, market assessment, biology and many other fields have research and application.

The clustering algorithm has the following categories: hierarchical algorithm, partitioning algorithm, grid-based algorithm, density-based algorithm and model-based algorithm. The algorithm studied in this paper is the K-means clustering algorithm in the algorithm. In this paper, the clustering algorithm is introduced systematically, then the principle and algorithm flow of K-means clustering algorithm are analyzed, and how to realize the algorithm by MATLAB is introduced. Then the advantages and disadvantages of the algorithm are analyzed. The algorithm is improved for the characteristics that the clustering results are susceptible to the initial center. The selection of the initial clustering center is optimized, and the criterion function is changed to the absolute error function, which also eliminates the defects of the original algorithm for the isolated point and the noise point sensitivity to a certain extent.In the application of the algorithm, the image segmentation is the application direction, and the image segmentation is realized by using the original algorithm and the improved algorithm respectively.From the results, the improved algorithm can better achieve the effect of image segmentation.

Key words: clustering analysis; K-means clustering algorithm; data mining; image segmentation

目录

第1章 绪论 1

1.1研究的背景及意义 1

1.2 国内外的研究现状 1

1.3 本文的研究内容及结构 3

第2章 聚类算法的分析 4

2.1聚类方法 4

2.1.1 聚类的概念 4

2.1.2 聚类的步骤 4

2.2 聚类算法的要求 4

2.3 聚类分析中常见的数据结构 6

2.3.1 数据矩阵 6

2.3.2 差异矩阵 6

2.4 聚类算法中的相似性测度 7

2.5 主要的聚类方法 8

2.5.1 划分聚类算法 8

2.5.2 层次聚类算法 9

2.5.3 基于密度的聚类算法 9

2.5.4 基于网格的聚类算法 9

2.5.5 基于模型的聚类算法 10

第3章 K-均值聚类算法 11

3.1 K-均值聚类算法 11

3.1.1 K-均值聚类算法简介 11

3.1.2 K-均值聚类算法流程分析 11

3.2 K-均值聚类算法的MATLAB实现 13

3.3 K-均值聚类算法结果分析 16

3.4 K-均值聚类算法的改进 17

第4章 基于K-均值聚类的图像分割算法的实现 19

4.1 图像分割概念 19

4.2 基于K-均值聚类的图像分割算法实现 19

第5章 总结与展望 22

5.1 总结 22

5.2 展望 22

参考文献 23

致 谢 24

第1章 绪论

1.1研究的背景及意义

随着时代的快速发展,数字信息化越来越贴近我们的生活科学技术的发展变化,使我们的工作、学习、生活也无不接触到大量的数据信息。面对信息数据大爆炸的状况,对于数据的有效处理成为必须解决的首要问题,由此数据挖掘技术应运而生。将复杂凌乱的数据进行快速的整理,并提取出其中有意义有价值的信息是必不可少的。通过对数据的提取,可以将重要的数据分离出来,得到有效的应用,发挥它的最大价值。数据挖掘技术对于现代社会来说,无疑是一个热点研究,在全球领域受都到了热切的关注。它的应用领域广泛,所以其研究也十分有意义。

数据挖掘所涉及的算法有很多,其中相当重要的就是聚类算法。聚类算法也是众多数据挖掘算法中研究技术最成熟的算法之一。从给定的数据集中,将数据分为同组的数据各属性十分相近,而不同组之间属性差距又很大的几个组别,这就是聚类的最根本目的。而且由于聚类分析的无监督特点,其应用领域十分广泛,在商业领域、图像处理领域、机器学习领域和文件处理分类等领域都有涉及[1]

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图