基于聚类算法的手写数字识别方法研究与实现开题报告
2020-02-18 18:25:39
1. 研究目的与意义(文献综述)
1、目的及意义(含国内外的研究现状分析)
1.1 研究目的及意义
自从上个世纪六十年代以来,计算机视觉与图像处理越来越受到人们的关注,并逐渐成为一门重要的学科邻域。而作为它们的研究对象的数字图像,也因为它含有研究目标的丰富信息而成为越来越重要的研究对象。图像识别的目标是用计算机自动完成某些信息的处理,用来替代人工去处理图像分类及识别的任务。
2. 研究的基本内容与方案
本文以手写数字识别为研究背景,基于三种不同的聚类算法,通过探究各个算法的工作原理,建立相对应的模型,以python作为基本语言,对minst公开的手写数字集进行识别处理,并且统计各个方法识别的成功率,分析各方法成功率不同的原因。
数据聚类是无监督学习的主流应用。最经典并易用的聚类模型,是k-means算法。该算法要求我们预设聚类的个数,然后不断更新聚类中心;经过几轮迭代后,让所有数据点到其所属聚类中心距离的平方和趋于稳定。均值漂移聚类是基于滑动窗口的算法,来找到数据点的密集区域。这是一种基于质心的算法。还有与均值漂移聚类类似的一种聚类算法——基于密度的聚类方法(dbscan),这两种都是基于密度的聚类算法。除此以外,还有期望最大化em聚类和层次聚类算法等等。这里主要介绍下k-means算法的执行过程:1.随机设k个特征空间内的点作为初始的聚类中心;2.对于根据每个数据的特征向量,从k个聚类中心中寻找距离最近的一个,并把该数据标记为从属于这个聚类中心3.在所有的数据都被标记过聚类中心后,根据这些数据新分配的类簇,重新对k个聚类中心进行计算4.如果一轮下来,所有数据点从属对聚类中心与上一次的分配的类簇没有变化,停止迭代,否则回到步骤2继续执行。本次设计将采用上述算法中的三种用于实现手写数字识别,并且同时比较他们的成功率。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1] yonghong xie ; yijun liu. a handwritten numeral recognition method based
on stdp based with unsupervised learning[c]. 2017 international conference on
wireless communications, signal processing and networking (wispnet). 839 - 842