传统方法和卷积神经网络的图像分类及应用毕业论文
2021-03-22 22:26:21
摘 要
如今,图像分类技术在图像处理、模式识别和人工智能等领域有了十分迅速的发展和非常广泛的应用,对其进行深入的认识与研究是当今信息时代下从海量图片数据中提取有用信息的迫切需求。
图像分类是利用计算机根据图像内容自动获取图像信息的过程,它能够通过所获得的图片特征,在已经建立好图像特征与其标签类别之间映射的基础之上,代替人眼对图片类别进行判定。课题在实现图像分类的过程中主要进行了图像预处理、图像特征提取、图像分类方法选择三个环节,其中图像分类方法的选取是最为核心的步骤。
课题基于MATLAB开发平台和caffe深度学习框架,主要完成了以下三个工作:
(1)利用LAB颜色空间和K-means聚类算法实现传统方法的监督图像分类;
(2)利用HOG特征和支持向量机实现非监督图像分类;
(3)利用与MATLAB软件接口的caffe深度学习框架实现卷积神经网络的图像分类。
本文对这三种分类方法的实验效果进行了对比分析,评述了各自的优缺点。其中,K-means聚类方法可以很好地对图片内容进行基于颜色的图像分割;支持向量机方法与卷积神经网络方法则在猫狗分类问题上分别取得了74.4%与80.4%的正确率,SVM方法更适用于二分类问题,卷积神经网络方法更适用于精细分类和多分类问题。
关键词:图像分类;K-means聚类;支持向量机;卷积神经网络
Abstract
Nowadays, image classification technology has a very rapid development and has been widely applied in image processing, pattern recognition, artificial intelligence and other fields .It is in very urgent need to take a deep research into image classification in the information age,which helps to extract useful information from massive picture data.
Image classification is the process of using the computer to automatically obtain the image information according to the image content. It can classify the picture on the basis of the mapping between the image feature and its label through the obtained image feature. Realizing image classification includes the image preprocessing,image feature extraction and image classification method . The selection of image classification method is the most important step.
The topic is based on the MATLAB development platform and the caffe depth learning framework, which mainly completes the following three tasks:
(1) using LAB color space and K-means clustering algorithm to achieve the traditional method of supervised image classification;
(2) using HOG feature and support vector machine to achieve unsupervised image classification;
(3) Using the caffe depth learning framework to interface with MATLAB software to realize the image classification of convolution neural network.
In this paper, the experimental results of these three classification methods were compared and analyzed, and their advantages and disadvantages were reviewed. In a sum, the K-means clustering method can segment the image based on color image segmentation. The SVM method and the convolution neural network method have achieved the correct rate of 74.4% and 80.4% on the question of classifying dogs and cats. It is founded that SVM method is more suitable for two classification problems, convolution neural network method is more suitable for detail classification and multi-classification problem.
Key Words:Image Classification; K-means clustering; Support Vector Machine; Convolution Neural Network
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 课题的研究背景与意义 1
1.2 课题的国内外研究现状 1
1.3 论文的工作内容与结构 2
第2章 图像分类技术 4
2.1 图像分类处理系统 4
2.2 图像预处理 4
2.3 图像特征提取 5
2.4 图像分类方法 5
2.4.1 监督分类方法 5
2.4.2 非监督分类方法 6
2.4.3 支持向量机方法 7
2.4.4 人工神经网络方法 7
第3章 基于K-means聚类的图像分类 9
3.1 K-means聚类 9
3.2 基于颜色的特征提取方法 10
3.3 实验结果及分析 11
第4章 基于SVM的图像分类 14
4.1 支持向量机 14
4.2 HOG特征提取方法 14
4.3 实验结果及分析 15
第5章 基于卷积神经网络的图像分类 18
5.1 卷积神经网络结构 18
5.2 实验结果及分析 19
第6章 实验结果对比分析 22
第7章 总结与展望 24
7.1总结 24
7.2 展望 24
参考文献 26
附 录 27
致 谢 38
第1章 绪论
1.1 课题的研究背景与意义
据统计,人类从客观世界获取的信息中75%来自视觉[1],在这些视觉信息中,图像又占据了主导地位。图像通过对真实世界进行生动形象的描述与再现,是人类获取信息、传输信息与表述信息的良好媒介。21世纪是信息技术的时代,互联网技术的迅猛发展降低了人们获取与表达、传递以及储存信息的成本,极大地便捷了人们的日常生活。随着数字化技术的不断创新,各种数字图像设备的发明与生产,尤其是全球范围内智能手机的普及,21世纪的“信息时代”已悄然成为“图像时代”,图像信息正以雷霆之势占据人们的信息渠道。面对铺天盖地的图片数据,有效地提取其中的关键信息成为科学家们研究的重要方向与目标。
古有云:“物以类聚”。在现实世界中,对事物进行分门别类是人类认知、理解世间万物的一个最基本的技能,而这个分类的依据就来自于人眼对自己所看到的视觉信息进行的特征提取。对视觉信息的分类实际上也就是对一幅幅静态或动态图像的分类,比如分辨桌椅、判别猫狗以及区分颜色等。本文所研究的图像分类技术是基于现代计算机技术的,实际上就是要让计算机帮助人类完成视觉判读的功能。对于一张图片,计算机完成分类任务所要做到的基本功能是能够自动判断它属于标签中的哪一类并以较高的正确率给出最终决策。