彩色图像特征分析及应用研究毕业论文
2021-08-02 20:48:31
摘 要
随着21世纪的到来,人类逐渐步入信息化时代,信息处理技术显得尤为重要,而图像是人类获取信息的重要方式之一,彩色图像处理技术的发展与进步将给人类带来巨大的便利。
本文主要概述了数字图像的基本概念,以及对数字图像的运算、增强以及分割采用Matlab编程加以实现,研究了彩色图像的HOG特征值的分析及提取,并将HOG及SVM分类器结合实现行人检测,其中包括直接调用OpenCV库函数实现行人检测以及自己选择大量训练样本图片实现行人检测,采用Visual Studio编程实现。将训练样本图片换成汽车,可实现对车辆的识别,以此实现物体检测的功能。研究结果表明,自带库函数对行人的检测效果更好,自己训练样本图片也可实现行人检测,且训练样本的程序可拓展为物体识别程序。
本文的特色:将数字图像的基本知识与实际运用相结合,已达到学以致用的目的;在编程实现功能时,选用自带库函数与自己训练样本两种方式,可对识别结果进行对比分析;最后将行人检测技术拓展为物体识别技术,拓宽应用范围。
关键词:数字图像处理;HOG特征值;行人检测;物体识别.
Abstract
With the advent of the 21st century, mankind is entering the information age, information processing technology is particularly important, and the image is an important form of human access to information, the development and progress of color image processing technology will bring great convenience to the mankind.
This paper outlines the basic concepts of digital images and digital image operation, enhancement and segmentation be implemented using Matlab programming, research and analysis to extract HOG eigenvalues color image, and HOG and SVM classifier in combination to achieve pedestrian detection including direct calls OpenCV library functions to achieve pedestrian detection and a lot of training sample image of their choice to achieve pedestrian detection using Visual Studio programming. The training sample image into cars, enabling the identification of the vehicle, in order to achieve the object detection function. The results show that the effect comes with library functions to detect pedestrians better trained himself sample image can be achieved pedestrian detection, and the training sample program can be expanded to object recognition program.
Features of this article: the basics of digital images and the actual use of the combination has been reached on so forth; when programming function, the choice comes with its own training sample library functions in two ways, the results were analyzed to identify ; Finally, the pedestrian detection technology to expand the object recognition technology, broaden the application range.
Key Words:digital image processing;histograms of orientation gradients (HOG);pedestrian detection;Object recognition.
目 录_Toc453091102
第1章 绪论 3
1.1 研究背景及意义 3
1.2 国内外研究现状 3
1.3 本次研究目标及内容 3
1.3.1 研究目标 3
1.3.2 研究内容 4
1.4 论文结构 4
第2章 图像处理技术 5
2.1 数字图像的基本概念 5
2.2 数字图像的运算 5
2.2.1 图像的像素运算 5
2.2.2 图像的几何变换 13
2.3 数字图像的增强 16
2.3.1.灰度变换增强 16
2.3.2.直方图增强 16
2.4 数字图像的分割 18
2.4.1.检测线段 18
2.4.2.微分算子 19
2.5 本章小结 20
第3章 HOG特征值 21
3.1 HOG特征值 21
3.1.1.主要思想 21
3.1.2.具体实现方法 21
3.1.3.性能提高 21
3.1.4.优点 21
3.2 HOG特征值的提取 21
3.2.1 大概过程 21
3.2.2 详细介绍 22
3.3 SVM分类器及OpenCV库 24
3.3.1 SVM分类器介绍 24
3.3.2 SVM分类器原理 24
3.3.3 SVM分类器的优点 24
3.3.4 OpenCV库的介绍 25
3.4 本章小结 25
第4章 行人检测 27
4.1 调用库函数实现行人检测 27
4.2 训练样本图片实现行人检测 28
4.3 分析对比 29
4.4 物体识别 30
4.5 本章小结 32
第5章 结论 33
5.1 总结 33
5.2 展望 34
附录A 行人检测效果对比图 37
附录B 行人检测主要程序 39
附录C 图像增强MATLAB程序 40
致 谢 41
第1章 绪论
图像是一种常见的信息载体,它具有极高的直观性和易理解性,图像是人类从自然中获取信息的重要方式之一,不仅如此,图像还可以帮助人类更好的观察和记录客观世界,图像是作用于人眼而产生的视觉响应[1]。
1.1 研究背景及意义
随着21世纪的来临,人类逐步踏入信息化的时代,计算机在信息处理中发挥着巨大的作用。在图像的处理方面,计算机的出现,使得人类对图像的处理效率迅速提升,再加上电脑的日益普及,图像处理的各个应用也就深入到我们生活之中,这也进一步促进了世界各地的学者们对图像处理领域方面的学习和研究。
彩色图像包含的信息量比其他类型的图像所包含的信息量更为丰富,其表现形式也更贴近实际,因此彩色图像也就能更好的被人类的视觉系统所接受。目前,彩色图像处理这一方面,依然是一个十分热门也十分重要的研究领域。不过,由于对彩色图像的处理具有一定的抽象性和复杂性,目前已有的对灰度图像的处理方法,并不能全部照搬照抄得用在彩色图像的处理上。彩色图像处理技术能否有新的突破与发展最主要的还是需要合理地利用彩色信息,并将其与现有的灰色图像处理技术相结合。
通过对彩色图像的分析与研究,提取图像中具有重要意义的特征数据作为依据,可以实现行人检测、车牌号识别、视频监控、轮廓提取、生物医学检测等目的,相信这些新兴技术能够为人类带来了更多的便利。因此,目前对彩色图像特征分析的研究具有重要意义。
1.2 国内外研究现状
随着计算机的诞生,人类对计算机视觉方面的研究不断取得进步,多媒体技术和现在流行的VR(虚拟现实)技术不断完善,尤其是彩色图像的相关器材不断突破和创新,彩色图像的处理应用更加贴近人类的生活,人们也对彩色图像处理技术的要求越来越高,但目前人类对图像处理的技术大部分还停留在灰度图像处理方面,由于彩色图像的复杂性,这些技术并不能简单的照搬过来,应用于彩色图像上,因此,彩色图像的特征提取与分析已成为全世界的学者们研究的共同话题[2]。
1.3 本次研究目标及内容
1.3.1 研究目标
本次研究目标有以下两个方面:1.了解数字图像的基本概念,掌握基本的图像处理技术,包括数字图像的运算、增强以及分割;学习并熟练掌握MATLAB、Visual Studio编程软件。2.了解HOG特征值的定义和提取,并采用HOG特征值和SVM分类器实现行人检测和物体识别。
1.3.2 研究内容
本次研究内容包括:1.数字图像的运算、增强、复原、分割、变换的相关原理和MATLAB编程实现的具体操作;2.HOG特征值的具体定义、提取方式以及运用Visual Studio编程实现行人检测和物体识别的具体操作。
1.4 论文结构
本文先从数字图像的基本概念入手,了解一幅图像的基本表达形式以及常见的存储格式;随后是图像处理技术,其中包括图像的运算、增强和分割等基本操作技术,先引入图像处理技术的基本定义,然后采用MATLAB编程加以实现,以达到理论与实践相结合的目的;紧接着,本文开始引入图像的HOG特征值,先介绍其基本定义,并采用Visual Studio编程实现HOG特征值的提取,将HOG特征值与SVM分类器相结合,可实现行人检测的功能,检测方式有两种,一是自己训练并检测行人,二是调用OpenCV已有库函数检测行人,对两种方法的检测结果加以比较分析;最后对行人检测的程序加以拓展,把训练图片换成汽车图片,从而实现物体检测(检测汽车)的功能。
图1-1 论文结构
第2章 图像处理技术
2.1 数字图像的基本概念
在计算机中,一副图像通常可以由M*N的数组表示,其中M是数组的行数,也就是图像中像素点的行数,N是数组的列数,也就是图像中像素点的列数,具体表现形式如式2-1所示:
(2-1) |
常见的图像类型有二进制图像,即非0即1,图像中的像素点只有黑与白;灰度图像的取值范围通常在0-255,它表示的是像素点的颜色深暗程度,0代表黑色,255则代表白色,灰度图像的表示效果要好于二进制图像;RGB图像,也是很常见的用于表示彩色图像的方式,它的原理是将每个彩色像素分解为红绿蓝三色,将这三种颜色按照一定比例混合,即可合成任意颜色的彩色像素,其中R、G、B分别表示红、绿、蓝三种颜色,每个颜色都有一个如式(2-1)所示的像素矩阵,其中的则表示它们的权值,通过这三种基本颜色值的合成,就能产生一副色彩鲜明的彩色图像[3];最后是索引图像,它的原理是把像素进行分类统计,并把所有存在的像素点类型归结到一个表格里,然后在表示图像的矩阵中直接存放该像素点对应表格中像素点类型的前面的标记,这样每次通过索引表格内容 即可表示出一副彩色图像。
图像在计算机中的存储方式也有很多,每个文件格式,目前一些常用的文件格式有:BMP、GIF、JPEG和TIF0F等文件格式。
2.2 数字图像的运算
2.2.1 图像的像素运算
1.线性灰度变换
如果原图像中的像素点的灰度变换范围为[a , b],处理后的图像中像素点的灰度扩展范围为[c ,d ],则线性灰度变换运算的数学表达如式(2-2):
(2-2) |
将彩色图片(图2-1)中的三个颜色分量分别进行线性灰度变换,并将变换后的三色图相加,组成新图(图2-2),具体操作效果如下: