纹理图像分类及其关键技术研究文献综述
2020-06-30 21:12:15
文 献 综 述
随着互联网技术的不断发展,数字多媒体技术以及智能信息处理技术被广泛地应用于我们的生活和工作之中,人们也面对着爆炸式增长的图像资料。在这种背景下,传统的基于关键字的图像分类方法已经难以满足人们的需求。因此,基于纹理图像的分类方法应运而生。纹理图像分类是直接从图像信息本身出发,将人类视觉系统区分和判断不同事物作为重要特征参数,来提取并分类图像的一项工程。纹理图像的分类方法及其技术作为现代图像处理的重要领域之一,成为了一大研究热点。大量学者对其进行了不懈的追寻并且取得了一定的研究成果。例如基于B样条概率密度的估计,基于ELM和证据理论的分析,基于不变量的探究等等。但是,虽然前人给出了许多的经典方法,后人也涌现了大量的新思想,现有的对于基于纹理图像分类方式都存在着一些缺陷[12]。因此,研究一种准确、稳定、生效快的纹理图像分类技术显得尤为重要。
一.课题研究的目地与意义
图像是人们从外界获取信息的主要来源,它包含了事物最原始的信息,因此对我们来说尤为重要。如今,图像资料程一种爆炸式的增长,人们将面对堆积成山的图像数据。传统基于文本的图像分类技术显然已经难以满足人们的需求。因此,一些学者提出从图像本身内容在研究中有些学者发现图像信息中的绝大部分可以从图像的内容之中提取出来,即通过从图像自身的信息触发,进行分析并且提取特征,用筛选的特征值来描述图像即于图像内容的图像分类技术[1]。这是一种对于图像信息的描述,一般而言利用三个方面的特征:颜色特征、形状特征和纹理特征[2]。其中颜色特征是图像中的物体表面对不同光谱的发射情况:形状特征是图像中的物体在空间中的大小、方位信息;纹理特征则是一种人类最为显著的视觉特征,可以充分反映物体表面的粗糙度、方向性和规则性。如今阶段,颜色特征和形状特征并不能满意地表达图像的空间结构,而基于纹理特征的图像分类处理则占据了明显的优势,可以反映图像的重要信息。在研究领域,纹理特征被定义为是一种重要的视觉线索,在人们利用自身的视觉系统对物体进行识别时,纹理是以表达物体表面或结构的一种基本特征来呈现的。鉴于纹理特征分析的优越性,目前基于此在图像内容分类上的研究已经有了四十多年的历史,在关于纹理的多个领域上也取得了一定的成果。自然,对基于纹理的图像分类及其技术的研究就很有意义了。
二.研究现状
经过了四十多年的研究,人们现在对于纹理图像的分类技术其实已经掌握得相当有系统性。目前学术界对于纹理图像分类的技术研究主要有两种[13]:一是对于纹理特征的提取;二是对于纹理的分类。这两种技术也可以称作是纹理图像分类的关键技术。其中纹理特征提取技术是一种基础技术的姿态存在于图像处理中,纹理的分类就像是高层建筑,基于纹理的提取后将其区分。国内外学者基于这两种关键技术,也提出了大量的处理方法。
(1)纹理特征提取
纹理分类的先行工作,即纹理特征的提取是基于人们由于对于图像的主观性,难以用文字表达的背景下,通过使用分析工具如计算机从图像中提取图像表面的纹理信息特征,寻求这些图像纹理的存在特性以及分布原理,从而达到区分图像的目的。目前的学术界,常用的纹理特征的提取借鉴了Tuccryan和Jain的分类方法[3],大致可以分为统计法、模型法、信号处理法和结构法[13]。
统计法分析图像的纹理[18]是基于图像元以及期邻域的灰度属性,以此来研究纹理区域中的统计特性。这是一种发展至今历史相当悠久的方法,几乎在基于纹理的图像处理方法出现时就已经出现。这种方法的特点是易于实现,思想简单。其中灰度共生矩阵法(GLCM)一枝独秀,具有强大适应性和受公认性。另外基于变差函数反映图像数据随机性和结构性的半方差图法,也能很好表达纹理特征。这类方法在四类方法中几乎是以一种稳坐头一把交椅的形式存在,在经过了40多年的不懈研究后,在图像领域占有重要地位。
模型法的理论依据,架构在假设纹理是某种参数控制的分布模型形成[7],从纹理图像的实现来估计计算模型参数。它通过将纹理基元的分布与数学模型匹配,利用一系列的数学方法对纹理模型进行分析,从而获得纹理特征。这种方法的主要依照是随机场模型,这是一种试图通过概率模型来描述纹理的随即过程,从而运算估计纹理模型参数的方法,其实质是描述图像中像素与其相邻像素的统计依赖关系。模型法具有较大的灵活性,可以兼顾纹理局部的随机性和整体上的规律性。但是不可忽视的是该方法对于计算量的要求很高,而且在模型系数的求解上颇有难度,因此在实际运用中通常只存在简单的模型处理。