基于统计矩的目标识别算法外文翻译资料
2023-01-16 10:19:10
1.介绍
图像几何矩是描述图像的基于区域的积分特征。不变矩是几何矩的组合。它们对缩放旋转和图像的其他扭曲保持不变。正交矩用正交多项式作为矩积分的核函数,图像矩。矩变量和正交矩是基本的图像描述符,广泛用于图像分析、形状描述、图像索引、注释、检索、注册、匹配、目标检测、生物识别、高级车辆导航图像认证。以及图像水印。与其他图像描述符相比,基于矩的图像描述符具有严格的数学基础,在二维图像的低维描述符中表现出最好的性能。
半个多世纪前,Hu就提出了第一矩不变量。图像矩理论经过了长期的发展,基于矩的方法及其应用的研究发现,自20世纪90年代以来,图像矩理论发展迅速,近10年来每年发表的期刊论文和书籍章节达数千篇。引入了一些新的不变矩和正交矩,在图像描述方面表现出更好的性能。同时,研究工作的一个重要部分是致力于提高矩特征计算的速度和精度.
在这篇综述中,我们简要回顾了包含不变矩的图像矩理论的发展。正交矩和离散正交矩。不可能在一个简短的概述中涵盖图像时刻的整个区域。此外,最近还出版了一些有关图像矩理论和应用的优秀教科书。我们描述了几个选定的具有代表性的时刻,他们的表现,以及他们发展背后的想法。分析了Zernike矩的信息抑制缺陷。这不是一个最近更全面的概述。我们给出了矩家族一览表。我们还提出了许多正交多项式性能评估的新准则。然而,这篇综述并没有涉及图像矩的计算速度和数值稳定性问题,也没有涉及它们的应用。
2.不变矩
在直角坐标系中,二维图像f(x,y)的几何矩定义为
(1)
其中p和q阶矩是正整数。因此,零阶矩代表图像的总能量。一阶矩指定图像质心的位置。原点位于图像质心的坐标系中计算的矩是中心矩,然后是平移不变矩。二阶矩描述图像的直角度和椭圆度,用于确定图像的主轴。低阶矩特征直接用于目标检测中的形状描述。
- Hu不变量
Hu首先引入的矩不变量通常被称为一组七个参数,它们对图像的旋转、缩放和平移具有不变性。Hu的矩不变量是由代数不变量理论得到的高达二阶和三阶几何矩的代数组合:
(2)
其中是中心时刻。仿射变换不变矩也是后来从代数不变理论推导出来的。Hu矩不变量是一种高度集中的图像特征,长期以来被广泛应用。然而,由低阶几何矩组成的Hu矩不变量并不能描述图像的细节,并且存在信息冗余和信息抑制的缺点,如文献[11]所指出的。
Hu的矩不变量是信息冗余的,因为其分量矩中的核不是正交的。因此,用Hu的矩不变量来评估图像描述的质量并不简单。人们不知道应该使用多少Hu的矩不变量,以及它们对给定任务的图像的描述有多好。如第3节所述,可以使用正交矩消除信息冗余.
- 傅里叶-梅林矩
Hu不变矩与Fourier-Mellin矩之间的数学等价性可以证明Hu不变矩的信息抑制和丢失。在极坐标系中,图像的Fourier-Mellin矩定义为
(3)
,其中径向坐标r为尺度不变性标准化,正整数为径向矩阶,整数m为圆调和阶。图像的旋转对应于图像沿角坐标的平移和圆形傅里叶变换的相移。其强度是旋转不变的。
事实上。在极坐标系中,Hu的矩不变量可以更容易地导出为角矩或Fourier-Mellin矩。结果表明,Hu的矩不变量等价于一组特殊的Fourier-Mellin矩,其中圆谐阶m=0-3,径向阶n=2,3。众所周知,低周谐波阶数m=0-3并不详细地描述角的变化。一般来说,圆谐级数,Mgt;10需要从其圆谐函数中重建具有可接受细节的图像。另一方面。高阶单项式抑制来自图像中心部分的力矩的贡献,并在图像中严重地加权对象外部背景的贡献。利用低阶径向矩的Fourier-Mellin矩可以克服矩不变量信息抑制的缺点。
- 复矩
复矩在笛卡尔坐标系中定义,但用复坐标核(r jy)和(x-jy)代替x和y,如式(1)所示。极坐标系中的Fourier-Mellin矩与直角坐标系中的复矩等效,但某些分数半整数阶为
(4)
这样就可以在直角坐标系下利用复矩计算fouirr-Mellin矩,而无需将图像从笛卡尔坐标系转换到极坐标系。利用复矩导出仿射不变矩。
D.小波矩
小波矩在极坐标系中定义为
(5)
,其中圆傅里叶变换具有旋转不变性,小波变换在径向坐标系中应用于母小波,如Gabor小波、Mexican hat小波或B样条函数,后者如
(6)
所示,其中n=3 ,,,and 。小波变换是图像的圆谐函数
(7)
与小波的卷积
(8)
。其中,离散平移因子为,p和q为正整数。连续小波如三次B样条函数是带通滤波器。通过自适应选择合适的尺度a,小波变换可以突出图像中的边缘等局部特征。然而,公式(5)中定义的小波矩不是正交的,因此,可以用作图像描述的图像特征,但不能用于图像重建。此外,小波矩不是尺度不变的。在计算小波矩之前,图像必须调整到固定大小。
三.正交矩
正交矩是图像到正交多项式基的展开。正交矩是相互独立的信息,允许图像重建用于评估图像描述的质量。
A、 旋转不变正交矩
正交多项式是由常微分方程的幂级数解得到的,其正交性与微分方程的Sturm-Liouville形式及边界条件有关。它们被称为特殊函数,由于经常使用而被赋予特殊的名称。另一方面,利用Gram-Schmidt正交规范化可以方便地生成正交多项式,从而可以得到无穷多个正交多项式。众所周知的正交多项式包括Jacobi多项式、Hermite多项式、Laguerre多项式和Bessel多项式。多项式之间存在相互关系。例如,Gegenbauer、Legendre、Chebyshev和Zernike多项式是Jacobi多项式的特例,Jacobi多项式是超几何微分方程的解。
提出了许多正交多项式作为图像分析的基础。对于极坐标系下图像的二维展开,径向正交多项式是径向基,傅立叶核用于圆谐分析。正如Bhatia和Wolf所指出的,在形式上的旋转不变性。圆Fourier核是一个包含为基函数的唯一解。利用归一化径向坐标实现尺度不变性。
1.Zernike与伪Zernike矩
Zernike矩在单位圆上是正交的。Zernike径向多项式在光学设计中对像差特性起着主导作用。Zernike矩在1980年被提出用于图像分析,其为
(9),
其中Zernike径向多项式为
(10),
其中m为圆谐级数,n为Zernike多项式的次数。将Zernike矩设计为在笛卡尔坐标系中表示,使得Zernike径向多项式不包含小于圆谐级数r的幂,且是偶数。在Zernike矩中,中的每个径向幂项对应于特定阶次的径向矩,因此Zernike矩可以作为Fourier-Mellin矩的代数组合来计算。
Bhatia and Wolf derived=x和y中的另一组正交多项式,其中仅包含r的幂高于圆调和阶,但去掉了偶数的条件。
这个矩集现在被称为伪Zernike矩。当用m阶高次谐波来表示角变化在[0,2pi;]范围内的图像时,具有径向多项式次数的Zernike矩和伪Zernike矩必然会受到高径向矩阶的严重信息抑制缺陷。
2.正交傅里叶-梅林矩
为了避免Zernike矩中的信息抑制问题,设计了正交Fourier-Mellin矩。正交Fourier-Mellin矩定义为
(11)
其中,和径向多项式
(12)
通过n=0,1,2,hellip;.的幂级数rn的Gram-Schmidt正交化获得。正交Fourier-Mellin矩不需要在笛卡尔坐标系中表示。因此,消除了在Zernike矩和伪Zernike矩的限制。这种限制的消除提高了图像分析的性能。
Fourier-Mellin多项式在中有n个零,而Zernike多项式对有(n-m)/2个重复根。若要使零的个数相同,则Zernike多项式的阶数必须高达。图1显示了圆谐级数m=10和阶数n=10-28的Zernike多项式,其零点分布在径向距离r,0.2lt;rlt;1的范围内。
最接近原点的端点位于r=0.2处。在这组Zernike矩中,归一化径向距离区域的图像信息被完全抑制。
与m无关的n=0-9的正交Fourier-Mellin径向多项式的集合包含0分布在0.04lt;rlt;1的径向坐标范围内的振荡,如图所示
图1.正交径向多项式:(a)圆形调和阶m=10的n=10-28的Zernike多项式,(b)n=0-9的正交Fourier-Mellin多项式。
图2。(a) 单位圆盘中字母E的原始图像;(b)由n,m=0-7的前64个正交Fourier-Mellin矩重建;(c)由m=0-7的圆谐阶Zernike矩重建,对于每m使用8个最低阶,满足。
图1(b)。因此,正交Fourier-Mellin矩的集合有利于图像的分析,特别是对于图像的中心部分或单位圆中的小尺度对象,这是在尺度不变模式识别的背景下发生的。图2显示了一个大写字母E,它是由64个正交的Fourier-Mellin矩和Zernike矩重建的。图2(c)中前者显示的细节比图2(b)中后者要好得多。
正交Fourier-Mellin矩设计的核心思想是将径向多项式与圆Fourier核完全分离,避免了径向矩阶高于圆调和阶的限制,在此基础上提出了许多新的正交径向多项式,如切比雪夫傅里叶、雅可比傅里叶和贝塞尔傅里叶多项式。所有这类矩都可以用Fourier-Mellin矩的代数组合来计算。后者可由式(4)所示的等效复力矩计算,而无需将图像从直角坐标系转换为极坐标系。
- 切布休傅里叶矩
将在区间[0.1]内正交的第二类移位切比雪夫多项式与圆形傅里叶核结合,形成切比雪夫傅里叶矩A的核
(13) ,
其n=0,1,2,hellip;,m=0,士1,士2,hellip;,
(14).
第二个在0le;rle;1范围内正交的移位切比雪夫多项式
(15),
如图3.
图3。移位Chebyshev多项式,n=1,2,9,10,
(16)
,其中是Kronecker符号,是权函数。
如图3所示,具有均匀分布在区间[0,1]上的n个零点,在径向区间[0,1]的很大一部分中,不同程度n的的振荡幅度接近于常数,但当r趋向于零时,趋向于高绝对值,如图3所示。这可能是一个潜在的缺点。实验表明,切比雪夫傅里叶矩的图像描述性能与正交傅里叶-梅林矩相似。
4.广义雅可比傅里叶矩
雅可比Fourier矩称为一般正交矩,其核由径向雅可比多项式和角Fourier复指数核组成,定义为
(17),
其中径向雅可比多项式由径向坐标的自然幂序列正交化生成,加权函数为
(18)
,其中p-qgt;-1,qgt;0,例如
(19)
,径向雅可比多项式为
(20)
在标准化
(21)
之后,其中标准化常数为
(22)
结果表明,雅可比傅氏矩对应于p=q=1的勒让德傅氏矩,单位权函数对应于p=2和q=3/2的切比雪夫傅氏矩,且p=q=2且权函数等于r的正交Fourier-Mellin矩。Zernike径向多项式对应于p=q=m 1的Jacobi径向多项式,其中m是Zernike矩中的圆谐级数。k=(n-m)/2。伪Zernike径向多项式对应于p=2m 2,q=m 2,k=n-m的Jacobi径向多项式,因此Jacobi-Fourier矩提供了表示旋转不变正交矩的一般框架。通用公式有利于正交矩的性能比较和分析,有利于寻找素数正交矩。
5.贝塞尔傅里叶矩
最近引进了Bessel-Fourier矩,定义为
(23)
,其中是第一类v阶Bessel径向多项式,是C的n次零。同阶贝塞尔多项式在径向区间[0,1]上是正交的,例如
(24)
,其中是归一化常数。图4是贝塞尔函数v=1的曲线图。如图4所示,第一类贝塞尔多项式在径向区间[0,1]的两端趋向于零,并且在径向区间[0,1]上显示振荡幅度的缓慢变化。只有在接近r=0的范围内,振荡幅度才会加倍。
图4. 贝塞尔径向多项式,n=0、l、hellip;、9
6.径向拉尔玛傅立叶变换
径向谐波傅里叶矩或极性谐波变换包括径向坐标和角坐标下的傅里叶谐波分析,定义为(25)
,其中径向核Tn(r)是正交三角函数,如表示奇数n,表示偶数n,或复指数函数,如或。在所有情况下,Tn(r)应分别标准化。相应的变换称为径向谐波傅里叶矩、极性谐波变换和指数傅里叶矩。角径向变换、极复指数变换、极余弦变换和极正弦变换也属于这类变换。由于Fourier核在0
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[239202],资料为PDF文档或Word文档,PDF文档可免费转换为Word