快速和鲁棒的图像识别外文翻译资料
2022-11-13 16:10:58
英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
快速和鲁棒的图像识别
摘要
本文提出了一个图像标识符鲁棒性的常见的修改。 引入了多分辨率轨迹变换,构造了图像的一组1D表示法。 使用傅里叶变换从每个表示法中提取二进制标识符。 在一组超过60,000个独特图像上进行算法和三个现有技术方法的实验评价,结果表明该方法在检测鲁棒性和速度方面优于先前的技术方法,并实现检测率 超过99%,假阳性率低于百万分之一,在桌面PC上的搜索速度超过每秒1000万影像对。
1.介绍
对突出网站的一个调查显示Flickr有超过20亿的图像,Photobucket有超过40亿,Facebook有17亿。消费者通常在他们的个人收藏中有成千上万张照片,专业人士将有更多。此时,缺乏支持视觉多媒体内容的识别的鲁棒工具,例如找到修改图像的原始版本。这样的内容识别工具对于诸如版权保护,数据库去重复和管理,内容链接和内容识别的应用来说是很重要的。考虑到数据集的大尺寸,工具必须非常快并且以非常低的误报率提供良好的检测。
通常多媒体识别涉及提取一个以某种方式捕获特征的标识符。一个图像标识符对常见图像的修改必须是鲁棒的。它也应该是紧凑的,并且必须允许极快的搜索。图像标识符区域中过去的工作可以通过其支持区域,i)基于局部特征点,ii)基于区域和iii)全局来分类为三种方法。
局部特征方法提供了一个高水平的鲁棒几何变换[6],但是通常具有高复杂度的搜索。 基于区域的方法克服了一些特征点的搜索复杂性的问题,但是具有不好的性能,特别是在存在旋转的情况下[8,4]。 全局方法在搜索复杂性和鲁棒性方面表现出了希望[5,7,2]。
基于局部特征的方法对于几何变换和裁剪通常是是鲁棒的。 然而,随着特征的数量增加,强力搜索会遭受组合爆炸。 确实存在改进性能的方法,但是搜索成本仍然是相对较高的。
轨迹变换被应用于这项工作,并且从过去的工作中[2]通过引入多分辨率轨迹变换显著的改善了结果。 本文的贡献是i)引入多分辨率轨迹变换,ii)在[2]中引入的标识符的数学证明和iii)使用MPEG-7测试条件对3种替代方法进行实验比较。
轨迹变换及其属性以及如何使用它来提取不变特征在第2节中给出。多分辨率轨迹变换在第3节中介绍。图像中的鲁棒标识符的提取在第4节中描述。第5节提出实验结果,然后结论在第6节。
2轨迹变换
轨迹变换投影图像上的所有线,并对这些线应用函数。 一个更实用的被称为直径函数的另一函数被应用于轨迹变换以获得一个被称为马戏函数的1D函数。 使用轨迹和直径函数建立一个图像标识符。
图1. 轨迹变换投影图像上的线。 线由角度theta;和距离d参数化。
(a) Lena (b)轨迹变换(IF 1)
图2.这里显示的是Lena(a)和使用功能IF 1的Lena(b)的轨迹变换。
线在坐标系中通过(theta;1,d1,t1)参数化,参见图3。 其中theta;1是线的法线的角度,d1是原点线之间的距离,t1是沿线的距离。 沿着特定线的图像函数的值是
F1 (theta;1,d1,t1) = F(C1 ;theta;1 ,d1 ,t1 ).
现在,轨迹变换T对导致直径函数的图像函数应用一些功能
d(C1 ;phi;1 ,p1 ) = T(F(C1 ;phi;1 ,p1 ,t1 )).
图像的示例及其轨迹变换示于图5。 直径函数D对直径函数进行操作以给出马戏函数
c(C1 ;phi;1 ) = D(T(F(C1 ;phi;1 ,p1 ,t1)). (1)
不变函数:如果满足下面的条件,函数xi;(x)的函数Xi;是不变的
Xi;(xi;(x b)) = Xi;(xi;(x)), forall;b isin; R. (I1 )
不变函数可以有两个其他属性
Xi;(xi;(ax)) = alpha;(a)Xi;(xi;(x)), forall;a gt; 0, (i1 )
Xi;(dxi;(x)) = gamma;(d)Xi;(xi;(x)), forall;d gt; 0. (i2 )
(a)图像域 (b)跟踪域
(c)图像域 (d)跟踪域
图3.多分辨率轨迹变换
可以显示出
alpha;(a) = a kappa; Xi; ,gamma;(d) = d lambda; Xi; ,
其中 kappa;Xi; 和 gamma;(d)= dlambda;Xi; 是函数Xi;的特性。 以下函数遵守性质I 1,i 1和i 2
IF 1 =ʃ xi;(t) dt,
IF 3 =ʃ |xi;(t)| dt,
IF 6 = max(xi;(t)).
3多分辨率轨迹变换
多分辨率表示因其强大的从粗略到精细描述不同细节水平的能力而受欢迎。 这里引入了一种多分辨率轨迹变换,它从原始轨迹变换中快速有效地生成。
具有特定功能的轨迹变换T提供图像的一个表示。 从这一个抽象,可以生成图像的多分辨率表示,其以不同的尺度捕获信息。 通过在其两个维度d或theta;中或在两个维度上对图像的原始T变换进行子采样来执行轨迹变换多分辨率分解。 分解仅涉及一系列1D操作,其可以以小的额外复杂性非常有效地执行。 在一个维度中的分解是顺序O(N),其中N是迹变换的维度的大小,并且在维度O(N M)中,维度的大小是N和M.在实践中, 5%的提取复杂度并不影响匹配的复杂性,同时大大提高了性能。
通过在沿着列的间隔上积分,通过对d参数进行二次采样,在跟踪域中执行分解,如图3(b)所示。 这对应于在轨迹变换期间在图像上方的宽度为d的投影条,如图3(a)所示。
子采样也通过在theta;参数(图3c)中积分,即沿着行来进行。 如图1所示。 3d,这大约等效于在轨迹变换期间在具有张角theta;的图像中对双锥进行积分。
4强大的标识符
可以从两个不同的坐标系C 1和C 2观看图像f(x,y)。 通过角度-phi;的旋转从C 1获得坐标系C 2,通过参数upsilon;缩放轴并且通过使用矢量(-s 0cosPsi;0,-s 0sinPsi;0)平移来获得坐标系C 2。 从C 2观看的图像f 2(,)可以被看作已经经历旋转phi;,缩放upsilon;-1并且移位(s 0cosPsi;0,s 0 sinPsi;0)。 在这些线性变换下,f 1中的线仍然是f 2中的线; 变换是线保持。 在坐标系C 1中的图像线的参数在C 2中的线的参数
theta; 1 = theta; 2 minus; phi;,
d 1 = upsilon; [d 2 minus; s 0 cos(Psi; 0 minus; theta; 2 )],
t 1 = upsilon; [t 2 minus; s 0 sin(Psi; 0 minus; theta; 2 )].
从(1)可以看出,坐标系C 2中的图像的马戏功能与坐标系C 1中的图像的关系给出为
c(C 2 ;phi; 2 ) = D(T(F 1 (phi; 1 minus;theta;,upsilon; [p 1 minus; s 0 cos(Psi; 0 minus; phi; 1 )],
upsilon; [t 1 minus; s 0 sin(Psi; 0 minus; phi; 1 )]))). (2)
选择跟踪函数T以遵守(I 1)和(i 1)
c(C 2 ;phi; 2 ) = D(alpha; T (upsilon;)T(F 1 (phi; 1 minus; theta;,upsilon; [p 1 minus; s 0 cos(Psi; 0 minus; phi; 1 )],t 1 ))). (3)
此外,可以选择直径函数D以遵守(I 1),(i 1)和(i 2),使得
c(C 2 ;phi; 2 ) = gamma;D (alpha; T (upsilon;)) D (T (F 1 (phi; 1 minus; theta;,
upsilon;[p 1 minus; s 0 cos(Psi; 0 minus; phi; 1 )],t 1 ))),
- 原始图像 (b)旋转45°
(c)马戏团功能 (d) (b)的马戏团功能
(e) (a)的标识符 (f) (b)的标识符
(g)标识差
图4.图像(a)和由45 0(b,d,f)旋转的图像的马戏团功能(c)和标识符(e)。 马戏团功能向右移动45 0(pi;/ 4)。 标识符之间的差异在(g)中示出。
c(C 2 ;phi; 2 ) = gamma; D (alpha; T (upsilon;))alpha; D (upsilon;)D(T(F 1 (phi; 1 minus;theta;,p 1 ,t 1 ))),
c(C 2 ;phi; 2 ) = kappa;D(T(F 1 (phi; 1 minus; theta;,p 1 ,t 1 ))), (4)
其中kappa;=gamma;D(alpha;T(upsilon;))alpha;D(upsilon;)。 从(4)可以看出,C 2中的1D马戏函数是C 1中的马戏函数的缩放版本。 示例马戏团功能如图4所示。
标识符提取:采用(4)的傅立叶变换给出
F(Phi;) = £[kappa;D(T(F 1 (phi; 1 minus; theta;,p 1 ,t 1 )))],
然后利用傅里叶变换的线性身份和平移属性给出
F(Phi;) = kappa;exp minus;jtheta;Phi; £[D(T(F 1 (phi; 1 ,p 1 ,t 1 )))].
取F(Phi;)的大小给出
|F(Phi;)| = |kappa;£ [D(T(F 1 (phi; 1 ,p 1 ,t 1 )))]|. (5)
使用马戏团函数(4)的性质和傅立叶变换的幅度,可以从图像中提取标识符。 表1中给出了提取鲁棒二进制标识符的算法。标识符在相似变换下是鲁棒的,即缩放,旋转和平移。
表1.标识符提取算法
1.使用适当选择的函数对图像f(x
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[137344],资料为PDF文档或Word文档,PDF文档可免费转换为Word