含有缓慢移动点目标红外图像序列的压缩外文翻译资料
2023-07-31 12:07:24
英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料
含有缓慢移动点目标红外图像序列的压缩
Revital Huber-Shalem,* Ofer Hadar,1Stanley R. Rotman和Merav Huber-Lerner
内格夫本古里安大学通信系统工程系,
邮政信箱 方框653,以色列的贝尔谢娃84105
内格夫本古里安大学电气与计算机工程系,
邮政信箱 方框653,以色列贝尔谢娃84105
*通讯作者:revital.huber@gmail.com
收到2010年3月4日; 2010年6月1日修订; 接受2010年6月7日; 2010年6月8日(文件编号124993); 于2010年6月30日发布
红外成像序列用于在存在不断变化的云台或背景噪声的情况下检测移动目标。 本研究集中在小于一个像素像素的慢点移动目标,例如距传感器远程的飞机。 由地面传感器捕获的红外(IR)图像序列包含大量的数据。 由于将该数据发送到基本单元或者存储它将消耗相当多的时间和资源,因此期望维持点目标检测能力的压缩方法。 为此,我们开发了两种时间压缩方法来保持点目标的时间特征。 我们使用基于信噪比(SNR)的点目标检测测量法评估了所提出的压缩方法,并且表明与压缩前的IR序列相比,压缩可以提高SNR结果。 copy;2010美国光学学会
OCIS代码:100.2000,100.4999。
1.简介
红外(IR)图像序列用于在存在不断变化的云混乱或背景噪声的情况下自动检测移动目标。 Stan-dard IR图像序列包括二维图像,其大小取决于空间和时间分辨率。由于目标大小小于一个像素,所以目标在图像中是未解决的,只有其时间签名使我们能够将其与背景区分开来。空间分辨率的降低将进一步降低目标的信号水平。
这些IR图像序列包含大量数据,其传输和存储非常耗时。 为了减少所需的时间和资源,需要维持点目标检测能力的压缩方法。 大多数压缩方法处理设计为由人类观看者观看的图像或视频流,或者包含在压缩之前可以空间检测的大的目标。 近两十年来,人们对视频流的压缩方法已被广泛研究和讨论。 现在的流行压缩标准是MPEG-2和H.264 [1,2]。 这种有损压缩方法利用心理视觉冗余,其中压缩算法丢弃未被人类观察者感知的信息以及利用相邻像素值之间的相关性的时空冗余。
用于图像和视频压缩标准的通用空间压缩算法是二维离散余弦变换(DCT)量化或小波变换(WLT)量化。空间像素块的DCT或WLT集中了人眼无法察觉的高空间频率的系数。这些系数通常使用有限量化来减少为零[1,2]。这种降低高空间频率系数的空间有损压缩阶段可能导致点目标丢失或模糊。视频序列压缩的第二个方面是时间性的。用于视频流的公共时间压缩算法涉及运动估计和补偿,其中搜索来自当前帧的块与先前或下一帧之间的最佳空间匹配[1,2]。在这种情况下,如果有其他更大的匹配元素(如云),IR序列中的点目标的单个像素将被忽略。此外,IR序列的强度范围预先未知。比视频压缩标准允许的像素值更宽的强度范围需要量化,这可以减少目标与其背景之间的强度差异。
在[4]中可以找到使用H.264压缩IR视频序列的例子,其中主要的目标大小为1像素,随着测试电影的进行和扩展,传感器和目标之间的范围减小。 [4]的结果表明,随着压缩比的增加,更远的焦油(小尺寸)根本不可检测,甚至最低的压缩比消除了点目标。因为通常的压缩标准和方法不是设计用于大小减少包含点目标的IR序列,所以我们开发了两种维持点目标检测能力的有损时间压缩方法,并可以跟随无损空间压缩阶段。提出的压缩方法是独立于点目标检测算法,以保持更改或替换检测算法的灵活性。因此,在传感器的原始数据上没有实现检测算法,而是将数据压缩,然后传输进行评估。被称为“抛物线拟合”的第一压缩方法基于背景和目标像素的时间分布,其可以全部由抛物线建模(多个等式达到第二度)。为了简单和高的压缩深度,我们只对一个轮廓的一个小节进行一个抛物线,其余的部分被认为是噪音。该拟合假设目标可以在时间段内仅遍历一个像素一次。抛物线拟合使用最小二乘估计(LSE)来选择与时间数据最接近的抛物线。这里提出的第二种压缩方法是时间DCT量化,其中时间原文DCT高频系数通常被重新设为零,这减少了要发送的数据量。
据我们所知,这种用于实现点目标的IR序列的独特压缩方法尚未得到充分的研究。 IR序列压缩的两种现有方法是移动目标指标(MTI)[5]和基于中值预测器的无损视频压缩(MPLVC)[6]。 MTI方法考虑长距离目标检测,其中目标是几个像素的大小和缓慢移动。方差分析方法将运动信息整合在时间和空间域上。如果被检查帧的时间方差高于或等于临时和空间阈值,则像素属于潜在移动目标。所得到的检测视频由二进制像素组成,其值重新出现疑似目标(“1”)和背景(“0”)。该检测视频序列是原始IR视频的压缩版本。由于压缩电影中的每个像素由一位(二进制)表示,所以压缩深度等于最初表示每个像素的位数。可以通过游程长度编码实现进一步的协调。 MTI过程导致检测率高,但误报率(FAR)有时会很高[5]。由于MTI进程失去了大多数信息,除了可疑目标的位置,FAR还原的后续过程无法实现。
IR序列的MPLVC方法更为普遍,并不限于小而慢的焦点。首先,当前像素在时间上与其在同一位置的前一个值进行比较。如果值相等,一位“0”表示它,并检查下一个像素。否则,该位被分配“1”,并且如下应用空间压缩。对于每个像素,对于其从上方到其左侧的三个立即空间邻域(最大值,最小值和中间值)计算一些简单的统计量。将像素值与这些计算值进行比较,并根据比较结果用几位进行编码。像素值和相关统计值(中值,最大值或最小值)之间的差异是经过算术编码的。无损压缩产生2到10.5之间的压缩深度;对于包含每个像素8位的空中点目标的视频,压缩深度为8 [6]。因为大多数像素由于噪声而在时间上改变,所以即使没有目标或者是像云一样流逝,两个时间上相关的像素在数值上很少相等。因此,大多数这种压缩是空间的,而不是我们有损的时间压制方法。
我们的时间压缩方法的性能使用压缩比以及每个像素的检测分数以及整个序列的基于信噪比(SNR)的检测度量进行评估。这项工作中使用的IR图像序列取自美国空军网站,位于[7]。使用具有3.4至5:0mu;m的光谱区域和40和24mu;m的正方形像素尺寸的两个IR照相机获取数据。这些序列包含95或100帧,每帧具有210times;300像素,12位像素表示。帧速率为30帧/秒(fps)。由于用于这一场景的传感器固定在地面上并指向天空,所以信号的时间变化来自杂波(云),目标的运动和噪声。序列包括一个或两个缓慢的目标,横跨不同类型的天空元素 - 云(杂乱占主导)或清澈的天空(噪声主导)[8-13]。我们的压缩方法的结果与原始序列的得分和彼此相匹配。
本文的组织结构如下。第2节处理得分和评估指标。第3节详细介绍了两种有损时间压缩方法。第4节介绍了所提出的时间压缩方法的结果。第5节总结了本文,并为今后的工作制定了计划。
2评分和评估指标
A.像素时间 - 时间处理算法
点目标通过的像素的时间分布具有高和窄的峰值,其中点源的强度与峰值的高度成比例,并且点源的速度与峰。云边缘通过的像素的时间分布具有单调值变化(通常倾斜)[9,10,14]。由于点目标不能在空间上被检测到,目标跟踪和检测算法是时间性的。该算法对视频序列中每个像素的时间分布进行评分,并产生分数图像。该时间过程将像素的时间分布和其最大波动的总体时间偏差进行比较,因此被称为变化估计比分数。如果这个波动足够高,那么该像素被怀疑是一个目标。方差估计从利用LSE的线性拟合在时间分布的滑动窗口上执行的基线背景估计开始[15]。该估计被称为线性拟合。在从部分时间分布中减去线性拟合之后,在较短时间段上计算方差。时间分布的最大值方差与时间分布的K最小方差的平均值之间的比值是像素的分数[8,12,13]。
为了计算短期方差,我们首先从时间方面对线性拟合估计进行分解,使用长度为L个样本的短期滑动窗口和L0个样本的重叠来计算方差sigma;2。如果时间轮廓中的样本总数为N,则方差计算的窗口数为
并选择最大方差值sigma;max2
时间轮廓的W窗口。
为了评估时间分布的得分,我们使用基于SNR的度量,其中零均值
时间曲线^仅由噪声()组成
没有目标。 当目标存在时,^等于目标信号t加噪声。
其中对于1le;ile;K的sigma;〜2i是时间分布的K最小方差值。
该算法的性能取决于所选择的窗口大小。线性拟合估计的长期窗口应足够短,以跟踪由杂波入口或出发引起的变化,分别导致线性拟合水平的上升或下降。另一方面,要足够长的时间来进行准确的估计,以抑制噪声而不是目标,这可能在窗口比目标的临时宽度短的情况下发生。方差估计的短期窗口应近似匹配目标宽度。非常短的窗口可能不包含足够的样品进行计算,并且可能不会抑制尖峰,但是非常宽的窗口可以抑制目标峰值的影响。
方差估计比例分数算法不假定目标的形状和宽度,而是确定影响时间分布的最大空间目标大小。此外,该算法总结了目标强度与背景强度的正相关[8,12,13]。
B.信噪比评估公制
方差估计比分数算法通过SNR度量进行评估。第一步划分像素分数[方程估计比例分数2.A,方程式(2)]图像成为30times;30大小的空间块,并对每个块(scoreblock)进行分数。第二步计算整体
电影得分(scoremovie)。
计算块得分(scoreblock)作为块中最大NM像素得分的平均值,其中M是不属于最大组M的像素分数的平均值,除以不属于M的像素分数的标准偏差(STD)除以最大NM评分组:
其中veth;iTHORN;是块i的方差估计比分数,E 1/2·是期望算子。
电影得分以类似的方式计算,但是使用块得分如下,其中TB是目标块组:
该电影得分是基于SNR的,其中信号是分子(由平均非目标块得分分解的平均目标块得分),噪声是分母(非目标块得分的STD)。 随着电影得分的提高,目标检测更容易[8,12,13]。
时间压缩比
时间压缩比(CR)被计算为每个像素的每个时间段的压缩后可用的参数的数量。 对于最初包含N个帧的时间段和压缩后的L参数,时间压缩比CR是
CR frac14; N=L: eth;5THORN;
我们介绍的另一种压缩措施是实际的压缩比。 它给出了关于时间压缩输出参数的紧凑性的更好的概念,因为它们中的许多在两个提出的压缩方法中被归零。 对于每个方法,实际压缩比的计算方法不同,如第3节所述。我们必须记住,压缩比是在没有实现空间压缩或位编码的情况下计算时间压缩的,而且他们将参数的数量考虑在内 关于电影的原始大小的传输,而不是参数的位表示。
3. IR的时间压缩方法
影像序列
这项工作旨在压缩包含移动点目标的IR序列。这种压缩应该保持目标及其检测能力,而不会模糊或消除它。如第1节所述,由于常见的视频压缩标准是为人类观看者设计的,所以压缩使用人眼不能理解的心理视觉冗余[2]。另一方面,红外线电影包含点目标被自动处理,以便检测目标。因此,这种红外线摄像机的心理视觉冗余利用率可能会降低检测能力。据推测,所提出的IR影片压缩方法是基于有损时间压缩的。进一步的压缩,如无损或近无损的温度压缩和位流编码,超出了本文的范围。本节介绍了两种提出的有损时间压缩方法 - 抛物线拟合和时间DCT量化。
每个时间压缩过程从时间中值滤波阶段开始,窗口大小为3.否则,噪声像素或实例的峰值由于在压缩之前或期间平滑了时间分布,因此每个像素类型中的高时间噪声水平将分散在几个帧上。具有较低强度的这种较宽的山丘或谷可被错误地检测为目标。因此,中值滤波有助于避免这种误报。
两个时间压缩方法都可以减少每个像素的时间噪声,因为它们对高频DCT系数进行曲线拟合和归零。因此,噪声部分被平滑并且它们的方差减小。这些操作也减少最小方差平均值,从而增加非目标像素的方差比估计分数。因此,如第3.A节所述,为了降低噪声和云像素分数,将白高斯噪声(WGN)加到解压缩信号中。
A.加高斯噪声
在本小节中,我们建议对像素分数计算,即方差估计比分数进行补充。这种添加在解压缩压缩序列后是至关重要的,因为它增强了目标和背景像素之间的分类,并增加了压缩的电影分数。压缩和减压过程根本不受此添加影响,压缩比略微降低。
像素分数算法(2.A节)将时间分布分为小窗口,计算其方差,并将最大方差除以最小方差的平均值。因此,为了降低背景元素相对于目标像素分数的像素分数,它们的微小差异应该会增加。这样的增加可以通过将时间噪声添加到解压缩的电影的时间曲线来实现。由于噪声主导的像素可以通过高斯噪声[16]建模,并且所有其他曲线都具有一定程度的这种噪声,所以我们使用正态分布来生成所有像素类型的合成噪声。由于实际的噪声分布和准确的原始温度曲线对于减压和检测的过程具有重要意义,所以我们使用不准确的噪声模型。
根据压缩前的时间段的噪声水平,在解压缩后将高斯噪声加到每个时间段。背景噪声水平被估计为不被认为属于目标的元素的标准差[17-19],被称为非最大组(NMG)的元素。在第3.B.1小节中进一步说明了NMG要素。
时间压缩的电影的时间曲线可能比原始曲线更平滑,如在3.B和3.C节中提出的压缩方法的情况。因为我们使用的目标检测方法(第2.A节)计算最大和最小平均最小方差之间的比例,当降低噪声时,噪声主导部分平滑,并且它们的方差减小。
这减少了最小方差平均值,因此增加了像素的方差比估计得分。对于噪声像素,该STD仅代表压缩前的噪
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[614079],资料为PDF文档或Word文档,PDF文档可免费转换为Word