基于谱残差的多尺度图像显著性提取方法研究开题报告
2022-02-22 19:46:28
1. 研究目的与意义
图像作为一种信息的载体,可通过人的视觉神经系统被感知和理解。人类视觉机制能从复杂的自然环境中抑制冗余的信息,获取简单但重要的视觉注意信息。伴随着计算机技术和多媒体技术的发展,图像的处理显得愈发重要,模拟人类视觉机制,获取图像显著性部分已经成为图像处理应用的一个重要发展方向。图像显著性检测技术通过模拟人的视觉检测机制获取图像中的重要信息,对于智能机器人,智能交通以及其他智能领域具有重要意义。
在图像处理和分析中,人们所关心的区域通常仅占图像中的一小部分,称为显著区域。所谓显著区域,通常包含人类感兴趣的重要目标,最能表达图像的内容,是人的视觉能够在较短时间内将注意力集中到图像中某个能引起人们关注的区域。如果对于不同的图像区域赋予不同的处理优先级,不仅能降低分析过程的复杂度,而且能提高分析计算的效率。
2. 研究内容和预期目标
一.研究内容
研究者发现,在复杂的场景中,人类视觉系统(hsv)能够迅速地将注意力停留在少数几个显著的目标上,优先对其进行处理 ,这个过程就是视觉注意。这种注意机制使视觉感知过程具有了选择能力,这正好符合计算机图像分析的要求。因此,将hsv中的视觉注意机制引入到计算机图像分析过程中,优先处理容易引起观察者注意的区域,可以极大地提高现有图像分析系统的工作效率,显著目标检测正是在这种思想的基础上提出并发展起来的。
显著性提取模拟人眼视觉注意机制,能够自动识别人眼对图像的感兴趣区域。利用自然图像的幅度谱特性,谱残差(sr)是最近提出的一种无关视觉底层特征的图像显著性提取方法,它直接分析图像的对数频谱(log.spectmm)。通过在频域抽取图像的剩余频谱(spectral residual),快速的计算出空间域的显著图。但单一的谱残差存在不足,完整性和完整度不高,由于没有保留足够的高频信息导致显著对象(或显著性区域)边界不够清晰,所提取的显著对象显著图呈现出稀疏、灰度不均匀等现象,所以提出多尺度谱残差模型,研究多尺度下图像的显著性。
3. 研究的方法与步骤
普遍认可的方法是将显著性区域检测归纳为基于空域的算法和基于频域的方法两类。1)基于空域的显著性检测启蒙于神经学和生物学的研究。后来,itti等人构建了首个自底向上的基于空域的视觉显著性算法模型,从多特征多尺度角度研究,但这些基于空域的算法都较为复杂,且计算机处理的时间的冗余度很高。2)基于频域的算法模型提高了实用性和实时性。而基于频域处理的谱残差(sr)算法,利用傅里叶变换操作图像的频率谱获取谱残差,再进行傅里叶逆变换获取图像的空域显著图。
为克服单一谱残差保留频谱信息少,使得显著区域的完整性与清晰性遭到破坏的缺点,研究者提出一种多尺度谱残差分析模型,对图像进行多尺度分解;再对每个尺度下的图像均进行谱残差分析,获得该尺度下的显著特征图;将所有显著特征图融合为一幅显著图,根据该显著图将显著区域与非显著区域提取出来。对此,采取以下步骤:
(1)给定图像 i(x) ,利用图像金字塔得到δ个尺度下的图像iδ, 取δ=1,2,3;
4. 参考文献
[1] 刘娟妮, 彭进业, 李大湘,等. 基于谱残差和多分辨率分析的显著目标检测[j]. 中国图象图形学报, 2011, 16(2):244-249.[2] 刘宇光, 陈耀武. 基于运动谱残差的视频显著性检测算法[j].计算机工程,2014,40(12):247-250.
[3] 陈文兵, 鞠虎, 陈允杰. 基于倒数函数-谱残差的显著对象探测和提取方法[j]. 计算机应用, 2017, 37(7):2071-2077.
[4] 张立保, 章珏. 基于显著性分析的自适应遥感图像融合[j]. 中国激光, 2015, 42(1):307-314.
5. 计划与进度安排
3.05--3.20,熟悉课题背景,查阅资料,完成开题。
3.21--4.20,开展课题工作,完成课题的主要实验工作。
4.21--5.20,撰写毕设论文初稿。