基于结构张量的纹理合成外文翻译资料
2022-10-27 15:28:51
英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料
基于结构张量的纹理合成
摘要
本文提出一个俩阶段的纹理合成算法。在第一阶段,根据样本数据合成一张带有本地定位信息的结构张量地图,并且用于第二阶段合成纹理。考虑到算法需要能够以尽可能真实的视觉角度,统计数据,以及输入样本形态学来复制纹理,此方法被实验于多种纹理,并与现存的方法进行客观比较,其中强调了此方法成功合成了在许多条件下传统算法所不能复制的样本图案中的纹理。预期效果提出一个方法针对多尺度大图案的纹理,比如有层状结构的碳材料样本。
关键字:术语——因果领域;样本纹理;多尺度;非参数的纹理合成;碳模拟;结构张量场。
Ⅰ介绍
在图像处理中,很难对纹理进行普通定义,因为每个人都会以自己的想法理解纹理的概念。然而,一个纹理可被定义为描述大范围有着随机重复图案的自然现象中像素灰度值的区域差异的功能[1]。由于多样性,其描述以及纹理合成展现了一些差异性[2]。自然纹理可以被有效模式化并被用图像合成技术复制[3]。给定一个输入样本,纹理合成旨于合成一种新的纹理,其新纹理可以用相同的对样本结构和随机部分进行建模的基本过程生成。
在过去的几十年,几种参量的和非参量的算法被提出来分析以及合成2D和3d纹理。特别是,马尔科夫随机场(MRF)和块拼贴方法证明了其在和合成结构纹理的有效性。例如,Paget和Longstaff [4]提出基于局部条件概率密度函数的非参量估算的马尔科夫随机场纹理建模方法。此方法用一种描述像素值中相互作用的独特统计模型数理捕捉纹理视觉特征。Wei和Levoy [5]提出一种基于马尔科夫随机场设想的2D纹理合成算法,其算法可以建模作为局部静止随机处理的纹理。输出纹理在扫描线顺序中被逐像素合成。Aguerrebere等人的块拼贴算法直接从输入样本中取样新的值生成纹理。该方法在合成具有高度结构性的纹理极其高效。
至于参量方法,Heeger和Bergen[7]与之后的Portilla和Simoncelli[8]利用过完整的小波变换来用一系列各个方向和规模的统计描述符参数表示模型。
当处理随机微观纹理时随机方法表现出了显著成果。例如,van Wijk在[9]中介绍了点噪声,或者2D点噪声用来合成点图像中的新纹理。该方法提出离散点噪声(DSN)的渐近性通过一致随机化傅里叶系数相位获得。Galerne等人[10]提出一种基于简单傅里叶相位随机化的随机相位噪声(RPN)算法。该算法能够复制描述傅里叶系数特性,取名为随机微观纹理的纹理。
随机相位纹理属于叠加原理占主导的线性世界。声音缺陷就是线性叠加不总是适用于自然图像形成。几位作者更偏向用于生成随机枯叶模型的闭塞原理[11],[12]。
作为一个块拼贴随机方法的集合,Tartavel等人提出利用自适应性字典中原子的第一级统计约束以及在像素值中第二级约束的统一框架。
3D的不同扩展,即固体纹理合成,也被提出。在扩展中,Kopf等人[14]的非参量方法结合了帮助合成的固体纹理聚合的全球统计数据相配的直方图。其他参量[15]或非参量方法[16]的2D/3D扩展也展示了在许多案例中的相关性,包括虚拟材料设计[17]。
现存方法可以成功处理大幅纹理以及在许多应用领域比如透视,恢复,推断,压缩,图像修复,图像映射,视频修复和融合,虚拟材料仿真等[18]-[21]中取得显著成果。然而,大多数方法不能运用在困难环境下,比如长期定向变异的纹理,正如[16]和[22]例子中的材料样本的一些非均质纹理。在这种环境下,大多数现存方法会生成比样本更规则的纹理。作为一种推论,这些方法很难合成复杂波状或循环层状结构的纹理。其他多重大图案的循环纹理也不能被经典方法所复制。这在有帆布纹理[23]的图1中有举例说明,该图测试了能够合成微观纹理(小型平行线)却不能够复制大规模周期垂直条纹的方法[5],[6],[8],[10],[13],如图1所示。
这些案例强调了考虑结构性,即合成纹理时的地理信息后的相关性。Peyre[24]提及到,之前的几何层合成可能会帮助纹理合成。他提出的俩阶段的合成方法坚持在第一阶段生成约束的合成流动方向,在第二阶段,合成纹理本身。第一阶段坚持从样本流动方向中合成流动方向。其流动方向由对局部结构张量[25]-[27]的分析中推断出。合成算法,Heeger和Bergon[7]的多种算法,复制了流动方向多尺度分解系数的边缘分布。第二阶段用相匹配的以流动方向为条件小群分解的系数边缘分布来处理。复杂合成过程展现了在处理有着混乱流动方向局部混乱的平行纹理的良好效果,但考虑到流动方向的奇异性,却不能复制有着图案交叉口复杂几何图形的纹理。
在下文中,我们提出坚持在合成纹理本身前生成结构层的一种新俩阶段纹理合成算法。我们通过其局部结构张量场(LST)分析并表现一幅图的结构层,同时考虑局部方向,能量以及各向异性等级[25],[26],[28]。结构层合成坚持局部结构张量场,不止局限于流动方向。为了达到此效果,我们应用了经常生成标量或矢量(即颜色)数据的非参量Wei和Levoy(Wamp;L)算法[5],用选择相关多重分解以及度量计算了结构张量场的特异性。块拼贴方法允许复制LST的边缘和空间的俩种统计数据。一旦结构层可得到,它会被用来驱使合成纹理层。Wamp;L方法也可被用来作为纹理合成算法的基础,因为其可以轻易包含附加约束比如结构张量场提供的局部各向异性。注意,由于其多功能性和块拼贴原理,该算法被用来合成各种大纹理。然而,其他非参量算法可以轻易替代该算法。
余文安排如下,在第二章讨论Wamp;L算法。在第三章讨论结构张量。在第四章描述提出的俩阶段纹理合成算法。在第五章,合成结果被展示以及讨论了分析结果输出中算法参数的影响。本章也会展示和分析对五个现存算法的客观比较,以及一些色彩纹理的合成结果也会被展示。最后,得出结论以及在六章提出期望。
Ⅱ WEIamp;LEVOY算法
Wei和Levoy(Wamp;L)的非参量算法以马尔科夫随机场设想为基础,其设想证明了涵盖用局部静止随机处理,即每个像素从旁边像素以及空间统计数据不变量可被预测,进行建模的纹理最大范围[5]。该方法旨于获得局部合成的输出纹理与样本纹理块相似。因此,每个合成的像素被确定,以便在输入输出纹理中局部相似处被保留。算法从样本纹理和被随机白噪声初始化的输出图像中开始。合成算法坚持改进噪声输出图像使其看起来与输入样本相似[29]。纹理被一个个像素合成。对于每个输出像素,领域被捕捉而且在样本中找到最相似的领域。然后一致的像素在输出纹理中的目标位置被复制,如图2所示。
欧几里得距离被用来测量俩个矢量领域间的相似性。用有辞典编纂扫描类型(扫描线)的因果L性领域进行合成。因此,一个新像素的合成只依赖于前一个合成的像素(如图2所示)。领域可能包括输出像素开始的行列中噪声像素,但作为算法改进,所有其他领域将完全包含已合成的像素。换句话说,噪声只影响输出纹理中开始行列的合成,因此能够获得合成结果的随机性。在此之后,噪声被忽略[5]。一个有着完全随机游走的非因果领域也可以被用来允许合成的像素去从增加可能的立体基阵的过去中释放自己。
Ⅲ 结构张量
结构张量总结了在一个点的具体领域中梯度的主要方向,和那些梯度方向一致的等级[25]-[27]。在图像处理中,结构张量是一种经常用来表示信息边缘与描述局部图案偏导数的矩阵表示[30]。
一个图像I的结构张量场S经常被定义为I的一级偏导的局部协方差矩阵场。场S在之前估算的梯度场中被建立,,其中符号(lowast;)表示卷积并且和是导数内核。虽然局部卷积核比如Prewitt[32]或Lyvers和Mitchell[33]算子可能为了计算原因被选择,一个普通的估算在离散域的偏导数方法就是用Gaussian导数核[34],
[35]。然后结构张量场 用梯度矢量积的空间平滑算法计算:
(1)
注意,除了结构张量的外部边缘不能被适当计算并且应该被丢弃,结构张量场S与图像I有着相同大小(即行列数目相同)。然而,S是在对称的半正定矩阵Z方向中的有结构张量S(z)的矩阵值。
高斯平均内核——标准偏差——经常被考虑到。正如[36]中提到,空间平滑有俩个目的。第一使结构张量对噪声和其他人工产品有良好鲁棒性,第二描述了在边缘间区域的方向信息。的选择对于得到相关局部图像分析十分关键;高价值需要一个更平滑的结构张量场以及更小的局部方向估算却有更好噪声鲁棒性的环境。相反,低价值保证精准的局部分析但会有高密度噪声[31]。因此,用保证高斯平均窗口大小足够大平滑结构张量的方法根据纹理图案尺寸选择。
在每个z方向,S(z)的特征值分解得出显示局部图像边缘强度的俩个非负特征值和 ,即定向亮度变化的强度,以及在局部边缘正交和平行点的俩个一致的特征向量和。局部方位O(z)用特征向量与计算,其中相位范围为和:
(2)
一致性因素[37]从结构张量特征向量中获得并且范围在0到1之间:
这个可被看成局部各向异性测量。其描述了梯度方向散步的特性,即图像几何学多样性。
所以,结构层将由分配每个z方向的结构张量S(z)的结构张量场S表示。局部方向与一致性也可以在方向场O和相干场C中被映射。因为O和C是与输入图像尺寸相同的标量场,他们均可以图像形式表示。
图3展示了俩个图像结构张量场的方向以及相干图像,第四个柱子展示了用于结构张量场的方向及相干图像的调色板。注意,此调色板可用于以下所有结果。可清楚看出结构张量最后表示了样本纹理的结构,同时展示了方向各异性以及高低相干区域。如图3所示。
Ⅳ提出的俩阶段结构/纹理合成算法
A结构张量场合成
因为Wamp;L的算法工作于标量或矢量值图像,我们首先使其适应于结构张量场特性,即对称的半定矩阵。除了用于比较结构张量的度量标准以外,合成处理与Wei和Levoy
算法相似。该算法从计算样本中的输入结构张量场开始。然后输出结构张量场被结构张量噪声初始化(即张量从输入结构张量场中随机选出)。合成算法坚持改进,使其与相似。
让z成为在输入结构张量场中的一个位置,并且zrsquo;成为输出结构张量场中的一个位置。在每个输出结构张量场的zrsquo;位置中,输出结构(即结构张量的一个矢量)领域是被第一个捕捉到的,然后一致结构张量在的目标位置zrsquo;中被复制:。这种合成处理旨于保证新分配的结构张量将在输入输出结构张量场中维持局部相似性。相同的处理在每个输出结构张量场的位置中被重复直到所有结构张量被处理完。
关于结构张量案例的特异性,俩个结构张量和中的相似性可以用不同度量方法被测量。根据欧几里得距离(ED)定义中得到:
其他三种度量方法被提及:形态取向度量(SO),弗罗宾尼斯范数(FN),以及欧几里得对数度量(LE)。SO测量在几何性能方面张量间的不同点(方向与一致性因素)如[31]:
其中取值在0到1之间,表示方向特异性,由以下公式计算:
表示一致特异性,由以下公式计算:
FN度量在[38]中给出:
其中是矩阵转置标识符。
LE度量,也可以叫做黎曼,在[38]中被给出:
其中是S的矩阵对数。
让表示z方向的领域:,是一系列与K相连的位置,(比如正方形或L形)。简单讲我们将其叫在图像S取值一系列的的结构张量的z方向中的结构张量领域。
z方向和zrsquo;方向的俩个结构张量领域和可以通过计算其结构张量特异性总和值(SSTD)来比较:其中K是每个领域中结果张量的数量,(或相应的)表示领域的结构张量以及M是四种度量之一:,,,。
在结构张量合成处理中最重要的任务之一就是选择领域系统(领域形状和足够的扫描类型),这直接影响了合成的结构张量图像结果。
在本文中,我们应用了带有辞典编纂的扫描类型的因果领域,或带有完全随机游走的正方形非因果领域。在第一个案例中,结构张量值像素的合成完全依赖于前一个结构张量,而且可能导致输出结构张量图像的高度规则性。相反,有着完全随机游走的非因果领域可以被用来允许合成的像素去从增加可能的立体基阵的过去中释放自己。
B约束结构纹理合成
如之前提及,几何层的优先合成可能帮助纹理层合成。因此,在提出的算法中,合成的结构张量场将被用来作为纹理合成的约束。算法将输入样本,其结构张量场,以及合成的结构张量场,如图4所示。
输出纹理被随机噪声初始化并且在合成处理中转化使其看似。合成原理保持与原始Wamp;L算法相同:对于在的每个像素,找到中与之最相似的领域的像素然后在目标位置中复制。然而,领域结构必须考虑合成的结构张量映射提供的额外信息。因此,每个领域有俩个部分:一个是在纹理图像(和)中领域强度值VI,另一个是在结构图像资料编号:[153396],资料为PDF文档或Word文档,PDF文档可免费转换为Word