改进潮汐谐波分析:鲁棒的(混合L1/L2)解决方法外文翻译资料
2022-11-14 16:27:05
英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
Continental Shelf Research
改进潮汐谐波分析:鲁棒的(混合L1/L2)解决方法
Keith E. Leffler , David A. Jay
摘要
传统的潮汐谐波分析对无所不在的环境噪声非常敏感。鲁棒的拟合是对谐波分析普通最小二乘法的扩展,并且能够更多好的抵抗广谱噪音干扰。由于幅度和相位的方差是由残差的功率谱计算而来,这种计算能够过滤广谱噪声并减少残差的计算,方差将增加计算参数的置信度,并且还能从背景噪声中分辨出更多低振幅成分。提高信心和更多成分的分辨率对于解决潮汐成分的幅度和相位的季节性和长期变化具有明显的益处。潮汐成分的幅度和相位。使用6个月的计算窗口,置信区间比标准方法计算的结果系统地降低了30-85%,解决的成分增加了20-75%。使用T-tide软件包进行分析(Pawlowicz,R.,Beardsley,B.,Lentz,S.,2002。使用t-tide在matlab中使用错误进行古典潮汐谐波分析。 计算机和地球科学28,929-937],经过修改以适应Matlab实现的迭代重加权最小二乘算法。)
2008 Elsevier Ltd.保留所有权利。
- 介绍
我们越来越需要去了解沿海和河口水域的动态行为,以及这些沿海系统对人为和气候变化的反应。许多河口的预研对管理目的非常重要,了解河口演化也是一个有趣的动态挑战。潮汐提供了解决此类问题的最长工具记录。然而,为了充分利用历史潮汐记录,有必要开发更好的分析策略,因为这些记录通常是简短的,稀疏的和/或嘈杂的。通过记录和转录误差以及气候事件将非潮汐噪声引入潮汐信号。传统的普通最小二乘(OLS)最小化对观察到的信号中的这些非潮汐分量十分敏感。基本上,OLS过度拟合非潮汐组件可以试图最小化总残留误差。这并不理想,因为它会导致结果对无所不在的环境噪声非常敏感。噪音不仅影响估计的潮汐成分幅度和相位,但同样重要的是还影响了这些量的估计方差(Munk和Hasselmann,1964; Pawlowicz等,2002)。
很容易排除“坏”数据,并且在计算中只包含“好”数据。由于几个原因,这种方法是不切实际的。首先,它是劳动密集型和固有的主观性。没有一致并且可靠的拒绝方法,只有最恶劣的异常值才能最终确定为“坏”。另一方面,删除受风暴事件污染的所有数据可能会造成用于分析的数据不足。对于许多分析,有必要从昼夜带解析K1,P1和O1,从半昼夜带解析K2,M2,N2和S2。其中一些成分(例如K1和P1,K2和S2THORN;相差2个周期(一年),这些成分的分辨率需要大约几乎连续的190天的每小时数据(Foreman,1977,1996年修订)。河口潮汐记录可能显示出变化由于河流流量变化和其他原因引起的潮汐参数,并且希望最小化计算窗口长度,同时仍然解决一组适当的成分。
这项工作的一个主要目标是测试“迭代重加权最小二乘法”(IRLS)算法,该算法仅使用潮汐记录本身,一致地减少非潮汐变化的影响并做最小化数据拒绝。这对于历史记录尤其重要,历史记录通常包括部分完整的,手动转录的高低数据(四个观察/潮汐日)。IRLS是一种强大的统计拟合形式,可以减少高杠杆数据点的贡献,从而提高整体拟合度。它已成功应用于其他地球物理问题(例如Bube和Langan,1997)。IRLS是混合L1 = L2最小化的常见实现,是一般Lp最小化问题的子集。对于低噪声数据,该算法保留了L2算法的高频分辨率(Jay和Flinchem,1999),而高幅度异常值的处理接近L1最小化的处理,降低了它们对整体解决方案的影响(Darche, 1989)。通过减少异常值的影响,IRLS拟合减少了估计的方差,从而增加了参数估计的置信度。我们在第2节中介绍算法的数学细节,然后在第3节中,通过数值例子说明IRLS如何更准确地恢复被异常值,高斯噪声和模拟风暴潮污染的已知信号。应用于观测到的潮汐高度数据的OLS和IRLS方法的性能比较见第4节。沿海记录分析的实施在第5节中讨论。
这里给出的分析是使用t-tide Matlab软件包的修改版本进行的(Pawlowicz等,2002)。 为了简化开发,我们将研究限制在均匀时间采样的潮汐高度,并且既没有研究二维电流也没有研究不规则采样数据。
- 数学背景
谐波潮汐分析通常使用OLS进行,这使得每个数据点在解决方案中具有相同的权重。 众所周知,潮汐记录包括风暴潮等非潮汐事件。 IRLS引入了算法计算的加权函数,以减少大残差对整体解的贡献。 对于潮汐分析,加权函数可以减少非潮汐事件的影响。 有助于回顾OLS和IRLS拟合的数学背景以及谐波潮汐模型作为IRLS与人工和真实数据测试的前奏。
2.1普通和迭代重加权最小二乘法
常见的一般回归技术,包括普通和加权最小二乘,都是基于最大似然估计,称为M估计(Fox,2002)。假设线性模型h = Ax,其中h为观测值,A为基函数,x为未知系数集。 对于潮汐分析,系统是超定的,因为观测的数量将不可避免地超过成分的数量(Munk和Cartwright,1966)。正常过程是寻找x的解决方案,其最小化残差r的目标函数r,其中残差定义为 。一般的M估计量最小
(1)
令,对x求偏导,并将结果设置为等于零,为系数x生成一组方程: (2)
通过定义权重函数 (3)
可以写入估计函数 (4)
这最小化了加权残差的总和
(5)
如果将w设置为单位矩阵I的对角线,则等式减少到OLS解决方案(Moler,2004):
(6)
对于加权的情况,w是隐式定义的,并且等于(5)式迭代地求解x和w,而OLS情况(6)可直接求解x。 通过将迭代i处的残差与迭代i 1处的权重相关联来递归地定义加权函数w。通常的过程是设置w=diag(i)为第一次迭代。
“传统”加权函数是Huber的函数和Tukey的bisquare,根据归一化残差R定义.Huber的权重函数定义为 而Tukey的双面广场被定义为
归一化残差R被计算为通用信号偏差统计量s和调谐常数t的函数。 标准差是一个非鲁棒的统计量,因为任意偏差的单个样本将以任意量影响标准偏差。 剩余MADeth;rTHORN;的中位数绝对偏差是一个更稳健的统计量,因为一半样本可能受到噪声影响而不影响统计量(Fox,2002)。偏差的常见估计是 (7)
常数0.6745使得估计参数对于正态分布的误差无偏(Mathworks,2006)。 调谐常数t基本上控制加权窗口相对于残差分布的宽度。 较低的调整常数值会对边远数据造成较大的误差。
附录A中提供了IRLS算法和备用加权函数的详细信息。
-
- 谐波潮汐模型
在时间ti,具有已知潮汐成分频率和未知振幅a,b和c0的潮汐高度hi的传统表示是
和未知参数
标准OLS解决方案来自等式(6),而x的IRLS解决方案是通过使用附录A中定义的权重函数,迭代应用方程式(5)获得的。根据记录长度(LOR)选择组成频率y(Foreman,1977,1996年修订)。LOR和噪声不可避免地限制了任何谐波潮汐分析的频率分辨率。给出了在时间上均匀间隔Dt的n个样本的记录,瑞利准则指出最小可分辨频率差是。Foreman程序根据预期的相对重要性和频率分离选择成分。因为许多成分相隔1个周期(1年或更小),所以4500个天文成分中只有一小部分可以用于任何合理的长度记录。如下所述,Foreman程序所确定的 45个天文学候选成分、24个浅水候选成分长度可达1.3年,但有些成分可能会根据信噪比显着性检验从最终分析中排除。记录大于18.6 年的小时数据将解决500个天文成分中的相当多的一部分。 然而,对于许多沿海和河口记录而言,所有成分在18.6年内保持不变的假设可能是不合理的。
一旦估计了系数x,组成j的幅度alpha;被发现为,并且发现相位角beta;为(Mathworks,2006)。如Pawlowicz等人(2002)所述,应用节点或卫星校正来校正组成振幅的低频变化,并将相角校正为格林威治相。
通过谐波方法计算的构成参数是统计估计而来的,因此具有相关的方差。根据估计的方差计算潮汐成分的振幅和相位的置信区间以及信噪比(Pawlowicz等,2002)。假设是白噪声或有色噪声的条件下,Pawlowicz等人(2002)讨论了估计参数方差和置信区间的方法,包括线性化分析和非线性自举程序。默认情况下,我们假设它是有色噪声,并使用相应的bootstrap方法。
有色噪声的非线性自举方法是基于0,1,2hellip;,8个周期(天)中心带内残差的平均谱密度的误差估计。同样,Munk和Hasselmann(1964)使用背景噪声频谱来估计方差,尽管采用了不同的方法。这里需要区分加权残差和计算估计参数和误差的算法,以及未加权残差Ruw = h-Ax,预测信号和观测信号之间的差值。通过加权最小二乘计算找到最小化加权残差之和的系数。因此,从加权残差的频谱估计所计算的幅度和相位的方差是合适的。
对于具有估计幅度和估计方差的给定成分,可以将信噪比(SNR)估计为
(Pawlowicz等人,2002)。 (11)
非线性自举方法准确地估计参数幅度低至SNRasymp;2-3。此处显示的结果中仅包含具有估计的SNR ge;2的潮汐成分。具有SNRlt;2的参数被排除在预测的潮汐高度的计算之外。 例如,Astoria 1999年的OLS计算拒绝了67个成分中的16个,因为这些成分的SNR是小于2的。
- 数值例子
在本节中,我们描述了两个示例,证明IRLS拟合可以减少非潮汐信号分量对整体解决方案的影响。 首先,我们使用一个简单的线性模型,受高斯噪声和极端异常值的影响,放置对结果有最大的影响。 OLS解决方案与已知信号明显不同,而IRLS拟合消除了大部分异常值的影响,并与已知信号紧密匹配。 在第二个中,我们模拟受噪声影响的简单潮汐,然后添加模拟风暴潮。 虽然组成振幅在统计上与使用OLS和IRLS方法的已知信号不同,但是对于IRLS分析,这些参数的置信区间明显更小。
3.1. 异常值的影响:一个简单的例子
最简单的数据问题是高振幅尖峰,这是转录错误和仪器故障的常见表现。为了显示出色的异常值可能产生的影响,我们用一个简单的线性模型 y=at b eta; (12)
其中t是时间,a和b常数,eta;是高斯噪声(mu;=0,sigma;=0.5)。在信号记录的早期和晚期添加异常值,以最大化它们对线的预测斜率的影响或杠杆作用。如图1a所示,通过OLS计算,给出与其他样本相同权重的异常值,能有效地旋转预测线。计算出的拟合度与大多数数据描述的模式不同。相反,IRLS对异常值拟合,结果与大多数数据紧密匹配。
参数a和b的估计值及其95%置信度如表1所示。注意在存在异常值时OLS的性能不佳:斜率的正确值0.5不在95%置信区间内(对于OLS /离群值情况0.385plusmn;0.064)。同样,截距的正确值1.0不在95%置信区间内(6.83plusmn;3.73)。图1b显示了残差的分布,其中重叠了比例的Huber加权曲线。利用该加权曲线,异常值的影响显着降低,但并未完全消除。斜率和截距的计算值更接近仅噪声情况,正确值在95%置信区间内。鲁棒拟合情况的置信区间比仅含噪声的情况更宽,因为异常值继续具有一些影响,尽管它从OLS情况显着减少。
3.2. 一个简单的潮汐模型与合成风暴潮
风暴潮是潮汐记录中大幅度环境噪声的常见来源。我们构造了一个简单的潮汐信号,包括平均海平面Z0,昼夜分量K1,半昼夜分量M2,高斯噪声eta;(mu;=0,sigma;=0.1)和合成风暴潮s。K1和M2各自由幅度a,相位phi;和频率theta;描述。采样间隔由Dt给出。 在时间步骤i,高度y为 (13)
作为第一个例子,风暴潮被设置为零。 作为第二个例子,风暴潮s在10小时内呈指数增长,在1米处达到峰值,并在接下来的48小时内呈指数衰减。总共144个小时数据点用于计算。噪声 浪涌观测和浪涌如图2a所示。为了比较,具有缩放的Huber权函数的第一次迭代残差的直方图被叠加为仅噪声和
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[17940],资料为PDF文档或Word文档,PDF文档可免费转换为Word