矩阵极端特征值的优化方法文献综述
2020-06-06 09:51:24
文 献 综 述
在我们的学习生活中,对于矩阵的讨论是伴随着我们深入代数研究的必经之路。随着对矩阵的进一步了解,矩阵在实际生活的应用也日渐广泛、深刻。矩阵的极端特征值也成为了我们重点关注的对象。矩阵的极端特征值的求解方法历来都是备受学者、教授们的关注。基础的矩阵的极端特征值的解法以及扩展在数学界可谓百家争鸣,数不胜数。There are a thousand Hamlets in a thousand people#8217;s eyes.(一千个读者眼里有一千个哈姆雷特。)不同的时代,不同的数学研究者对于矩阵的极端特征值的解答寻求着不同的答案,简单高效的方法是所有数学问题研究的目的,对于求解矩阵的极端特征值的优化促进了提高解决现实问题的效率。
一个向量(或函数)被矩阵相乘,表示对这个向量做了一个线性变换。如果变换后还是这个向量本身乘以一个常数,这个常数就叫特征值。这是特征值的数学涵义。特征值就是把矩阵代表的线性变换转化为数值变换。与特征值对应的特征向量是关键。本来研究一个复杂的矩阵性质,就可以转化为研究特征向量的特点。从而简化分析。物理上力的分解或者其他物理特征的分解都可以用到特征值和特征向量。在实际生活中,所有能够以矩阵形态抽象概括的事物,都可以采用特征值和特征向量来简化分析,研究事物的内在特征。因此特征值的物理涵义,根据具体情况有不同的解释。比如动力学中的频率,稳定分析中的极限荷载,甚至应力分析中的主应力等。
随着社会进步、科学发展,在自然科学、社会科学研究以及工程实践中,对于某些问题,如层次分析法的应用、解数学物理方程、差分方程、Markov过程等问题都可以转化为求解特征值的问题。特征值的应用俨然成为研究方案、解决问题的基本方法。而在诸多的特征值中,有时我们会更加在意极端特征值,即最大特征值的求解。本文就”矩阵的极端特征值”进行讨论。对于极端特征值的求解存在着多种解决方法,如直接法、变换法、迭代法等。
直接法是一次性的快速解决矩阵的最大特征值问题,然而问题的多样性和复杂性,导致其适用性虽然广泛,但是它的操作难度极大。
直接法没有普遍的适用性,因此研究者们对于矩阵的性质,构造出出了变换法求解矩阵的特征值。变换法是指对矩阵进行等价变换,简化矩阵使得更加容易求得特征值。这是最基础的一种方法,在大学的课本教材中有详细的叙述:通过相似变换将矩阵转化为特殊形式的矩阵,如:将对称矩阵对角化,将一般形式矩阵向Heisenberg矩阵转化,最后对两种特殊形式矩阵的求解特征值。此时求得的矩阵的特征值与原矩阵的特征值是相同的,但其特征向量与原矩阵的特征向量一般是不同的,因此需要对所做过的变换进行记忆。所以,变换法的算法和编程是较为复杂的,但其最大的优点是可以求得全部或部分特征值及其相应的特征向量。
通过一系列矩阵向量乘积求得特征值和特征向量的方法叫做迭代法,迭代法通常分为定常迭代和非定常迭代两种。基于系数矩阵分裂的方法属于定常迭代,如Jacobi,Gauss-Seidel,Hermitian and Skew-Hermitian Splitting(HSS),Successive Over-Relaxation(SOR)等方法及其改进和加速形式,由这些方法解决问题时可以得到的一些预条件子,运用某些预条件子来和Krylov子空间方法结合可以求解鞍点问题。共轭梯度法(CG)、极小残量法(MINRES)、广义极小残量法(GMRES)等属于非常定迭代。
上述方法在科学实践中都存在着一定的应用,但是因为存储量大、收敛速度慢、计算精度低、泛化能力弱等存在性问题,使其在应用中具有一定的局限性。
通常我们可以将求解高阶矩阵的最大特征值及其对应的特征向量问题转化为高阶非线性方程组问题。拟Newton法是一种新兴的求解非线性方程组的方法。需要对矩阵求导和求逆是Newton方法在应用中的缺点,拟Newton法克服了Newton方法的缺点,是一种更加有效简便的方法。拟Newton法在德国MTU(Motorenund Tubinen-Union)的MOPS(Modular Performance Synthesis)、荷兰国家航空航天试验室(NLR)的GSP(Gas Turbine Simulation Program)与TERLS(Turbine Engine Real-Time Simulation)美国航空航天局NASA的NCP(National Cycle Program)中都得到了广泛、有效的应用。当初始矩阵为该点雅可比矩阵时,无须在迭代过程中对雅可比矩阵进行重复多次计算,这便是拟Newton法的优点。本文将以此方法与变换法迭代法中常用的一些方法进行对比,从而说明该方法的有效性和优势。
参考文献