1.主成分分析方法简介及其应用文献综述
2021-12-23 22:33:51
全文总字数:3474字
文献综述
在现实生活中,有很多的问题含有过多的变量,而这些变量之间或多或少存在一定的关系,但他们之间的联系有的较为明显,有的又联系甚微。主成分分析法能够找出其中联系甚微的变量,并用他们近似的表达出整体的联系,从而起到减少变量的个数的作用,进而简化模型,起到局部表示整体的作用。主成分分析也称主分量分析,就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。主成分分析法是多元分析中处理降维的一种统计方法。本文通过学习与查阅相运用spss统计分析软件对这些指标进行主成分分析得到特征值、方差贡献率及公共因子等相关数据。而信息的大小通常用离差平方和或方差来衡量。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素)因为每个变量都在不同程度上反映这个课题的客观信息。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是.适应这一要求产生的,是解决这类题的理想工具。主成分分析往往会在大型研究中成为一个中间环节,用于解决数据信息浓缩等问题,这就可能产生各种各样的组合方法。主成分所关心的问题,是通过一组 变量的几个线性组合来解释这组变量的方差-协方差结构,它的一般目的是数据的压缩以及数据的解释。
主成分分析以最少的信息去失为前提,将众多的原有变量综合成较少儿个综合指标,通常综合指标(主成分)有以下几个特点1)主成分个数远远少于原有变量的个数;2)主成分能够反映原有变量的绝大部分信息;3)主成分之间应该互不相关;4)主成分具有命名解释性。总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。
目前,主成分分析法在各个领域都有重要研究与应用。戴素贤等人对七种高香型乌龙茶中的香气成分进行了主成分分析他们尝试用主成分分析法来研究茶业香型的变化并进而找到影响这些香型变化的主要化合物同时还发现了不同的茶别中香气化合物变化的趋势并进行了模拟量化,直观地表现了各种香气化合物对香气的贡献程度。李华等运用多元统计分析确定葡萄酒感官特性多元统计分析中的主成分分析等数学工具能够把大量的描述葡萄酒感官特性的描述语精简成较少的综合性更强的描述语,这些精简后的描述语不但能够反映精简前描述语的信息,还可以筛选出科学合理的描述符描述符是描述分析的语言和工具根据描述符可以分类不同的葡萄酒。邵威平等应用主成分分析法完成了不同品牌啤酒风味差异性的评价同-品牌啤酒风味-致性的评价同一品牌不同生产厂之间一致性的评价以及同一生产厂啤酒-致性的评价这些工作。啤酒是个多指标的风味食品主成分分析法可以帮助我们更好地研究啤酒理化指标和啤酒风格之间的相关性从而达到更好地理解啤酒风味的目的。
PCA方法是核磁共振光谱数据多变量分析中常用的运算法则,它充分地减小了含大量相关变量的数据的复杂性使计算机的效率最优化降低仪器噪音,同时使小化学位移的变化最小化预测复杂结构的核磁共振光谱参数,从而分离复杂体系。主成分分析法可以同时对数据集中所有的谱进行分解来获取它们的基本特征即主成分,它不需要预先对波谱的形状等进行假定,即不需要有关的先验知识另一方面MRS数据集中各谱一-般恰恰具有这种共同的基本信息如基本的波形函数等所以在MRS参数量化及校正中主成分分析法有着独特的优势。在运用主成分分析法解析核磁共振光谱时样品矩阵的变化和仪器本身的不稳定性将导致样品的核磁共振光谱峰位和峰形均发生变化。Jenny使用线性内插法和转换校正对其进行改进以增强多变量模式的解释能力并对2种校正方法作了比较。
食品的品质的评价往往是非常复杂的过程。因为影响食品品质的因素大量存在,非人为因素如食品环境中的微生物,温度及pH等的变化带来的影响。另一方面,由于人为的因素掺假也会造成食品品质的低劣,进而损害广大销售者和消费者的利益。如黎海红等人运用主成分分析法对掺伪芝麻油的检测方法进行研究分析。根据主成分分析的实验原理,可以选择芝麻油的折光率、酸价、色泽、水分及挥发物、皂化值和碘价等理化指标作为变量,将这些变量的所测数据做矩阵处理最后分析就能知道掺伪芝麻油的主成分及其贡献率。我们知道,芝麻油掺杂了其他的植物油,其理化指标就会出现变化,这是质量鉴别的基础和依据。利用主成分分析可以从大量的数据中提取与芝麻油掺伪相关的有用的信息,最终可以较好地区分掺杂有其他植物油的芝麻油。采用主成分分析方法还可以评价分析面条的品质,面条品质的感官评价存在着一定的缺陷,在面条品质评价的过程中,需要对大量的待测样本属性进行测量,在这些属性中有一些是由相互关联的数据组成的,如面条的韧性会影响面条的拉断力和平均拉力,因此,拉断力和平均拉力是相关的,倘若在预测韧性的相应等式中同时用到了拉断力和平均拉力,那么预测出的韧性要比实际韧性大,因为进行了重复计算,所以一定要确保等式中的变量之间尽可能地保持独立,主成分分析在这样的情况下通过对一组影响某一问题的相关变量进行线性变换,使得变换后得到的变量独立不相关就叫做主成分,这样的主成分不仅保留了原来相关变量中的主要信息,彼此间又不相关。面条品质通过主成分分析法得到的综合评价与主观评价(外观、色泽、适口性、咬劲、弹性、黏性、食味等)有相似之处,但是它比主观评价更加细化,对具体样本进行了量化,为面条品质的进一步分析提供了可靠的参考依据。
这些都是在生活中各个我们能触及到的地方所涉及到的主成分分析法的运用,看似简单的许多问题,都是统计分析的结果。科学合理地“降维”后,克服了多指标综合评价带来的统计和分析,可见,主成分分析法可以作为一种方便、快捷和准确的量化评价功能学特性的新方法。主成分分析法是一种降维的统计方法,它可以用尽量少的综合指标代替众多的原始数据并尽可能多地反映原始数据所提供的信息。这种方法引起了人们的兴趣并在各自的实际工作中得到了推广应用。但是在实际计算和应用中也会出现一些问题有时会得出似是而非的结论。例如准确地计算和合理地解释主成分分析法是应用于实际的数学方法计算准确固然重要,但更为重要的是对主成分的具有实际意义的合理解释。如果计算结果不能很好地解释原始数据就应作更进一步的分析如分析原始数据中是否有特异数据或者增加或者减少某些原始数据,或者在主成分分析的基础上再进行因子分析甚至也可能该问题并不适宜使用主成分分析的方法。主成分分析的方法确实是好用和有效的,但是也存在着-些弱点。如主成分的个数少于原始变量的个数这就有可能不能反映原始数据的全部信息,所以对于原始变量不多数据结构比较简单的问题,不使用主成分分析法更为合适。
参考文献