数据处理方法研究文献综述
2020-03-27 11:24:48
文 献 综 述
在解决定量问题时,我们常常会遇到数据处理问题。比如说造船厂设计时如何在确定了几组点的条件下如何保证船舷的光滑性,路桥行业中公路应该修在哪才能保证绝大部分人能够用到,又或者是统计部门调查后的一大堆数据应该怎样处理后才能准确了解市场的信息等等。数据处理是得到统计资料或确定了前提条件后解决问题的重要一步,如果数据处理不当,将会影响结果的准确性。再加上当今世界计算机已被广泛使用,数据分析的理论通过计算机的超快且准确的计算方法和数值模拟的手段可以轻而易举的解决科学或工程中的关键问题,它已成为科学研究、工程设计等越来越不可缺少的一个环节有时甚至代替或超过了实验所起的作用。最近半个世纪科学研究的实践使人们越来越清楚地认识到,当代科学研究方法论应该有实验、数据分析理论及科学计算三大环节所组成。也就是说数据处理已成为一种新的科学研究方法。
数据处理的常见方法主要分为两类:1、对多元数据的处理;2、求大量数据间的函数关系。
1.对多元数据的处理
在工业、农业、经济、生物和医学等领域的实际问题中,很多我们要研究的问题存在不止一个影响因素,所以需要处理多个变量的观测数据。因此,对多元数据的处理方法显得格外重要。配合电子计算机,多元数据的处理方法也越来越广泛地应用于实际工作中。这些方法主要是多元统计学的一些主要方法。
1.1回归分析法
回归分析方法是多元统计分析的各个方法中应用最广泛的一种。它是处理多个变量间相互依赖关系的一种数理统计方法。变量间的相互依赖关系在实际问题中是大量存在的,回归分析是研究这种相互依赖关系的有效数学方法。回归分析方法是在众多相关的变量中,根据实际问题的要求,考察其中一个或几个变量与其余变量的依赖关系。
1.2主成分分析法
主成分分析法是一种常用的多元统计方法,相对于其他统计学方法,更强调数据本身来指导分析过程,而不是依赖事先给定的某些假设。主要目的是希望用较少的变量解释原始数据中的大部分变异,期望能将许多相关性很高的变量转化成彼此相互独立的变量,从中选取较原始变量个数少且能解释大部分数据中变异的几个性变量(降低原始变量的维数),也就是所谓的主成分,而这几个主成分也就成为用来解释数据的综合性指标。
1.3判别分析