过原点回归模型的拟合优度测算方法探讨文献综述
2020-06-29 20:28:58
1、 选题目的和意义:
英国统计学家 K#183;皮尔逊最早提出拟合优度检验的时候曾经明确指出过统计学不仅仅是研究样本,而是要根据样本来对总体进行推断,所以说模型检验是构建模型过程中十分重要的一环,经典的计量经济学就是通过构造检验统计量进行模型假设检验。拟合优度检验更是统计理论中的重要内容,与实际应用有着密切联系。在回归分析中评价模型拟合程度的好坏是十分关键的一步。但是大部分拟合优度检验的研究都是基于一般的线性回归模型上,即含有截距的模型。而对于不含截距的模型,即过原点的回归模型,那些经典的统计检验量是否还实用?如果不实用,主要原因是什么?如何对不含截距的模型构造更合适的检验统计量?显然对这些问题的研究、探讨具有十分重要的理论和应用价值。本研究正是基于此展开。
2、 国内外研究现状:
对于拟合优度的检验,现在国内外大多是建立在有截距项的回归模型的基础上进行检验的,通常都是用几种比较经典常见的检验方法,如皮尔逊卡方检验,似然比检验,赤池和贝叶斯信息准则几种方法,并且检验指标一般就是p值,R2等常见指标。
Daniel C. Jupiter, PhD[1]在生物医学研究为例,探讨了预测受试者行为时建立的一些统计模型,并对这些模型分别进行p值,R2值和残差的讨论,其中拟合优度检验用了皮尔逊卡方检验,似然比检验,赤池和贝叶斯信息准则,最小二乘估计法等几种方法,并且对如何评估这些模型有效性的一些概念给出了相对技术性的概述。他认为严格的假设是统计模型的基础,要利用这些工具,重新审视假设,并使用这些工具来帮助评估违反假设的情况。
国内也有很多学者对拟合优度检验进行了探讨研究,并且得出了不同的结论。李景华,朱尚伟[3]论证了线性回归分析指标R2拟合意义的局限性,提出了关于R2的几点质疑,首先,R2的准确含义是总变差意义下的拟合优度,而总变差误差不同于残差误差,从而总变差意义下的拟合优度R2不适宜代表回归模型的拟合优度。其次,R2的拟合意义对回归模型截距项β0有依赖,对没有截距项的线性回归模型,最小二乘估计的部分拟合性质是不成立的,即过原点的线性回归模型就不能用最小二乘估计来检验R2。苏岩[4]研究了多元分布的拟合优度检验,分别用不同方法探讨了单位球均匀分布,多元正态分布,球面均匀分布,椭球对称分布的拟合优度检验,包括包括Pearson卡方 型检验,EDF型检验,非参数U-统计量、V-统计量检验,多元分布特征检验,Monte Carlo检验,样本变换检验,经验特征函数检验等,再应用于回归模型的有效性检验。在多元分布的拟合优度检验中,可能从不同侧面拒绝原假设。提出转换多元分布的拟合优度检验为球面(或单位球)上概率分布的拟合优度检验。崔俊富,高昊,邹一南[6]将投影思想应用于最小二乘法,与传统的基于导数的最小二乘法进行对比分析,得出投影最小二乘对导数最小二乘有补充作用。传统最小二乘估计的取得一般从导数出发,通过一阶导数为零来求解最优化值,从而得出参数估计结果,而投影最小二乘是从投影思想出发,误差最小的求解转化为求向量的投影,也得出相同的参数估计结果,而且与导数最小二乘相比,投影最小二乘的参数估计结果更加直观。
刘明,李明莉[7]探讨了线性回归模型的一些检验方法,先是研究了几种经典参数检验方法,如t检验,F检验,卡方检验,非经典参数的检验方法有自相关DW检验和单位根检验。接着讨论了存在于模型拟合优度检验和多重共线性检验方法中常见的指标检验法,其中拟合优度检验给出了样本可决系数R2、赤池信息准侧(AIC)和施瓦茨信息准则(SIC)以及CP准则三种检验指标的检验方法。覃琼霞、江涛[8]在研究加总偏误时提出了拟合优度检验是检验模型有效性的重要方法, 通过计算证明加总数据的回归拟合优度要小于非加总数据的回归拟合优度,进一步明确了加总偏误计量特性,构建了加总偏误研究的基本理论框架。吴国发[9]探讨判断两个线性模型的拟合优度时提出了一种新的拟合优度检验方法,计算两个模型剩余方差比的分布,再对这两个模型分别进行假设检验。发现无论两个模型的自变量个数是否相同,所要拟合的数据组数是否相同,也无论两个模型的自变量和因变量的形式是否相同,只要因变量都服从正态分布并且方差相同,就可以进行拟合优度检验。该检验能够敏锐地、定量地区分两个模型的拟合优度哪一个为好。程维虎[10]利用人工参数的方法,建立拟合优度检验的回归模型,并将其应用于参数估计,分别讨论了位置参数的估计的强相合性、渐近正态性和稳健性。刘莲花、罗文强[11]采用了统计模拟的方法,主要对6种正态性拟合优度检验方法的功效进行了模拟比较,分别采用Beta分布、Gamma分布、T分布和Lognormal分布4种不同的偏正太分布函数进行抽样,最终得出6种检验方法功效上的总体排序。讨论的统计量有 D、W2、A2、Zc、Za和Zk,发现从功效的角度看,6种统计量的总体排序为:Za>Zc>Zk>A2>W2>D。王重、刘黎明[12]通过实证分析,证明了统计量R2检验模型的拟合优度时存在的问题,并提出新的拟合优度检验统计量β,统计量β从模型本身出发,可以准确的辨别模型的拟合情况。并且实际研究中,根据研究对象的不同,设定不同精度,可以得到拟合数据的最佳模型,从而分析经济问题。
对于拟合优度的检验,国内外大多局限于带有截距项的线性回归模型的检验上,李景华,朱尚伟[3]教授虽然提出了R2对截距项有依赖性,不能作为检验不带截距项的回归模型的指标,但是并没有就此问题展开进一步讨论,没有给出不含截距模型的更优检验方法。
3、简述本文将做的工作
本文首先研究带截距项和不带截距项的回归模型的性质、特点,探讨常见拟合优度检验用于不含截距项的模型时可能出现的问题。并用蒙特卡洛实验对不含截距项的模型会出现的问题进行模拟检验。然后,结合已有研究成果,对于不含截距项的回归模型,设计新的拟合优度检验方法;最后,用蒙特卡洛方法检验、比较设计的各种新的检验方法的优劣,并给出最优检验方法。将得出的结论和已有的研究成果进行比较,给出可能的进一步研究方向。