处理多重共线性问题的几种回归方法开题报告
2022-01-06 22:05:53
全文总字数:1872字
1. 研究目的与意义及国内外研究现状
多重共线性是多元线性回归分析的一个重要的问题。
如何消除共线性的危害一直是回归分析的一个重点内容。
通过研究多重共线性的含义、产生的原因和危害以及常用的诊断多重共线性的方法进行进一步学习,了解明白多重共线性给回归建模所带来的负面影响,为了克服多重共线性问题,利用偏最小二乘法、主成分-逐步回归、岭回归以及lasso-最小角回归等方法对实例进行分析诊断并构建回归模型,以检验所得到的模型是否能够很好的克服了多重共线性,以及模型在预测方面的精确性。
2. 研究的基本内容
本课题主要研究什么事多重共线性,多重共线性产生的原因和危害、以及如何诊断数据集是否存在多重共线性问题,并利用经济统计实例数据作分析,为了克服多重共线性,利用偏最小二乘法、主成分-逐步回归、岭回归以及Lasso-最小角回归等方法对实例进行分析并构建回归模型,最后得到评价模型的相应参数,对比这几种回归模型所得到的参数,分析判断哪个模型在处理多重共线性上效果更好,预测能力更强,模型解释性更好。
3. 实施方案、进度安排及预期效果
(1)实行方案:通过查阅国内外文献了解偏最小二乘法,Lasso回归,岭回归,最小角回归以及主成分-逐步回归等模型算法原理,并熟练掌握这些算法原理,查阅资料得到多重共线性的含义,产生的原因以及危害,了解常用的多重共线性的诊断方法,为了克服多重共线性给回归模型带来的影响,通过偏最小二乘法,Lasso回归,岭回归,最小角回归等进行回归建模分析,得到相应评价模型的参数并判断得到的模型是否消除克服了多重共线性问题,以及利用新的数据集对原数据集进行预测验证模型的预测能力(2)进度:在3月份查阅学习文献资料,4月份学习如何在SAS和R软件上实现它们的算法,并完成论文初稿。(3)预期效果:所选的模型都能够较好的反映了变量与自变量之间的关系并有效的克服了多重共线性的问题,在预测方面岭回归取得的效果最好。
4. 参考文献
[1]. 何晓群,何文卿.应用回归分析第4版[m]. 北京:中国人民大学出版社,2015.3:157-170[2]. breiman l.heuristics of instability and stabilization in model selection [j].the annals of statistics,1996,24(4):2350-2383[3]. robert tibshirani. ragression shrinkage and selection via the lasso [j].journal of the royal statistical society,series b,1996,58(1):267-288.[4]. efron b,hastie t,johnstone i, et al. least angel regession [j].annals of statistics,2004,32(2):407-499.[5]. schwarz.g. estimating the dimension of a modle [j].annals of statistics 1978,6(2):461-164. [6]. efron b,tibshirani r. an introduction to the bootstrap [m].london:chapman and hall,1993.[7]. weisberg s. applied linear regression[m]. new york:wiley,1980.[8]. 满敬銮,杨薇. 基于多重共线性的处理方法[j].数学理论与应用,2010,30(2):105-109.[9]. 郭福星.多元统计分析[m].福州:福建科学技术出版社,1990.[10]. 张尧庭,方开泰. 多元统计分析引论[m].北京:科学出版社,1982.