基于支持向量回归和梯度回归的雾霾预测模型研究开题报告
2022-01-07 22:04:12
全文总字数:2787字
1. 研究目的与意义及国内外研究现状
pm2.5是雾霾的主要成分,对人体健康有很大的危害。所以本文把pm2.5浓度作为衡量雾霾程度的指标,把各影响pm2.5浓度的气象因子作为变量,建立雾霾预测模型,最后测试、分析模型的预测效果。
本文选取南京市2016年-2017年每日的气象因子数据和pm2.5浓度数据,以一部分数据作为训练数据集,以另一部分数据为测试集,测试模型的预测效果。根据查阅的资料,pm2.5浓度会随着气候的变化而变化,所以本文先做白噪声检验和平稳性检验,观测数据的大致趋势和数据的波动情况。再做相关性检验和kmo检验,判断选取的数据是否适合做因子分析。如果数据适合做因子分析,通过因子分析选取合适的因子,用来建立支持向量回归机模型和梯度提升回归树模型,并用交叉验证法优化模型参数。最后用数据测试建立的模型,比较分析两种模型预测效果。
结合当前的雾霾情况,为pm2.5浓度预测提供相关依据,从而进一步为雾霾治理提供帮助。
2. 研究的基本内容
本课题基于南京市2016年-2017年气象因子数据和PM2.5浓度数据。根据相关性检验和KMO检验,判断数据是否可以做因子分析。如果可以做因子分析,再选取因子用来建立支持向量回归机模型和梯度提升回归树模型,并用交叉验证法优化模型参数。最后测试模型预测效果,比较分析两种模型预测效果。
3. 实施方案、进度安排及预期效果
实施方案:
通过查阅书籍、期刊及网络上的数据和雾霾的相关内容,找到南京市2016年-2017年的各气象因子和pm2.5的相关数据,做好数据准备。接下来查阅资料,根据资料发现气候较冷时比气候较暖时雾霾情况更为严重,所以在论文开头需要先做白噪声检验和平稳性检验,观测数据的波动情况和大致趋势,为后面模型的建立做铺垫。在老师、同学的帮助指导下,运用所学的统计软件完成数据的处理,建立雾霾预测模型,分析模型预测效果。
进度:
4. 参考文献
[ [1] 谢忠军.霾预报,世界级“疑难杂症”[n].中国气象报,2013-02-14(1).
[2] 谢心庆,郑薇.国内外pm2.5研究进展综述[j].电力科技与环保,2015,31(4):17-20.
[3] 王燕.应用时间序列分析(第三版)[m].北京:中国人民大学出版社,2008:17-31.