面向气象数据的可视化与分析方法研究开题报告
2022-01-14 20:25:26
全文总字数:2262字
1. 研究目的与意义及国内外研究现状
随着信息化时代的来临,智能计算也逐渐变得普及,伴随着大规模物联网的部署,对物联网检测的大规模数据的智能分析也成为可能。
由于气象数据无时不刻都在产生,因此其数据量的规模将非常惊人,因此,如何能够高效的、科学的、具体的对这些气象数据进行可视化展现和分析,为气象预报、农业规划等领域提供长期精准的指导意见,就显得十分重要。
我们国土广袤,地理环境差异巨大,包含许多不同的气候类型,通过分析历史气候数据,能够总结地区气候发展规律,为当地社会生产活动提供极大的指导,例如对灾害多发地区或极端天气频繁的地区提供灾害周期的预测。
2. 研究的基本内容
本课题利用中国气象局发布的官方数据,对不同地区,不同时间段的各项气象数据,包括但不限于气温,降水,风向,湿度,气压与光照时长进行总体分析。
通过对不同类型分析方法的研究,如聚类算法来对我国不同地区的气候类型进行科学的划分,利用时间序列分析方法对地区气候发展规律进行总结并预测未来的短期天气与长期气候发展方向,利用相关性算法对不同气象数据要素之间的关联进行分析总结。
由于我国在全国范围内设立了大量气象观测站点,并且站点反馈数据的频率较高,月分辨率与日分辨率数据均十分充分,因此在利用大量现有数据对算法进行训练后,我们还可以抽取一部分未参与训练的数据对算法的科学性与可靠性进行足够的评估。
3. 实施方案、进度安排及预期效果
进度安排:本论文的后续安排如下,第一章后续部分中会对数据分析的主要流程进行一定的介绍。第二章与第三章中会分别具体说明本课题的开发工具以及使用的数据库,包括其来源以及详细的类目。在第四章中,我们会对本课题使用的具体分析与可视化算法进行详细的说明。在第五章,我们将利用所提到的算法首先对数据进行可视化展现,再对各项数据特征进行建模分析与评估。第六章中我们将对本课题进行总结。
预期效果与实施方案:本课题尝试利用利用来自中国国家气象局的官方检测数据,对不同地区,不同时间段与不同时间分辨率下的各种气候要素数据,如气温,降水,风向,湿度,气压与光照时长等等从不同角度进行分析。尝试研究了不同类型分析方法,如K-means聚类与高斯混合模型算法来对我国不同地区的气候类型进行科学的划分;利用PCA数据降维方法对我们主要气候要素的分布情况进行展示;由于气候数据的优异的周期性,本课题还对时间序列分析以及回归算法对地区不同气候要素的发展规律进行总结并预测未来的短期天气与长期气候发展方向,对于不同模型,还研究了不同结构与不同损失函数下的情况。利用皮尔森相关性算法对不同气象数据要素之间的关联进行分析并利用热力图形式进行展示,为我们对这些数据的规律与分布提供一个非常直观的认识。
4. 参考文献
[1] 唐理兵. 面向空间数据库的空间数据挖掘应用研究[d]. 安徽大学, 2005.
[2] liang k y, zeger s l. longitudinal data analysis using generalized linear models[j]. biometrika, 1986, 73(1): 13-22.
[3] 孙和平, 罗少聪. 中国及其邻区地表气象数据预处理和网格化数值结果分析[j]. 大地测量与地球动力学, 1998(3):51-56.