基于机器学习的新型肺炎疫情对旅游行业的影响分析毕业论文
2021-11-07 21:00:05
摘 要
旅游行业是一种凭借着旅游资源,把旅游的一些相关的设施作为旅游基础,由开发商或者某些旅游公司向旅游者提供游览和旅行相关服务的一个行业。我们熟知的相关业务主要有三部分:旅游业,住宿业以及交通客运业。这三个部分中,旅游业是本文主要研究的内容,即旅游者参观旅游景点所用于的门票费用。2019年12月份底,新型冠状肺炎从武汉突然爆发,并且迅速蔓延到全国,为了响应政府号召,少出门,国内旅游业受到了重大影响。我国的旅游业在我国有着很重要的地位,包含着多个产业,然而,新冠疫情对旅游业的影响是全方位的。
本文,主要研究旅游业中旅游人数的一个变化,分析疫情期间对各地旅游业的影响。主要以省份为单位。研究方向中一个重要的模型是ARIMA预测模型,涉及到回归阶数项,自回归项和移动平均项,最后采用的是ARIMA(1,1,1)模型预测。在预测过程中进行了平稳性检验,白噪声检验,并且计算了标准误差和置信区间,相关检验结果表明模型拟合程度较好。
本文最终分析得出的结论是:新冠肺炎疫情对旅游业的影响较大,以湖北较为明显。疫情使得湖北的旅游人数减少约为56%,其他省份旅游人数减少25%-50%左右。
关键词:新冠肺炎,旅游业,机器学习
Abstract
Tourism industry is a kind of tourism resources, some tourism facilities as the basis of tourism, by the developers or some tourism companies to provide tourists with tour and travel related services of an industry. We are familiar with three related businesses: tourism, accommodation and transportation. In these three parts, tourism is the main research content of this paper, that is, the entrance fee used by tourists to visit the tourist attractions. At the end of December 2019, covid-19 suddenly broke out in WuHan and quickly spread to the whole country. In response to the government's call to travel less, the domestic tourism industry was greatly affected. China's tourism industry plays a very important role in China, including many industries. However, the impact of covid-19 on the tourism industry is comprehensive.
This paper mainly studies a change in the number of tourists in the tourism industry, and analyzes the impact of the epidemic on the local tourism industry. Mainly in terms of provinces. An important model in the research field is the ARIMA prediction model, which involves regression order terms, autoregressive terms and moving average terms. Finally, the ARIMA(1,1,1) model is used for prediction. In the process of prediction, the stationarity test and the white noise test were carried out, and the standard error and confidence interval were calculated.
The final analysis of this paper concludes that the covid-19 epidemic has a significant impact on tourism, especially in HuBei province. The outbreak has reduced the number of tourists in HuBei province by about 56 percent and in other provinces by 25 to 50 percent.
Key word: COVID-19,tourism industry,Machine learning
目录
摘要 I
Abstract II
第1章 绪论 1
1.1 项目的背景及意义 1
1.2 国内外研究现状 1
1.3 本文的主要工作 2
1.4 本文的结构 3
第2章 数据的收集 4
2.1 数据需求分析 4
2.2 数据类型和数据集 4
2.3 数据收集 6
2.3.1 数据来源 6
2.3.2 数据收集过程 6
2.4 数据存储 8
第3章 数据预处理 9
3.1 数据清理 9
3.2 数据审核 9
3.3 数据筛选 10
3.4 数据规约 10
第4章 构建模型 12
4.1 模型的确定 12
4.2 ARIMA预测模型 12
4.2.1 AR模型 12
4.2.2 MA模型 13
4.2.3 ARMA模型 13
4.2.4 ARIMA模型 13
4.3 参数选择 14
4.3.1 参数d的确定 14
4.3.2 参数p,q的确定 14
4.4 影响分析 15
第5章 模型分析及评估 16
5.1 数据对比 16
5.2 预测模型 16
5.2.1 差分次数项 16
5.2.2 自回归项 17
5.2.3 移动平均项 18
5.2.4 ARIMA预测 18
5.3 省份影响分析 19
5.4 模型综合评估 19
5.4.1 平稳性和白噪声检验 19
5.4.2 标准误差和置信区间 20
第6章 总结与展望 21
6.1 总结 21
6.2 展望 21
参考文献 22
附录A 23
附录A1 数据收集代码 23
附录A2 数据预处理代码 24
附录A3 ARIMA预测模型代码 25
致谢 27
第1章 绪论
1.1 项目的背景及意义
2019年12月底,武汉暴发新型冠状肺炎疫情,新型冠状病毒是一个非常厉害的病毒,它的厉害之处并不在于杀伤力强,而恰恰是由于新冠的杀伤力不强,致死率3%左右,但是传染性确很强,这就导致了新冠在全国迅速的传染开来。从而对中国的经济,人民的生活造成了很大的影响。在经济层面来说,各行各业都多多少少受到了新冠的影响,但是旅游行业与其他一些行业不同,新冠对旅游行业造成的影响可以说是不可估量,且短时间内难以恢复的。在这样一个危机的背景条件下,这篇文章将研究新型冠状病毒肺炎疫情给我国旅游业带来的一些影响,具体到各个不同的省份。目前主要的研究方向有三点,一是观察以前的数据和今年的数据的一个变化情况,二数根据以前的数据预测未发生疫情下的旅游情况,三是根据预测值,分析影响程度。
这几年来,中国的旅游业发展越来越好,更多的人愿意把旅游作为一种放松自己的方法。根据相关数据显示,中国旅游业对中国GDP的贡献已经超过了百分之十,可以说旅游业在中国非常重要,成为国民经济重要组成部分。此外,旅游行业不仅仅只是自己发展,他还带动了很多其他产业,例如交通业,一个好的旅游城市必须有好的交通。因此,可以说旅游行业在中国经济层面的意义无比重要,不仅作为国民经济的重要组成成分,而且还能带动其他产业。然而不幸运的是,自从疫情爆发以来,全国相关交通发送旅客量都大幅减少。