数据挖掘技术在火灾事故分析中的应用毕业论文
2022-01-24 16:34:27
论文总字数:22661字
摘 要
每年,火灾事故的发生都会给国家和人民带来巨大的损失。找出火灾发生的潜在规律是预防火灾事故发生的根本措施。火灾事故的大量发生产生了各种事故数据。数据挖掘技术能从海量的数据中提取出有价值的信息,对火灾事故进行数据挖掘分析具有重要意义。本文基于2018消防统计年鉴数据,对文本数据进行词云聚类,根据词云图总结各省市消防主题、主要工作内容、工作方向。对2017各省市和各行业火灾情况分别进行层次聚类分析与K-Means聚类分析。结果显示制造业火灾事故严重程度最高,其次为仓储业与批发零售业。对1950年至2017年火灾事故发生起数、死亡人数进行时间序列分析,构建事故模型。利用模型对2018至2023年火灾发生起数、死亡人数进行预测,根据预测结果可以大致推断我国火灾事故的发展趋势。通过数据挖掘技术对火灾事故进行分析,能将火灾事故按照区域与行业分类,也能对火灾事故进行简单的预测,对未来消防工作的开展具有指导意义。
关键词:火灾事故 层次聚类 时间序列
Application of Data Mining Technology in Fire Accident Analysis
Abstract
The occurrence of fire accidents brings huge losses to the country and the people every year. Finding the underlying law of fire occurrence is a fundamental measure to prevent fire accidents. A large number of fire accidents have produced various accident data. People can find out valuable information from massive data by using data mining technology, and it is meaningful to conduct data mining and analysis of fire accidents. Based on the 2018 fire statistics yearbook data, this paper conducts word cloud clustering on text data, and summarizes the fire protection theme, main work content and work direction of each province and city according to the word cloud map. The hierarchical cluster analysis and K-Means cluster analysis were carried out for the fire situation of each province, city and industry in 2017. The results show that manufacturing fire accidents are the most serious, followed by warehousing and wholesale and retail. A time series analysis of the number of fire accidents, and the number of deaths from 1950 to 2017 was carried out to construct an accident model. We can use the model to predict the number of fires and deaths from 2018 to 2023. The development trend of fire accidents in China can be roughly inferred by studying the prediction results.Through data mining technology to analyze fire accidents, fire accidents can be classified according to regions and industries, and simple predictions can be made for fire accidents, which is of guiding significance for the future development of fire protection work.
Key Words: Fire accidents; Hierarchical cluster; Time series analysis
目 录
摘要 I
Abstract II
第一章 绪论 1
1.1选题背景和意义 1
1.2国内外研究现状 1
1.3研究内容与方法 2
第二章 数据挖掘方法概述 4
2.1预测分析 4
2.2关联分析 5
2.3聚类分析 6
2.4模式甄别 6
第三章 数据收集方法与基本处理 8
3.1火灾事故数据来源 8
3.2数据基本处理 9
第四章 火灾事故数据聚类分析 12
4.1词云聚类分析 12
4.2层次聚类分析 13
4.2.1层次聚类算法 13
4.2.2各省、自治区、直辖市层次聚类分析 14
4.3 K-Means聚类分析 17
4.3.1 K-Means聚类分析原理 18
4.3.2 各行业火灾情况 K-Means聚类分析 18
第五章 火灾事故数据时间序列分析 21
5.1 ARIMA模型 21
5.2火灾事故数据ARIMA时序预测 22
第六章 总结与展望 27
参考文献·········································································································· 28
第一章 绪论
1.1选题背景和意义
2018年全国消防部门共接报火灾事故23.7万起,受伤人数为798人,死亡人数为1407人,直接财产损失36.75亿元。2017年全国消防部门共接报火灾28.1万起,伤881人,亡1390人,直接财产损失36亿元[1]。虽然随着科技的发展,我国安全生产形势有所好转,但每年火灾事故依然造成了大量的财产损失和人身伤亡。与其他事故相比,火灾具有突发性、广泛性、灾害性等特点,给救援活动带来许多困难。
自互联网技术发展以来,人类社会与物理世界有效地连接起来,建立了一个数字化的网络体系。参与互联网的个人、组织无时无刻不释放出巨大的比特数字流,造就了一个崭新的大数据时代。人类的数据生产能力达到空前。2009年IBM的某项研究成果表明,人类数据总量的90%是在过去两年内产生的,到2020年,全世界所产生的数据规模预计将达到2009的45倍[2]。大数据具有大量、高速、多样、价值等特点,蕴藏着巨大价值。
请支付后下载全文,论文总字数:22661字