数据挖掘技术在航空事故分析中的应用文献综述
2020-05-03 22:22:25
一、研究背景与意义 大数据时代的到来影响着各行各业的发展,”数据”一词炙手可热。
近年,IBM的一项早期研究结果显示,人类文明诞生以来其数据总量的90%是在近几年内产生的,10年后全世界所产生的数据规模预计将达到今天的45倍。
这些不断增加的数据大山不失为一座座获取潜在行业机密的金山银山,谁能抓住核心数据谁就能获取最为关键的信息,给行业或所在领域发现潜藏的瑰宝。
本次论文的研究工作着眼于交通运输安全的航空安全领域。
航空旅行是中国乃至全世界人民日常出行的便捷选择,航空安全尤为重要。
有数据显示,使用航空出行的人口数量每年都在大幅增多,由此导致航空运输产业产生的数据和文本信息也越来越多,这预示着可供挖掘的潜藏信息也越来越多。
面对超大规模的数据信息,传统的数据分析方法用于分析的数据体量很小,难以满足当下各行各业对于数据分析的需求,人们需要一种能够适应大规模数据分析应用场景的数据挖掘方法。
数据挖掘是从大数据中提取有用信息的过程,应用数据挖掘技术分析航空事故数据是非常适合的。
数据挖掘可以发现数据的内部结构,发现变量值的固有规律性,航空事故的数据拥有众多属性,可以说是海量且多维的,通过运用数据挖掘技术可以对航空事故数据进行众多类型的有效分析,根据采集到的数据信息选取合适的数据挖掘方法,以达到最终的分析目的。
在中国民用航空安全信息系统、ASN(航空安全网站),NTSB(美国国家运输安全委员会)等网站上公布着航空事故的相关信息,通过对这些数据和文本信息进行挖掘,或许可以发现隐藏在数据大山下具有指导意义的信息黄金。