船舶交通事故中的聚类分析方法比较研究文献综述
2020-04-25 20:21:52
1.研究的目的和意义
随着现代化社会的发展,海上运输成为国际贸易最主要的运输方式之一。船舶数量的急剧增加直接导致了海上交通事故频繁地发生,造成大量的人员伤亡和财产损失。海上交通运输最令人关切的首要问题就是事故和安全,所有的海上交通设备、助航设施以及海上交通管理系统等几乎都是为了防止事故发生和保证人生及财产安全,只有对海上交通事故的原因进行深入的分析才能防患于未然。
聚类分析指将物理或抽象对象的集合 分组为由类似的对象组成的多个类的分析过程,其目的就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学, 计算机科学,统计学,生物学和经济学等。海上交通事故的原因是多方面的,包括船舶设施的性能、船员的素质、航线、天气等等,为保证海上运输通道的安全,需要对已发生事故的原因进行归类分析,通过聚类算法的对比,从不同角度发掘船舶交通事故发生的规律,对其根本原因进行关联性建模,根据分析结果对船舶交通安全管理做出相应的改革,以防止类似事故的再发生。
2.国内外关于数据分析的研究现状
聚类分析作为数据挖掘的主要方法之一,引起了人们广泛的关注。20世纪90年代中期,聚类研究主要是对早期算法的改进和创新两个方面。然而早期的聚类方法很难处理大量的高维数据,在现实生活中的问题多数有着多样性和不确定性,数据量庞大而繁杂,促使了聚类分析研究在实际应用中的不断革新。国外的学者早在上个世纪七、八十年代的时候,就开始广泛地对交通事故多发点的成因分析开 展了研究;国内关于交通事故多发点的研究开始于 二十世纪九十年代。到目前为止,有多种方法被应用到事故致因分析中:邬慧国等人【1】提出了分别运用模糊聚类分析方法中最大最小法和夹角余弦法 推导出相似关系矩阵,得以进行模糊聚类分析的过 程;王岩[【2】提出将引发事故的多种可能因素与所谓的 “事故危险性指标”参数进行灰色关联分析的方法,进而找出该路段上的事故多发的主要成因;孙璐等人【3】在针对目前交通事故多发点鉴别常用方法存在的问题,引入了DENCLUE聚类算法用于事故多发点鉴别,对于DENCLUE聚类算法的基本原理,基本定义及计算步骤进行了详细的阐述,重点分析了该算法用于多发点鉴别的可行性。董宪元【4】等人基于道路交通事故由数值型和枚举型数据构成的特点,分析道路交通事故数据频率分布特征,采用信息熵方法评价数据离散程度,客观确定交通
事故案例属性权重,并应用二阶聚类算法建立案例检索库,提高案例检索精度;以 Matlab R2008a为仿真工具开发交通事故案例检索系统,以沪杭高速公路交通事故数据为例,采用 K-NN 案例检索算法进行案例检索试验,结合案例最高相似度和案例集匹配度综合评价案例检索精度,验证该案例检索优化方法的有效性。近年来随着GIS空间分析技术的发展,一 些 GIS空间分析模型也被应用到事故致因分析中, 例如: Masayuki HIRASAWA 和 Motoki ASANO【5】建 立了一个基于GIS的交通事故分析系统,分别对事 故率、致死率与道路(道路结构、附属设施)、交 通量、天气状况之间的内在联系进行了分析;Fla- haut【6】提出了一个包括只考虑空间变量的空间自相 关在内的面向空间集成模型,应用对数回归来评价 道路特性与当地环境特性对道路事故空间集中程度 的影响。
聚类分析作为近年来热门的研究领域,涉及数据挖掘、机器学习、数据分析等多个方面,众多学者对其的研究分析也使得聚类分析在水上交通安全管理上的应用在逐步的完善和提高。
{title}2. 研究的基本内容与方案
{title}本毕业设计主要讲述了聚类算法在水上交通事故实分析例中的应用,针对长江船舶事故的一个数据集进行分析。提取船舶交通事故的多个事故属性和致因要素,选取两种以上的聚类算法对其展开分析,挖掘船舶事故发生在多个因素里的潜在规律。
1. 翻阅相关文献,了解聚类算法的基本定义及其应用,掌握两种以上不同的聚类算法
2. 学习MATLAB的使用,熟练掌握聚类算法在MATLAB程序中的实际运算操作