交通地理信息挖掘算法综述与验证分析开题报告
2022-01-16 20:34:21
全文总字数:7209字
1. 研究目的与意义及国内外研究现状
在现阶段的互联网飞速发展下,面对日益繁杂的激增数据信息,只有采取更为先进的数据挖掘算法才能将冗长的数据信息顺利的保存下来,进而为相关实践研究领域及各行各业服务。关于数据库的知识发现与数据挖掘,已然成为了一个新型热门的研究方向,国内外关于知识发现与数据挖掘的各种系统也层出不穷,这些系统带来的是巨大的社会经济效益。然而各式各样复杂的数据瓦解系统各有利弊,在不同的数据,环境下不同的方法可能带来的是效果上的巨大差异,一个算法在某个领域非常有效,但在另一个领域却可能不太适合,例如:决策树分类法在问题维数高的领域可以得到很好的分类结果,但对数据类之间的决策分界采用 二次多项式描述的分类问题却不太适用。所以选用一个合适的数据挖掘方法是数据挖掘在实际应用中一个十分重要的步骤。数据挖掘是对大量数据进行分类处理,并从中寻找规律的技术,分为对数据的采集、数据的规律处理及数据规律的展示三步。第一步是从各种数据源中选取和集成用于数据挖掘的数据,在收集的大量数据中,还需要对有缺陷的不完善的数据进行数据清洗和完善工作;第二步是利用算法找出数据的统一性;最后一步是用常规方式显示规律。
gis技术是建设各类交通信息平台的支撑技术,诸如可视化交通,交通信息管理系统,城市车辆管理系统等。现已有很多城市将gis技术应用于城市交通管理系统的各个方面并建立了gis-t技术,gis有空间数据存储、管理、分析与可视化表达作用,为智能交通系统的发展提供了技术层面上的支持。运用gis技术建立的可视化交通信息平台可实现电子地图的可视化,并对综合数据库信息进行分析决策和处理,提离道路出行效率,预测出行拥堵状况,降低事故发生率。数据与gis交通信息管理上起到了十分重要的作用。
2. 研究的基本内容
本篇论文主要研究的是已有的数据挖掘算法进行一个分类归属,以及不同的算法在交通地理信息挖掘上的应用,对比各个算法对不同的交通数据例如:公交线,网约车分布等gps数据在有用信息分析挖掘上的效率与精确度,找出不同数据在不同算法下的最优解。汇总各个算法,并对于各个算法进行实验演示,分析算法的优劣与总结。
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、web页挖掘等, 它们分别从不同的角度对数据进行挖掘。
①分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会。
3. 实施方案、进度安排及预期效果
实施方案:
1.数据准备
通过网络获取实验数据,从各个大型交通网站或网约车项目中获得数据。从论文,书本,期刊等栏目中获得目前当前所有的关于数据挖掘的算法。并搭建一个合适的实验环境
4. 参考文献
[1] 王清毅 张波 蔡庆生目前数据挖掘算法的评价[d] 中国科技大学计算机系 2000.1
[2] 周海淞 朱茵 陆化普支撑交通管理综合信息平台的信息挖掘模型[j]2005.6