空间数据挖掘算法综述与分析开题报告
2021-12-27 21:20:40
全文总字数:8829字
1. 研究目的与意义及国内外研究现状
对目前的研究现状可知,国内外对空间数据挖掘算法已经做了大量的研究,但是缺乏对各种算法的综合性描述,很有必要对各种空间数据挖掘算法的全面综述的研究。随着科技的不断发展,各种新的空间数据挖掘算法不断出现,每种算法都有其适用范围,急需对各种的综合分析,提高这些算法尽快的进入实际生产生活中。对于本次研究的目的主要是针对各种空间数据挖掘算法,对其进行分析研究,找出各种算法的特点,挖掘算法的潜在应用场景,能为各行业应用其算法提供良好的参考。
国内外研究现状
李德仁院士于1994年进行知识的挖掘的理论,在加拿大举行的国际gis大会上第一次提出要对空间数据库至此空间数据挖掘才开始兴起[13]。
空间数据挖掘是对数据挖掘的拓展,对于空间数据挖掘的研究主要任务包括,空间关联规则挖掘,空间聚类挖掘,空间分类挖掘空间,孤立点挖掘。空间关联规则挖掘[14],是由koperski等人基于关联规则的基本概念,将关联规则与空间数据库相结合提出的,主要是将数据项替换为空间谓词。杨晓梅、蓝荣钦等研究了基于s-域的空间关联规则挖掘[15],万鲁河、刘万宇等提出了集成元规则和fp-增长树方法的多层空间关联规则挖掘算法[16],刘雨露提出了基于序号索引的空间关联规则挖掘算法[17],李宏伟、陈虎、王振宇等提出了基于概念格的空间关联规则挖掘的优化算法[18]。 s.shekhar和yan huang提出了把关联规则的思想泛化成空间索引点集的空间同位规则概念,在不违背空间相关性的同时用领域替换掉事务[19]。 huang,shekhar, xiong提出了广为人知的join-based算法[20]。为了提升同位规则挖掘效率,yoo, shekhar等又提出了join-less算法[21]。随后wang lizhen,bao yuzhen等提出了cpi-tree算法[22]。胡彩平,秦小麟提出了正负空间同位规则挖掘的算法[23]。欧阳志平等提出的模糊空间同位规则的算法[24],余翠兰提出的基于投影fp-growth的同位规则算法[25]。空间聚类挖掘目标也是基于一些空间度量规则,对空间数据进行一个合适的划分并且使得组内空间数据对象之间的相似性远大于组间的相似性。lin等融合划分聚类和层次聚类提出了csm算法[26],pei等将最近邻聚类和密度聚类结合提出了nn-density算法[27],王家耀等将遗传算法与k一均值算法结合提出了用于空间聚类分析的遗传k一均值算法[28]。tung等提出了cod-clarans算法[29],以解决现实空间中含有障碍约束的难题,estivill-castro等基于autoclust算法提出了考虑空间障碍约束的autoclust 算法, wang xin等提出了考虑空间障碍约束的dbrs 算法[30],张雪萍等基于k-medoids算法、粒子群算法、蚁群算法、量子粒子群算法发展了带空间障碍约束的群集智能聚类分析算法[31],石岩、刘启亮等提出了一种考虑空间障碍以及空间邻近位置的聚类算法[34]。对于空间分类的挖掘算法主要包括,shekhar等使用空间自回归模型和基于贝叶斯的马可夫随机场进行空间分类挖掘[35],郑勇涛、刘玉树提出了使用支持向量机对空间数据进行分类挖掘并用在了炮阵地地形分析中[36],王海起、王劲峰提出了一种局域神经网络的方法[37],胡彩平、秦小麟将多元线性回归模型和空间自相关性结合,提出了一种新的空间数据分类预测模型[38],杨睿通,贺兴时,李建辉提出了基于空间决策树的方法。现有的发现孤立点的方法大多建立在统计学的基础上,大致可以分为4类:基于分布的、基于深度的、基于距离的和基于密度的。
2. 研究的基本内容
空间数据挖掘指的是从空间数据库中抽取隐含的知识、空间或非显式的存储在空间数据库中的其它模式等。本文系统的研究各种空间数据挖掘算法的理论及各自的特点。通过文献查找和分析主要空间数据挖掘的特点,总结出空间数据挖掘算法主要分为空间分类和预测、空间聚类、空间孤立点和空间关联规则四大类。
空间分类是指分析空间对象导出与一定空间特征有关的分类模式;分类和预测具有很大的相似性,在数据挖掘界广泛接受的观点是:用预测法预测标号为分类,用预测法预测连续值为预测。主要的空间分类和预测方法有以下几大类:
(1)空间对象分类方法——id3算法;
3. 实施方案、进度安排及预期效果
实施方案:
研究技术路线:
首先,了解本论题的空间数据挖掘算法的研究状况,形成文献综述和开题报告。其次,进一步搜集阅读资料并研读文本,做好相关的记录,对各种空间数据挖掘算法有较详细的了解,形成论题提纲。第三,深入研究,比较各种算法的优缺点,结合实验分析提出有关数据挖掘算法的改进,写成初稿。最后,反复修改,完成定稿。
4. 参考文献
[1]胡彩平.秦小麟.空间数据挖掘研究综述[j].计算机科学.2007(5).
[2] pei li,sudipto banerjee,alexander m. mcbean(2011) mining boundary effects in areally referenced spatial data using the bayesian information criterion geoinformatica 15:435-454.
[3]方缓.车启凤.数据挖掘之聚类算法综述[j].河西学院学报.2012(5).
[4]周海燕.空间数据挖掘的研究[d].2003(4).