地理空间大数据分析算法综述与验证分析开题报告
2022-01-16 20:15:42
全文总字数:9019字
1. 研究目的与意义及国内外研究现状
随着社会经济的快速发展和信息科学技术水平的不断提高,我国地理信息系统在各个行业中的应用越来越广泛,地理空间大数据分析技术逐渐引起广泛关注。大数据时代的普及,已经完全渗透到我们的生活,比如阿里巴巴的淘宝,网易云音乐等主流软件,均已大数据为背景,为用户提供更加优质的服务。随着时代的进步,地理空间数据的挖掘,地理空间数据在原有的基础上,增添了新的时空,时态信息,为用户和社会发展带来了新的维度信息。
地理空间大数据涉及范围广泛,我们可以从多个领域加以考虑,自从谷歌公司提出开发数字地球的理念,地理大数据涉及的范围也越来越广泛。在人类社会,我们通过地理大数据的分析,为社会和用户提供更好的服务和决策,如城市规划、交通出行、移动通讯等;在自然界,地理大数据的分析,更多的也是为人类社会服务,但其数据源的类型更多的是关于自然,我们所研究的就是他的发展对人类社会的影响,例如灾害评估、沙漠化演变等等。
通过研究地理空间大数据的分析方法,更多的目的是对比分析算法的可行性和适用领域,能否实现多个领域分析还是只适合某一领域,对比分析算法的实用性。国内外研究现状
2.1“大数据”这个概念早在上个世纪的1980年,著名未来学家阿尔文托夫勒便在《第三次浪潮》一书中,就将“大数据”热情地赞颂为“第三次浪潮的华彩乐章”。2008年9月《科学》(science)杂志发表了一篇文章“bigdata: science in the petabyte era”。“大数据”这个词开始被广泛传播。以下对国外大数据研究现状分析:目前国内外的专家学者对大数据只是在数据规模上达成共识:“超大规模”表示的是gb级别的数据,“海量”表示的是tb级的数据,而“大数据”则是pb级别。国外除在大数据的概念上的研究外,重点放在技术研究。美国政府六个部门启动的大数据研究计划中,除了国家科学基金会的研究内容提到要“形成一个包括数学、统计基础和计算机算法的独特学科”外,绝大多数研究项目都是应对大数据带来的技术挑战,重视的是数据工程而不是数据科学,主要考虑大数据分析算法和系统的效率。在国内,“大数据”尚未直接以专有名词被我国政府提出并给予政策支持。因此国内学者关于大数据概念上的研究并不充分,大多是引用以上定义进行阐释。同时在国内对“海量数据”这一说法认同度较高,更习惯将“大数据”称为“海量数据,并没有将两个词进行明确的区分。国内在大数据研究领域的重点在大数据与云计算、数据挖掘,并行计算和分布式处理,应用式主要集中在地理信息系统。
2. 研究的基本内容
本论文研究内容就是对已有的地理空间大数据挖掘分析算法进行分类,对比不同算法在不同的地理空间大数据上的应用。例如气象数据,bim 理念的规划监督测绘数据等时空大数据在数据分类、应用上的效率。并对不同的案例进行演示,对比分析最优算法。
其中较为常见的有以下几类:
1. 空间分类算法:空间分类方法用来对空间实体的集合进行分类。给空间实体分类,可以通过对非空间属性和空间谓词(空间属性)进行分类而实现,也可以二者同时使用。并可利用概念层次进行取样。空间分类常用的算法有: 1d3 扩展方法和空间决策树。
3. 实施方案、进度安排及预期效果
实施方案大致分为以下几个阶段;
1.准备阶段(2月—3月):包括选题方向,数据准备;由于地理空间大数据涉及范围较为广泛,所以在选择方向上要以新颖和实用性考虑。再确定选题方向和范围以后,数据的获取统计也是本次研究最重要的准备。
2.实施阶段(3月-4月):对气象数据,bim理念数据等地理空间数据进行整理分析,其中算法的分析和论述占主要部分,对比分析算法的优缺点,及其适用范围和可行性。
4. 参考文献
[1]于婷.大数据时代的数据挖掘技术与应用[j].通讯世界,2018,25(12):18-19.
[2]郑艳飞,荆培强,丁敏.基于spark的空间大数据实时查询分析关键技术[j].电子技术与软件工程,2018(21):158.
[3]周尧,刘超,徐树楠,曹振宇,耿丽丽,刘建川,廖一铧.基于spark与mongodb的地理空间大数据应用分析系统设计与实现[j].测绘与空间地理信息,2018,41(09):71-74.