基于时间地理的游记地名消歧开题报告
2020-02-18 20:03:32
1. 研究目的与意义(文献综述)
时间地理学和gis空间分析方法的结合研究,梳理了从地理属性数据到可视化结果的过程,反映了属性特征在时间背景下的状态变化。具体表现为某个地理单元位置的变化趋势。gis让时空路径、时空棱镜等时间地理工具的构建变得更加便捷,增强了可视化效果。通过数据可视化分析,人们可以简单明了的理解数据,分析数据,挖掘数据中存在的潜在规律,缩短人们对数据的加工处理时间,同时位置是最能反映出一个地理单元特征的属性信息,也是gis空间分析方法的必要保障。
在时间维度的层面上进行gis空间分析,不仅可以用来预测未来可能变化的趋势,还可以反映在该时间段内地理实体的位置分布概率。由于一个地理命名实体可以映射为多个地理实体单元,因此对于某个地理命名实体到地理实体单元的指代关系具有一定的不确定性,而这种不确定性可以通过时间背景下地理单元可能存在的空间位置而减小,即缩短在空间上的地理位置搜索范围,从多个歧义地名中确定一个或多个候选地理实体单元,消除地名歧义。这种基于gis技术和时间地理学进行时空节点规划和优化的方法可应用于应急救灾、物流配送、旅游规划等领域,从而提高时间利用率,节约成本,使得时间地理学与现实生活有机结合,丰富了gis空间分析的理论研究内涵。
在web背景下展开研究,有利于在海量的网络数据中对地理信息的提取和web地理数据的挖掘。web挖掘是利用各种数据挖掘方法、文本挖掘、机器学习等技术从web页面数据、日志数据、超链接关系中发现感兴趣的、潜在的、有用的规则、模式、领域知识等。网络丰富着人们的生活,地理数据是gis空间分析的基础,如何在浩如烟海的网络数据中抽取出我们感兴趣的地理数据并定位到某个地理实体单元是一项十分重要的工作,它不但涉及web技术,还涉及地理学,信息学,程序设计等多个学科技术。这项工作也是大数据时代的驱动,让数据帮助我们界定web文本中我们所需要研究的空间区域,对于空间决策,辅助分析具有十分重要的意义。
2. 研究的基本内容与方案
在web网络的背景下,将地理信息系统技术的分析方法与时间地理学的框架结合起来,研究web文本中的地理命名实体与地理实体单元的对应关系,消除地名歧义。
首先,在web网络背景下,通过web文本爬虫,从大数据中抓取出研究的web文本,此时的文本是非结构化的 ,即由一个个"字"组成,通过相关的算法将文本进行分词,探索出文本的名词词性,结合地名知识库提取出候选地名集,地理译码后获得候选地名集中各个点的经纬度坐标,形成地名空间数据库,此时,便可以通过地图的映射关系在二维平面上展开,地名点数据集形成空间点图层。空间点图层中各个点的空间位置不同,不同位置的点可能具有相同的地名属性,即一个地理命名单元可能指向不同的地理空间实体。
其次,确定移动个体的起始地理位置和最终定向移动的终止地理位置,在先验知识下,起始点和终止点所表示的地名不具有地名歧义,同时,时空移动的个体具有一定的时空约束条件,即能力约束、组合约束和权威约束,三者作为移动对象的约束因子,可以确定移动个体的最大速度。将起始地名点和终止地名点结合约束因子,在时间维的基础上展开,以o为原点,建立三维空间,x轴和y轴表示移动个体地理维度和地理经度,xoy平面表示移动个体的空间位置,z轴为时间轴,绘制出空间棱柱体,并将空间棱柱体投影在xoy平面上,投影面称为潜在路径区域(ppa)。
最后,将在潜在路径区域(ppa)与地名点数据集形成的点图层做空间布尔运算,如果地名点位于ppa区域内,则保留地名点,此时的地名点为无歧义且具有空间对应关系的地名点;如果地名点位于ppa区域外,则该地名点为歧义地名点,从而达到地名消歧的目的。
3. 研究计划与安排
3月15日前查阅相关文献,整理研究路线;
4月20日前以研究方法展开探索,对研究结果进行分析与评价;
5月5日前进一步结果分析与模型完善,并与导师交流
4. 参考文献(12篇以上)
[1]唐旭日,陈小荷,张雪英.中文文本的地名解析方法研究[j].武汉大学学报:信息科学版,2010,(8):930-935.[2]钟翔,高勇,邬伦.基于链接分析的网页文本核心地名提取方法[j].地球信息科学学报,2016,18(04):435-442.
[3]张毅,王星光,陈敏, 等.基于语义的文本地理范围提取方法[j].高技术通讯,2012,(2):165-170.
[4]李照航,郭风华,李仁杰,傅学庆,严正峰.大量网络游记文本中热度地名提取方法与实证研究[j].地理与地理信息科学,2015,31(01):68-73.
[5]宋子辉.自然语言理解的中文地址匹配算法[j].遥感学报,2013,17(04):788-801.
[6]朱少楠,张雪英,李明, 等.基于行政隶属关系树状图的地名消歧方法[j].地理与地理信息科学,2013,(3):39-42.
[7]马雷雷,李宏伟,连世伟, 等.地名知识辅助的中文地名消歧方法[j].地理与地理信息科学,2016,(4):5-10.
[8]王宇. 基于网络文本的地名空间模糊建模[d].南京师范大学,2012.
[9]沈浩, 黄晓兰. 大数据助力社会科学研究:挑战与创新[j]. 现代传播-中国传媒大学学报,2013, 35(8):13-18.