基于Python和Java script的河网提取和流域划分的新型ArcGIS工具外文翻译资料
2021-12-16 23:06:55
英语原文共 10 页
基于Python和Java script的河网提取和流域划分的新型ArcGIS工具
摘 要
山洪灾害所带来的危害日益严重,尤其是在干旱半干旱地区。因此,基于地图和水文模型对这些区域进行山洪风险评估也显得日益重要。对于未进行过实地测量的流域,可以根据地形地貌特征进行初步分析。而如果要处理有较大流域的区域,可能需要对其中数百个流域进行划分、处理和分类,那么整个过程就需要自动化。像ESRI的Arcgis中的GIS包提供了许多复杂的工具来帮助进行此类分析。但是,如果想要将这些工具组合到一个地理处理模型中以实现整个评价过程工作流的自动化,则仍然存在一些阻碍需要克服。这些阻碍包括:i)根据Strahler理论分配流顺序;i i)计算流网络提取的阈值;以及i i i)确定Strahler有序流网络的每个节点的倾点。在本研究中,我们将介绍并讨论基于ArcGIS模型构建器利用标准工具构建完整的自动化工作流程。并且为了实现工作流程的自动化,还基于ArcObjects平台利用Python和Java进行了一些额外的工具的开发。该工作流程已应用于埃及西奈半岛西南部的数据。并通过统计比较从DEM中提取的所有河流的结构与地形图中可用的参考数据,得出了一个最佳的阈值来优化流域系统的结构。此工具成功地以自动化的方式实现了整个流域的划分、处理、分类流程而不需要额外进行人工的操作。因而可以说明这个工具能够节省大量的时间与精力,从而胜任针对大集水面积的盆地中数百个流域的划分、处理和分类。
1 引言
流域系统在空间和时间上的演变受许多变量的影响,如岩性、线性结构、地貌、土壤和该地区的土地覆盖类型。而其中许多变量反映在地形地貌中,因而可以利用地形计量学的观点对其进行量化和分类。针对任何自然地形要素的形状、几何测量都可以称为为地形计量学(Pike等人,2008年;Selvan等人,2011年)。对盆地地形的详细分析有助于描述流域地形的影响和特点(Chandrashekar等人,2015)。地形分析在对流域山洪灾害风险水平评估中有着重要意义。它可以用来解释盆地地表水的潜力,进而描述盆地的水文特性(Angillieri,2012年;Omran,2013年),并量化水文特征。因此,流域地形分析的结果将是对综合水资源管理计划相当有价值的参考(Jawaharraj等人,1998 Kumaraswami等人,1998;Sreedevi等人,2001)。主要基于地形分析结果的水文模型包括瞬时单位线(Nash,2009)、地貌气候单位线(Gupta等人,1980)和地貌单位线(Rodriguez-Iturbe和Valdes,1979)。这些模型已应用于干旱和半干旱地区的未经测量盆地。而地形参数的研究主要需要对河网和分水岭进行勾画。
因而,针对流域地形分析应采用当今最先进的技术。其中包括遥感(RS)的数据和地理信息系统(GIS)的数据处理,并利用地球观测卫星高分辨率数字高程模型(DEM),以及计算机科学的进展。由于PC或笔记本电脑处理大量数据的能力不断增强,以及进度统计和数学方法的发展,许多困难已经被解决,新的问题也将迎刃而解(Evans等人,2003年)。这导致了一个70年前就已经提出的概念在此复兴。当时,有几项研究侧重于绘制河网及其水文研究(Horton,1945年;Strahler,1964年;Shreve,1974年)。这些研究中使用追踪技术来提取河流网络,并勾勒出其中各个盆地的边界,以研究盆地的特征与这些盆地之间几何结构的关系。在上述研究中,利用经典的方法描绘河网需要直接在现场测量其线性特征或从次级来源(例如,从地形图、航空照片和立体图像数字化)检索。在世界许多地区,地形图由于其可用性、简单性和经济可承受性,仍然是河网分析的基本传统参考。然而,从地形图中提取河流和分水岭线等信息需要研究者大量的时间和经验,从而导致主观决策。此外,手动追踪得到的结果仍然需要转换为数字数据来进行下一步处理。在绘制河网时,手工方法的局限性和主观性突出体现在对地形的描绘需要更加精确和高效。诸如DEM、雷达图像、立体摄影测量以及光探测和测距(LiDAR)点云等数字数据的普适性,为更加客观地描绘网络中的每一条通路打开了新的大门(Sekulin等人,1992年;Bertolo,2000年;Lin等人,2005年;Afana,2011年)。20世纪80年代,出现了利用DEM进行河网提取和数值分析的计算技术(Oamp;apos;Callaghan和Mark,1984年;Jensen,1985年)。如今,像ESRI的Arcgis、Qgis或Saga这样的地理信息系统,在其配置的标准工具箱中都有从DEM中提取河流段和流域的工具。近年来,随着越来越多数据能够利用且数据处理能力的提高,使得在一定时间内针对大流域这种更大数据集的提取,并且将提取结果用于研究流域洪水风险区的地形参数成为了可能(Rudriaih等人,2008年;Al Saud,2009年;Nageswarao等人,2010年)。
要将将DEM预处理的完整工作流程应用于更大区域的地形计量参数提取,就需要对其中数百个流域进行划分和分类,而这一过程必须实现自动化。尽管现在整个的划分与分类过程可以直接进行,但最终提取的结果在地貌和水文模型中的可信度方面仍然存在不同的问题(Omran,2013年)。此外,根据所使用的软件,自动化工作流程中仍然存在一些空白,直到现在,而这些空白必须由手动操作来填补。比如在ArcGIS的空间水文分析工具集中,提取的河段中有对应的Strahler数(拓扑排序),并根据这些Strahler数进行合并来作为流域特征(河网密度、分布频率)。Omran等人(2012)例如,使用Arcgis的空间水文分析工具集,提取的河流段被赋予正确的Strahler阶数,但由于流域特征(如排水密度或频率)是基于这些特征,因此必须根据它们的阶数进行合并。Omran等人(2012)阐述了一个基于Strahler理论的河流段合并算法。但另一个需要解决的问题是根据合并的河流段确定不同子流域的分支点。
尽管对DEM中提取河流进行验证的方法得到了广泛的关注,但对其结果的评价仍然滞后。就像在水文模型中,对提取的河网进行验证应在下一步处理前进行。一般来说,对河网的验证有两种主要方法:定量和定性方法(Chorley等人,1984)。定量方法包括了描述河网结构特性的地貌参数。而这些结构特性从不同的来源(例如,数字地图或提取的排水网络)中提取,并进行统计比较。而定性方法则基于进行现场验证的知识、结果数据的可视化解释、与其他数据源(如正交照片和三维结构)的比较(Afana,2011年)。实地验证依旧是验证河网最精确的方法之一。如果是有严格精度要求的河网的确可以实地验证,但实地验证所需要的时间和精力使得对大流域的实地验证显得不切实际。而地形图则可以作为实地验证的替代物。基于大地测量的按一定比例尺和制图规则绘制的地形图对河网的反映较为准确,如一幅1:25000的地形图就很好地平衡了地物的精细与概括。另一方面绘制河网的精细程度与DEM的分辨率密切相关。对于本研究,考虑到地图数据的可获取性和DEM的分辨率,将使用中比例尺地图(如1:50000和1:100000)来评估结果。而决定河网的精细程度的阀值则以分辨出河流在景观中的起点为准。而这个阀值一般也被称为“特定阀值区域”。该阀值表示一条河流段从起始点到其最终成为一条河流段的最小流域面积。选取一个合适的阀值是整个河流提取的过程的重点,因为其关系后面的最佳河网。而这个合适的阀值的选取与原始数据的规模和分辨率密切相关。(Thompson等人,2001年)。尽管已知不同阀值的选取会使得同一流域最终得到的河网产生本质上的差异,但在实际研究选取河流起始值时,一般还是会先任意选取一个值(Helmlinger等人,1993年)。而通常所选取的阈值越小,最后得到的河网就越详细,生成的初始子流域就越多。另一方面,在利用算法进行河流流向的确定时,会产生不符合实际情况的噪音。因而,为了找到一个最佳的阀值,本研究将提出一些建议。通常来说,确定景观中河道起点的公认方法是利用一个恒定的阀值来对河网进行绘制(例如,Oamp;apos;Callaghan和Mark,1984年;Band,1986年;Montgomery和Dietrich,1992年)。然而实际上由于不同的气候条件、自然景观特征和土地利用类型的影响,不同地区之间的河网密度存在差异(Gandolfiand Bischetti,1997年;Tucker and Bars,1998年)。除此之外,单纯地只靠一个恒定阀值忽视了上游水源地区的空间变化,而这可能会使得预测的结果与实地观测结果之间存在显著的差异(Willgoose和Perera,2001年)。确定阈值的一种常见方法是累计最大流量的1%,而这被当作是表示河网的默认方法(Band,1986;Tribe,1992;Merwade和Ruddell,2012)。Deilami等人(2013)并根据对流量的栅格图层累计栅格值的标准偏差分类方法来确定第一个阀值的中断值。另一种确定阈值的方法是在TauDEM软件中开发并实现(Tarboton,2001;Shrestha和Miyazaki,2006)。Ariza Villaverde等人(2013)建议进行多重分形分析,以确定最佳阈值。而在其他众多的研究中,则基于提取到的网络和地形图上描绘出的线,利用两者之间的图象上的相似性,通过试错法确定该值。本文介绍了一种新的自动选择最佳阈值的方法,并将其与地形图中提取的结果进行了比较。这种方法通过专家知识来确定主要河流的预期流段次序而不是反复进行累计或迭代直到得到所需次序进而得到的阀值本身。
本文介绍了一种根据Strahler理论,结合Python脚本语言和基于ArcObjes平台的Java语言,实现利用河流流段分割从DEM中提取河流网络自动化工作流的模型。该模型通过一系列阀值的迭代,反复执行并批量生成不用的河网构造。而工作流中包括了选取阀值,并比较从DEM中提取到的河网构造结果与地形图中可用的参考数据来实现最佳的河网构造。自动化工作流程将根据河流流段次序划分流域子流域,并将从各流段级提取到的流段数与1:50000地形图中通过追踪法得到的流段数进行比较与统计评估。根据Strahler理论,比较的参数中包括了各流段级的河流流段数和各流段级的子流域数量。最佳匹配结果除了确定提取河流的最佳阀值外,还将确定与地形图相比最为合理的河流构造。
2 数据和研究区域
本研究将改进后的工作流程应用到了西奈半岛南部的Wadi Feiran盆地。该盆地位于北纬28°30#39;到28°55#39;和东经33°20#39; 到34°03#39;E之间,面积约1790(图1),是西奈半岛南部最为著名的流域之一。该盆地也是埃及最崎岖和海拔最高的地区之一(海拔2640米)。盆地中最长的河流长度为120 km,河流从东部的圣凯瑟琳到西部的苏伊士湾的坡度约为39 m/km(Geriesh等人,2001年)。Wadi Feiran的主河道及其支流源自盆地周围的高山,并向西流入苏伊士湾(Kassem,1981)。Wadi Feiran巨型盆地因其干旱和水资源短缺而有着相当独特的特征。该区域内罕见有降雨,并通常以持续时间短、强度高的雷暴雨形式出现。盆地总体在岩性上以花岗岩和火山岩为主,两者在盆地中也最为常见。这种情况在在海拔较高的地区尤其明显。而盆地的中下游地区则以变质岩和沉积岩为主。
在本研究中,利用DEM提取地形数据,并进一步将其转化为研究区域内每个自立于的地形测量参数。DEM数据由地形高程数据生成,并以栅格的形式进行地图信息的数字表达。此外,还从国家航空航天局(NASA)建立的土地过程分布数据档案中心(LP DAAC)收集了Wadi Feiran盆地的先进星载热发射和反射辐射仪(ASTER)全球DEM第2版(ASTER GDEM)数据。ASTER GDEM可从地球观测系统数据和信息系统(eosdis,2015年)获得,其数据为地理纬度/经度坐标为22 m分辨率的高程定位网格下的GeoTIFF数据。DEM于2011年10月发布下载。研究区域的GDEM数据被重新投影到通用横轴墨卡托(UTM)36区(WGS 84)投影。
流域的河网和形态参数(如河流密度、河流分布频率和分叉比)是从1:50000比例尺下的地形图中提取获得的。 Wadi Feiran的整个盆地由11张地形图覆盖而成,该比例尺25 m的空间分辨率(Tobler,1987年)。根据相关地形图绘制了Wadi Feiran盆地的一般流域图,以此来检验主河道的通常形态并划分出封闭的子盆地(图2)。同时,流域解析线基本上模拟了Wadi Feiran盆地的大致形状和性质。
3 研究方法
本节将介绍处理DEM的方法,以便阐述交互式流域划分和河网提取的过程。并将解释完全提取河网和划分流域的标准和步骤。工作流程的构造将基于Arcgis10.1工具箱中提供的工具;值得一提的这些工具中最为关键的是来自空间分析的扩展工具(图3)。并通过Arcgis Model Builder串联起各个工具以进行批处理。由于利用ArcGIS 现有工具在模型构建器中实现循环操作方面仍然较弱,所以本研究将以Java和Python(图4)为额外的技术支持,用来弥补这方面的不足。此工作流程对Wadi Feiran的DEM数据应用的步骤如下:
3.1 从DEM中提取河网
如果知道底层对象的特征(即流段的数量及其各级流段的长度),就可以很容易地在GIS中提取河网(Schr_der和Omran,2013),如下所示:
生成DEM(若未给出)→填充坑、洼地→计算局部流向→计算河网的累计流量→提取河网→Strahler分割→河网矢量化。
在利用DEM绘制河网时一个常见问题是存在水坑,特别是在平坦区域和洼地。因此,通常在进一步处理DEM数据前对水坑进行清除,以便进行河流识别。除了在盆地集水区的一小部分外,还在流域的下游观测到一些水坑。为此,在充填DEM中每个坑洼时都应
资料编号:[4830]