基于深度学习的空间信息模型研究与应用毕业论文
2022-01-26 12:12:02
论文总字数:23406字
摘 要
本课题以探究土壤有机碳与土壤高光谱数据关系为目标,以东台市滩涂土壤剖面高光谱图像为数据,引入机器学习的思想,通过K-means聚类剔除杂质——SG滤波器平滑光谱曲线——对各分段光谱范围进行神经网络建模的技术路线研究了土壤有机碳含量与土壤光谱剖面曲线的模型关系,并最终实现了一项土壤有机碳原型分析系统,为快速探测土壤有机碳含量提供了新的思路和方法。研究所得的主要结论为:(1)可使用K-means聚类算法进行异物剔除,最佳聚类数为8。(2)SG滤波器可有效平滑土壤光谱曲线的噪声。(3)全波段范围不适合用来进行神经网络建模,以100nm为间隔对光谱进行分段,各分段内越靠近近红外波段模型收敛越差,均方根误差越高。其中500nm-600nm最适合用作土壤有机碳高光谱模型的训练集。
关键词:土壤有机碳 高光谱 神经网络
Research and application of spatial information model based on deep learning
Abstract
Aiming at exploring the relationship between soil organic carbon and soil hyper-spectral data, this paper introduces the idea of machine learning with high spectral image of soil profile of Dongtai beach, and removes impurities through K-means clustering, and the SG filter smoothes the spectral curve, The model relationship between soil organic carbon content and soil spectral profile curve is studied by the technical route of neural network modeling of each segmented spectral range, and finally a soil organic carbon prototype analysis system is realized, which provides a new idea and method for rapid detection of soil organic carbon content. The main conclusions of the study are as: (1) The K-means Clustering algorithm can be used for foreign body removal, and the optimal clustering number is 8. (2) SG filter can effectively smooth the noise of soil spectral curve. (3) Full-band range is not suitable for neural network modeling, 100nm as the interval of the spectral, the closer the near-infrared band model convergence is worse, the higher the mean square root error. Among them, 500nm-600nm is best used as a training set for the high spectral model of soil organic carbon.
Key Words: SOC; Hyperspectral; Artificial Neural Networks
目 录
摘要 I
Abstract II
第一章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究综述 2
1.3 研究内容与技术路线 3
1.4 论文组织框架 5
第二章 神经网络模型 6
2.1 机器学习与神经网络 6
2.2 BP神经网络 7
第三章 数据预处理 9
3.1 研究区域 9
3.2 异物剔除 10
3.3 光谱平滑 15
第四章 土壤有机碳高光谱模型 21
4.1 神经网络建模 21
4.2 各波段建模比较 26
4.3 原型分析系统实现 28
第五章 总结与展望 33
5.1 总结 33
5.2 展望 33
参考文献 34
致谢 37
绪论
研究背景及意义
土壤是人类日常生活生产的基础,而作为土壤固态物质的主要组成成分,有机碳是能反应土壤性质的重要指标[1]。存储在土壤中的有机碳约占全球陆地总碳库的2/3~3/4[2]。土壤中微生物作用所形成的腐殖质、动植物残体和微生物的总和是土壤有机质,而其中碳元素的含量即土壤有机碳[3]。一方面,有机碳能促进动植物生长,维护土壤生态多样性,有效提高土地肥力,另一方面,有机碳可与土壤中的盐类构成缓冲体系,提高土壤的酸碱缓冲能力,降低水土流失的危害。因此研究土壤有机碳含量的动态变化与空间分布对研究全球碳循环、温室效应、预测土壤质量变化有着重要意义[4][5][6][7]。传统的有机碳测定方法主要为化学分析法,如酸溶液提取法和重铬酸钾氧化法等。化学分析法的优势在与结果较为精准,但存在试剂成本高,实时性差,工作量大,易产生环境污染等问题[8]。近年来,学界对有机碳预测的研究越来越倾向于使用高光谱分析的方法。研究表明,土壤有机碳含量与土壤光谱特性间存在显著关系[9]。一系列基于多元线性回归、偏最小二乘回归等方法的模型被提出。高光谱分析法克服了化学分析法成本、时间、人力上的缺陷,但也仍存在自相关、难以处理非线性关系及过拟合等问题,新的建模方法亟需提出。
机器学习(Machine Learning,ML)是一项十分年轻的学科。它与许多学科都有所关联,如CS、统计学、数学等。机器学习简单来说就是通过计算发现隐藏在数据背后的规律。早在20世纪50年代,图灵就提出过机器学习的可能性。1952年,Authur Samuel研发出了一个具有自我学习能力的国际象棋程序,并在1956年首次提出了机器学习的概念[10]。此后,大量的机器学习算法被提出,如logistic回归[11],kNN算法[12],SVM[13]等。近年来学界成果最显著的神经网络则诞生于20世纪80年代。虽然早期存在诸如梯度消失,深层网络难以训练等问题,但随着算法的改进与计算机技术的进步,神经网络逐步成为主流,并在各大领域发挥了巨大作用。
针对目前神经网络成熟的现状及土壤作为一个开放复杂系统的特点,以神经网络作为手段对土壤有机碳进行建模与预测是具有很大研究意义的。神经网络具有万能逼近定理,可以拟合复杂度极高的函数。这一特点是其他建模方法所不具备的,可以有效突破过去高光谱分析法非线性拟合、自相关等一系列问题。本文将神经网络引入有机碳预测模型,以均方根误差(RMSE)作为误差判断依据,并使用kmeans算法对图像进行异物的剔除,在此基础上对土壤高光谱数据进行建模,比较了各波段的建模情况,最终将展示一项土壤有机碳分析系统。
请支付后下载全文,论文总字数:23406字