论文模板
文 章 题 目
作者姓名1,作者姓名2
(1.单位名称,安徽 合肥 230091;2.单位名称,北京 100038)

关键词:(3~8个,来源于正文)BP神经网络;辅助变量;空间插值;沟壑密度;陕北黄土高原
摘要:(本刊主要采用报道性摘要,作者撰写的摘要应来源于正文且独立成文,使读者不用阅读全文即可知道文章主要内容和研究结论(结果),要从目的、方法、结果/结论等方面展开叙述,300字左右)选择合适的插值方法实现沟壑密度在区域尺度上的空间插值是迫切需要解决的科学问题,基于陕北黄土高原80个试验样区5 m分辨率DEM和30 m分辨率DEM计算得到的研究区平均坡度作为辅助变量,利用BP神经网络插值方法进行陕北黄土高原沟壑密度插值,并与不同插值方法结果进行对比,结果表明BP神经网络插值在处理目标变量与辅助变量之间存在相关关系,却不存在一个准确的关系式的情况时具有优越性,插值结果精度更高。此外,还对比了基于不同辅助变量的BP神经网络插值精度,结果表明对于样本点稀疏、地形起伏较大的区域尺度空间插值,利用辅助变量的BP神经网络插值精度明显高于不采用辅助变量的插值方法,然而选取的辅助变量必须与目标变量有较强的相关性,增加相关系数低的辅助变量往往会导致插值精度的降低。

[中图分类号] S157   [文献标识码] A

    沟壑密度是衡量黄土高原地区地貌发育阶段、影响侵蚀产沙过程的重要地形参数,也是进行水土保持综合调查、制定流域综合治理规划的重要指标依据[1-2],准确计算黄土高原地区沟壑密度具有重要实际意义。目前,沟壑密度的计算主要是基于数字高程模型(DEM)提取沟谷网络,统计研究区沟谷网络总长度,研究区沟谷网络总长度与研究区面积的比值即为沟壑密度[3]。然而,DEM分辨率对沟壑密度计算的准确性有很大的影响,只有采用高分辨率DEM数据才可以得到比较准确的沟壑密度[4-5]。由于缺乏符合要求的大尺度数据,目前难以实现基于高分辨率DEM的黄土高原地区沟壑密度计算,因此在计算样区沟壑密度的基础上,选择合适的插值方法实现沟壑密度在大尺度上的空间插值是迫切需要解决的科学问题。
    目前广泛应用的插值方法包括反距离加权插值、样条函数插值、克里金插值等,这些方法存在各自的优缺点和适用条件,在样本数目有限、插值区域较大时,插值结果的精度难以保证[6]。以克里金插值方法为基础,利用辅助变量衍生出的插值方法包括局部平均的简单克里金法、具有外部漂移的克里金法、协同克里金法、回归克里金法等[7-8],这些方法可以有效地提高估值精度,广泛应用于中小尺度地理要素的空间估值中。然而,除协同克里金法外,这些插值方法的应用前提是待估值变量与辅助变量之间有一个明确的关系式,但大多数情况下二者之间存在较强的相关关系,却不存在一个准确的关系式[9-10]。人工神经网络无需事先确定输入输出之间映射关系的数学方程,仅通过自身的训练,学习某种规则,在给定输入值时可得到最接近期望输出值的结果,作为一种用计算机模拟生物机制的方法,其分析原理使得这种方法对解决机理尚不明确的问题十分有效[11]。其中BP(Back Propagation)神经网络属于多层前馈神经网络,具有高度的非线性映射能力[12-13],许多研究表明在大尺度地理要素空间变异研究中,特别是在小样本情况下,BP神经网络插值及预测具有更高的精度[14]
    因此,本文以陕北黄土高原为例,采用BP神经网络方法,基于低分辨率DEM进行陕北黄土高原沟壑密度插值,并与其他插值方法进行对比,分析BP神经网络插值结果精度,以期为获取大尺度沟壑密度结果提供借鉴和参考,推动水土保持高质量发展。
(以上为前言部分,介绍背景等材料)
研究区概况
    陕北黄土高原是黄土高原的核心地区之一,主要包括陕西省榆林市和延安市。以黄土地貌为主,黄土黄土塬、梁、峁及沟壑、黄土喀斯特等地貌发育十分典型,基本涵盖了黄土高原大部分的地貌组合及景观形态。其中,北部主要为沙丘、草滩等风沙地貌;中部主要为黄土梁峁丘陵沟壑,并分布有石质山岭;西部属于子午岭低山丘陵区;南部主要为黄土残塬、黄土台塬。属温带半干旱和暖温带半干旱气候区,降水主要集中在夏季和秋季,易形成暴雨径流侵蚀地面,造成严重水土流失。
研究方法
2.1数据处理
    在研究区选择涵盖不同地貌类型的、均匀分布的80个试验样区(见图1)每个样区采用5 m分辨率DEM计算沟壑密度,作为BP神经网络插值的基础数据,5 m分辨率DEM数据来源于陕西省测绘局;此外采用覆盖研究区的30 m分辨率的DEM计算研究区平均坡度,作为BP神经网络插值的辅助变量,30 m分辨率DEM数据来源于地理空间数据云网站(https://www.gscloud.cn/)。
图1 陕北黄土高原80个试验样区分布(图略)
(应按照先文字后图片的顺序,所有图片顺序排序)
2.2 BP神经网络插值
2.2.1插值过程
    BP神经网络包括输入层、隐藏层、输出层3个部分,理论上三层BP网络可以逼近任何有理函数[15]。BP神经网络算法包括信号的正向传播和误差的反向传播两个过程,其中在正向传播过程中,BP神经网络通过隐藏层神经元对数据进行处理,从而输出相应结果;在反向传播过程中,BP神经网络通过对比真实结果与预测结果之间的误差来不断调整各层神经元的参数值,从而减小误差,达到理想效果。本研究将80个试验样区分为72个训练样本和8个检验样本,通过Matlab软件中神经网络工具箱完成BP神经网络插值计算,主要过程包括数据导入—随机产生训练集和测试集—创建BP神经网络—设置训练参数—训练网络—仿真测试—数据反归一化—性能评价。
2.2.2插值方法对比
    为了对比分析BP神经网络插值的精度,通过ArcGIS软件分别采用样条函数、反距离加权、协同克里金、回归克里金等方法进行插值,其中协同克里金法的协同变量为研究区平均坡度,回归克里金法的回归模型采用试验样区平均坡度和沟壑密度的线性拟合公式(见图2)。此外,为了分析基于不同辅助变量的BP神经网络插值精度,设置研究模型和3个对比试验:①研究模型指辅助变量为研究区平均坡度;②对比实验一指不采用辅助变量;③对比实验二指辅助变量为3个邻近点坐标值;④对比实验三指辅助变量为3个邻近点坐标值和研究区平均坡度。
图2 样区平均坡度与沟壑密度的关系(图略)
(坐标图应注意标值线指向图内,去掉没有标值的标值线)
    插值结果的精度分析采用平均绝对误差和均方根误差2个误差评价指标,其中平均绝对误差反映了估值的误差范围,均方根误差反映了估计的灵敏度和极值情况,平均绝对误差和均方根误差越小代表插值结果精度越高,计算公式分别为
公式略        (1)
公式略        (2)
公式建议用mathtype格式编写,全文顺序编号
式中:VMAEVRMSE(简单参数可不用mathtype格式)分别为平均绝对误差值和均方根误差值;n为检验样本数量,本研究中n=8;PiAi分别为检验样本中的沟壑密度的插值结果和实际计算值。
结果与分析
    表1为不同插值方法的误差评价结果,可以看出,插值结果精度从高到低依次是:BP神经网络插值法、回归克里金法、协同克里金法、反距离加权插值法、样条函数插值法。研究表明,对于小区域的地理要素估值,如目标变量与辅助变量的相关系数在0.5以上,则采用协同克里金法插值时可以提高估值精度;如目标变量与辅助变量的相关系数在0.7以上,则采用基于目标变量与辅助变量的回归模型的回归克里金法插值时可以提高估值精度[16-17]。由表1可知,回归克里金法和协同克里金法的插值精度高于反距离加权插值法和样条函数插值法的插值结果,表明对于大区域的地理要素估值,回归克里金法和协同克里金法也可以在一定程度上提高估值精度;以区域平均坡度作为赋值变量的BP神经网络插值精度高于回归克里金法和协同克里金法,这是由于尽管平均坡度和沟壑密度之间存在相关关系,但是由图2可知,样区平均坡度和沟壑密度的线性拟合相关系数为0.499,数据点的分布相较于拟合直线比较分散,二者的回归关系不够显著,因此,BP神经网络插值在处理目标变量与辅助变量之间存在相关关系,却不存在一个准确的关系式的情况时具有优越性。
1  不同插值方法精度分析结果
误差 插值方法
研究模型 样条函数插值法 反距离加权插值法 协同克里金法 回归克里金法 对比模型一 对比模型二 对比模型三
VMAE 0.600 2.006 1.485 1.273 1.111 1.923 1.673 0.640
VRMSE 0.714 2.471 2.527 1.781 1.456 2.936 2.103 0.848
    此外,本研究还对比了基于不同辅助变量的BP神经网络插值精度。结果表明插值精度从高到低依次是:研究模型、对比模型三、对比模型二、对比模型一。不采用辅助变量的BP神经网络插值法的插值精度最低,在采用3个邻近点坐标值作为辅助变量后,插值精度有一定程度的提升;在采用3个邻近点坐标值和研究区平均坡度作为辅助变量后,插值精度进一步提升;然而BP神经网络插值精度最高的是采用研究区平均坡度作为辅助变量,表明增加辅助变量并不能使插值精度保持增加。通过计算,得到试验样本沟壑密度与平均坡度、第一邻近点沟壑密度、第二邻近点沟壑密度、第三邻近点沟壑密度的相关系数分别为0.707、0.552、0.540、0.415(显著性水平均为0.01),可以看出,对于样本点稀疏、地形起伏较大的大区域尺度空间插值,利用辅助变量的BP神经网络插值精度明显高于不采用辅助变量的插值方法,然而选取的辅助变量必须与目标变量有较强的相关性,由于沟壑密度与邻近点沟壑密度的相关系数并不高,因此当已选择研究平均坡度作为辅助变量时,再增加3个邻近点坐标值作为辅助变量(对比模型三),其插值精度相比于研究模型反而下降,表明提升BP神经网络插值精度时需要增加相关系数高的辅助变量,增加相关系数低的辅助变量往往会造成多重共线性,导致插值精度的降低[18]
    基于BP神经网络的陕北黄土高原沟壑密度插值结果见图3,陕北黄土高原沟壑密度在空间分布上总体呈现中部和东北部高、西北部和南部低的特点。北部地区地势相对平坦,沟壑密度较小;中部地区沟壑纵横,沟壑密度相对较大,同时也是陕北黄土高原水土流失最严重的地区;南部地区主要是比较平坦的塬面,侵蚀发育处于幼年期,沟壑密度相对较小。
图3 基于BP神经网络的陕北黄土高原沟壑密度空间分布(图略)
结  论
    沟壑密度是反映地表破碎度的重要因子,在土壤侵蚀、地貌演变等研究中具有重要作用,因此对于黄土高原等土壤侵蚀严重地区,精准估算区域尺度沟壑密度具有重要意义,由于缺乏高精度的区域尺度DEM数据,因此选择合适的插值方法实现沟壑密度在区域尺度上的空间插值是迫切需要解决的科学问题。BP神经网络插值在大尺度地理要素空间变异研究中,特别是在小样本情况下,具有更高的精度。本研究基于陕北黄土高原80个试验样区5 m分辨率DEM和30 m分辨率DEM计算得到的研究区平均坡度作为辅助变量,利用BP神经网络插值方法进行陕北黄土高原沟壑密度插值,并与样条函数插值法、反距离加权插值法、协同克里金法、回归克里金法进行沟壑密度插值结果进行对比,结果表明:插值结果精度从高到低依次是:BP神经网络插值法、回归克里金法、协同克里金法、反距离加权插值法、样条函数插值法,BP神经网络插值在处理目标变量与辅助变量之间存在相关关系,却不存在一个准确的关系式的情况时具有优越性。此外,kel本研究还对比了基于不同辅助变量的BP神经网络插值精度,结果表明对于样本点稀疏、地形起伏较大的大区域尺度空间插值,利用辅助变量的BP神经网络插值精度明显高于不采用辅助变量的插值方法,然而选取的辅助变量必须与目标变量有较强的相关性,增加相关系数低的辅助变量往往会导致插值精度的降低。
(1~4为正文部分,说明研究对象、研究方法、结果、结论等,若需致谢则在正文最后标出)


[参考文献](必备项,并应按顺序标出参考文献在文中出现的位置)
[1]赵文武,傅伯杰,陈利顶.陕北黄土丘陵沟壑区地形因子与水土流失的相关性分析[J].水土保持学报,2003,17(3):66-69.
[2]卢金发.黄河中游流域地貌形态对流域产沙量的影响[J].地理研究,2002,21(2):171-178.
[3]田剑,汤国安,周毅,等.黄土高原沟谷密度空间分异特征研究[J].地理科学,2013,33(5):622-628.
[4]李俊,汤国安,张婷,等.利用DEM提取陕北黄土高原沟谷网络的汇流阈值研究[J].水土保持通报,2007,27(2):75-78.
[5]沈晶玉,史明昌,田玉柱,等.DEM网格尺寸与沟谷提取精度研究[J].中国水土保持,2007(2):56-60.
[6]朱会义,刘述林,贾绍凤.自然地理要素空间插值的几个问题[J].地理研究,2004,23(4):425-432.
[7]刘志华,常禹,贺红士,等.基于辅助变量的森林半腐层厚度空间插值精度[J].应用生态学报,2009,20(1):77-83.
[8]鲁程鹏,束龙仓,张颖,等.稀疏数据插值问题的回归克里格方法[J].水电能源科学,2009,27(1):81-84.
[9]姜勇,梁文举,李琪.利用与回归模型相结合的克里格方法对农田土壤有机碳的估值及制图[J].水土保持学报,2005,19(5):97-100,126.
[10]邓羽,刘盛和,姚峰峰,等.基于协同克里格的基准地价评估及空间结构分析[J].地理科学进展,2009,28(3):403-408.
[11]尤淑撑,严泰来.基于人工神经网络面插值的方法研究[J].测绘学报,2000,29(1):30-34.
[12]鹿应荣,杨印生,刘洪霞.基于BP神经网络的非线性组合预测模型在粮食物流需求预测中的应用[J].吉林大学学报(工学版),2008,38(S2):61-64.
[13]林宇锋,邓洪敏,史兴宇.基于新的改进粒子群算法的BP神经网络在拟合非线性函数中的应用[J].计算机科学,2017,44(S2):51-54.
[14]王汉涛,张潇潇.仿生算法优化BP神经网络在降雨空间插值中的应用[J].水资源与水工程学报,2019,30(3):106-112.
[15]赵明伟,汤国安,李发源,等.基于BP神经网络的陕北黄土高原侵蚀产沙影响因子显著性研究[J].水土保持通报,2012,32(1):5-9,226.
[16]刘艳芳,宋玉玲,郭龙,等.结合高光谱信息的土壤有机碳密度地统计模型[J].农业工程学报,2017,33(02):183-191.
[17]张欢,高小红.复杂地形区土壤有机质空间变异性分析及制图[J].水土保持研究,2020,27(05):93-100.
[18]秦雯怡,陈果,李小臻,等.基于机器语言的岷江上游流域表层土壤氢氧稳定同位素空间分布模拟[J].应用生态学报,2021,32(12):4327-4338.



基金项目:国家自然科学基金项目(12345678)
(若文章来源于项目,则需注明项目名称及编号)
第一作者 ***(1986—),男,安徽合肥人,研究员,硕士,主要从事地理信息系统工作。
通信作者:格式同第一作者(若有)
E-mailJinglusun@126.com

 
作者(负责对责编疑问进行答疑、收取样刊)详细邮政地址及邮编:

手机: