论文部分内容阅读
摘要 针对流域水文系统的复杂性和非线性,利用人工神经网络(ANN)建立了一种混合非线性模型来精确模拟降雨径流。针对一般人工神经网络存在不能有效地处理先验知识和其他来源数据、处理较大数据集时耗时长、CPU消耗高以及处理较小数据集时精度低等问题,在多层感知器(MLP)的基础上引入模块神经网络(MNN)。模块神经网络具有独立的拓扑结构,可以有效地处理降雨径流中具有复杂空间关系的参数。结果表明,对比人工神经网络,模块神经网络模拟降雨径流耗时更短,精度更高。
关键词 降雨径流;裂缝媒体;归一化;人工神经网络;模块神经网络;独立构架
中图分类号 S126;TV121+.1 文献标识码 A 文章编号 0517-6611(2014)32-11582-03
Modular Neural Network for Simulation of Nonlinear RainfallRunoff
LIU Hui, ZHANG Jianjun, SUN Yongtao
(College of Science, Southwest Petroleum University, Chengdu, Sichuan 610500)
Abstract According to the complexity and nonlinear hydrologic system, an approach for simulating groundwater flow is the combination of a linear and a nonlinear model that is created by the use of artificial neural network (ANN). The paper presents an attemption to create a productive interaction system between expert, mathematical model, MERO, and artificial neural networks (ANNs). In the present project, the first objective is to determine influencing parameters by the use of MERO model, which gave a good result in fractured porous media, and then introduce these parameters in artificial neural network (ANN). However, most of ANNs suffer from not using a prior knowledge and other source of data efficiently. Furthermore, artificial neural network (ANN) when deal with very large dataset is slow and CPU demanding and it missed its accuracy when a few data are available. The modular neural network (MNN) on the basis of the multilayer perception (MLP) was introduced. The network with special topological structure can effectively deal with parameters which have complex spatial relations. Compared with artificial neural network (ANN), modular neural network (MNN) give a better result in simulating rainfallrunoff and use less time.
Key words Rainfallrunoff; Fractured porous media; Normalization; Artificial neural network; Modular neural network; Independent architecture
降雨径流是一个复杂的过程,地下的径流取决于垂直进给、渗透、液体比重等。在不同的环境中,例如裂缝、岩溶等因素导致渗透现象的存在加速了降雨径流的过程。近年来,人工神经网络(ANN)在裂缝媒体中的降雨径流的模拟中被广泛地应用。由于ANN的灵活性和处理非线性问题的能力,在不同的领域都有很多的应用,非常适用于水质参数的预测和在裂缝媒体中的降雨径流的模拟。但是ANN在建模的过程中需要消耗很多时间,并且模型的构建影响到是否会陷入局部最小的问题。尽管ANN被广泛地应用和组合,但当可用的数据较少时或者在数据嘈杂的复杂环境中,它的效率被大大地降低,很难找到合适的空间关系。人工神经网络的效率取决于其学习算法、拓扑结构和数据分布,然而这些因素不是固定的,會随着数据集的改变而改变。
为此,笔者应用一种独立结构的人工神经网络来降低网络本身的复杂性。这个方法可以减少计算时间,降低计算成本,在处理比较小的数据集时也可以达到比较好的结果。应用岷江下流地区的2000年的日尺度水文数据来模拟当地的降雨径流,并与实测资料进行分析比较。
1 研究模型
1.1 研究地区的水文地质条件
研究区位于岷江下流、川西平原西南边缘。由于该区地形起伏大,地层裸露层多,属于水文地质条件复杂地区。该区地下水的类型有松散岩类孔隙水、碎屑岩类裂隙水和基岩裂隙水,其中以基岩裂隙水为主,主要由大气降水补给,向岷江及冲沟排泄。 含水岩组是指含水特征相近的一套岩层所构成的统一的含水岩体。研究区主要有以下3个含水岩组:①松散岩层孔隙水含水岩组,岩性为黏土混卵砾石、粉土、淤泥、砂砾石等。该含水岩组富水层为砂、砂砾石层,一般厚十数米至几十余米,多为潜水,具有分布广、孔隙连通性好、富水性弱等特点;②碎屑岩类裂隙孔隙含水岩组,主要是三叠系上统须家河组的裂隙孔隙层间水含水岩组;③基岩裂隙含水岩组,岩性以砂岩、粉砂岩、泥岩为主,在研究区内分布广泛,较富水,其中钙质含量丰富地区富水性好[1] 。
1.2 数据集处理
该研究的数据选取岷江下流地区2000年日尺度的雨量、流量和蒸发量水文数据。裂缝性媒体中的降雨径流依赖于断层和影响研究的网络故障。对于在裂缝性多孔介质中的地下水描述需要满足多孔基质和裂缝系统的控制方程。多孔基质中流动的控制方程用传统地下水在多孔介质中的流动方程[2]来描述:
Xi(K′ijh′Xj)+Q′=S′sh′t,i,j=1,2,3(1)
式中,h′是基体中的液压头;K′ij和S′s分别是渗透系数和多孔基体的特定存储。任何源和汇对于基体中流动的影响例如在裂缝中或由泵的提取引起的液体交换表示为式(1)中的Q′。
在任何方向、任何时间的基体中的液体流量都可以用达西方程来定义:
qi=-K′ijh′Xj,i,j=1,2,3(2)
在目前的工作中,用第二水文气象仿真模型MERO來确定裂隙渗流量。这个线性模型的概念基于多水库出口代表的水文地质单元组成的含水层系统(MERO和基利波)。在含水层中储藏水的总体积可以总结成以下方程:
Nj=1Vj=Nj=1∫∞0Qj(t).dt
=Nj=1∫∞0Q0,j·e(-t/t0,j)dt(3)
式中,j为储存单元的序号(包括浅表或深层地下水,地表径流);Q0,j为在水文循环开始第jth单元的初始流量;T0,j为第j单元的补给系数=1/αj。
式(4)表明一个储存单元的回填流量与体积变化和地下水位波动呈正比:
Nj=1dVdt=Nj=1SjAj·dhjdt
=Nj=1Qj(t)(4)
式中,hj为第j单元内的地下水平均深度;t为时间;Sj为第j单元的存储系数;Aj为回流单元露出地面的岩层(自由水可以移动的时候)的等效表面的估计从地质表面到模型楔入进行调整。
(1)→Qj(t)=Q0j·e-αj·t
其中
Qj(t)Q0,j=e-t/t0=e-1=0.367 8,
for t=t0=1αj(5)
2 模块神经网络(MNN)模型理论
2.1 多层感知(MLP)和模块神经网络(MNN)概念
多层感知是一种最普通的连接输入输出层的正反馈人工神经网络。通常,多层感知的隐藏层之间是相互联系的。一般来说,有两种学习过程:监督和非监督。很明显,在有监督的学习过程,对于每个训练的输入都可以给出理想的输出;然而对于无监督的学习过程,理想的输出不能给出。同样地,多层感知(MLP)利用反向传播技术(BP)来训练网络在本质上也是一种监督学习方法。
在该研究中,需要探查的是ANN的优化问题。最好的方法是使它的学习过程具有灵活性,所以在多层感知的基础上,引入模块神经网络(MNN)。它是根据大脑原理来构造的。大脑由3个主要部分组成。实际上,一个复杂的任务在大脑中被分成简单的几个部分。大脑的这种功能可以使动物更有效地处理复杂的任务。所以可以把大脑看成由几个模块组成的组合体。这些模块可以相互工作,有效地将复杂的问题分为几个简单的部分。根据大脑原理,将多层感知中的隐藏层分为几个模块。这些模块拥有不同的输入,在网络结构中相互独立。最后,每个模块的输出组成最后的网络输出。这样,MNN中的每部分做独特的计算任务,每个模块之间相互独立,互不影响。这种网络比之MLP结构更加简单。
ANN的误差一般由不同的准则来决定,其中一项准则是均方根误差,公式为[3]:
RMSE=Ni=1(Qi-Q^i)2N(6)
R2=F0-FF0(7)
式中,Q为观测到的流量值;Q^为观测时间段内计算得到的流量的平均值;RMSE表示预测值与实际值的偏差;R2是对模型效率准则的描述。理想的RMSE是0,R2的值是90%[4]。RMSE和R2的理想值是统一的。
2.2 模块神经网络(MNN)的构架
该研究选取如图1所示的神经网络构架[5]。
图1 模块神经网络构架
很显然,MNN具有更少数量的节点和权重。在网络结构复杂度降低的情况下,可以在更少的时间里找到全局最小值。而且,网络模型可以使用更少的数据来实现,这一点对于降雨径流问题有非常大的实际意义。
2.3 隐含层的结点数
隐含层的结点数选择是一个十分复杂的问题,目前还没有一个准确的理论来确定结点数目而达到最好的训练结果。所以在训练神经网络时,需要不停地调整结点数目,根据训练结果来确定最后的结点数目。这是一个不断重复的过程。
2.4 模型的校准和验证
ANN建模的重要一步是确保从数据中提取必要的特性。这是基于ANN的处理训练数据,这些数据对于学习目的必须是可用的。这些训练数据必须有充足的代表性来提供足够的知识检索。这些检索会在之后的神经网络的推理中所用到。另一个数据集被用来测试神经网络的合理性和评估训练过程的质量[6]。
在训练网络之前,由于采集的各数据单位不一致,因而需要对数据预处理。这里使用MATLAB的统计工具箱,对每个输入变量的数据进行统计分析,从而找到匹配的分布函数[7]。根据分布函数计算累计分布函数值,这些值是[0,1]之间的数,和一般的线性归一化得到的数据比较,分布更为均匀,比较容易被神经网络模型识别。进行过预处理的原始数据转化成分布在[0,1]之间的数,这些数据分为3个部分:75%用来训练网络,15%用于测试网络,剩余的15%用于评估网络。 3 结果与分析
图2、3为一般的多层感知器训练的结果;图4、5为模块神经网络(MNN)的训练结果。
比较图2、4,很显然模块神经网络比一般的多层感知器收敛到最佳结果需要更少的时间,而且比较稳定,不容易陷入局部最小。这是由于使用了较少的权重向量降低了网络的复杂性,所以CPU运行时间减少。而应用的学习算法因为变量的权值减少,所以可以更快地找到全局最优点。
比较图3,相比多层感知器,模块神经网络的R2由0.4提高到0.6,显然用模块神经网络模拟的效果更好。
比较表1、图6,模块神经网络模拟结果的精度更高。
图2 多层感知器收敛结果
图3 多层感知器的误差
图4 模块神经网络收敛结果
图5 模块神经网络的误差
图6 MLP和MNN模拟结果与实际值对比
表1 MLP和MNN的部分模拟结果
实际值MNN结果MLP结果
504361
474662
424763
454663
524463
434769
4 结论
人工神经网络在降雨径流中的模型中被广泛地应用。但人工神经网络在处理实际问题中存在一些缺陷。所以该研究引用模块神经网络的思想(MNN)[1],优化了人工神经网络的构架。这种具有独立结构的模块神经网络具有更多的优势。它可以利用许多其他来源的数据,并且可以独立地定义模块之间的连结。这种分块处理的思想使得MNN在处理大量复杂问题时也可以快速而准确。通过模块神经网络和一般的多层感知器的训练结果比较,前者CPU消耗更低,运行更快,并且独立的结构使得结果精度更高。
模块神经网络的最大优势就是可以降低裂缝媒体中降雨径流的复杂性,对于不同的环境具有更高的稳定性,对于不同的模块应用不同的算法,通过将问题分解为几个简单的任务获得更高的学习能力,对于新的数据集更加灵活。该研究中的运行结果表明,R2由多层感知器的0.4提高到模块神经网络的0.6,显然,这种独立结構的网络具有更高的效率。
安徽农业科学 2014年
参考文献
[1] 王金鹏.某研究区水文地质条件研究[J].商情,2012(27):116,113.
[2] LALLAHEM S,MANIA J.A Nonlinear rainfallrunoff model using neural network technique:Example in fractured porous media[J].Mathematical and Computer Modelling,2003,37:1047-1061.
[3] KUMAR J,BROOKS B J,THORNTON P E,et al.Subdaily statistical downscaling of meteorological variables using neural networks[J].Procedia Computer Science,2012,9:887-896.
关键词 降雨径流;裂缝媒体;归一化;人工神经网络;模块神经网络;独立构架
中图分类号 S126;TV121+.1 文献标识码 A 文章编号 0517-6611(2014)32-11582-03
Modular Neural Network for Simulation of Nonlinear RainfallRunoff
LIU Hui, ZHANG Jianjun, SUN Yongtao
(College of Science, Southwest Petroleum University, Chengdu, Sichuan 610500)
Abstract According to the complexity and nonlinear hydrologic system, an approach for simulating groundwater flow is the combination of a linear and a nonlinear model that is created by the use of artificial neural network (ANN). The paper presents an attemption to create a productive interaction system between expert, mathematical model, MERO, and artificial neural networks (ANNs). In the present project, the first objective is to determine influencing parameters by the use of MERO model, which gave a good result in fractured porous media, and then introduce these parameters in artificial neural network (ANN). However, most of ANNs suffer from not using a prior knowledge and other source of data efficiently. Furthermore, artificial neural network (ANN) when deal with very large dataset is slow and CPU demanding and it missed its accuracy when a few data are available. The modular neural network (MNN) on the basis of the multilayer perception (MLP) was introduced. The network with special topological structure can effectively deal with parameters which have complex spatial relations. Compared with artificial neural network (ANN), modular neural network (MNN) give a better result in simulating rainfallrunoff and use less time.
Key words Rainfallrunoff; Fractured porous media; Normalization; Artificial neural network; Modular neural network; Independent architecture
降雨径流是一个复杂的过程,地下的径流取决于垂直进给、渗透、液体比重等。在不同的环境中,例如裂缝、岩溶等因素导致渗透现象的存在加速了降雨径流的过程。近年来,人工神经网络(ANN)在裂缝媒体中的降雨径流的模拟中被广泛地应用。由于ANN的灵活性和处理非线性问题的能力,在不同的领域都有很多的应用,非常适用于水质参数的预测和在裂缝媒体中的降雨径流的模拟。但是ANN在建模的过程中需要消耗很多时间,并且模型的构建影响到是否会陷入局部最小的问题。尽管ANN被广泛地应用和组合,但当可用的数据较少时或者在数据嘈杂的复杂环境中,它的效率被大大地降低,很难找到合适的空间关系。人工神经网络的效率取决于其学习算法、拓扑结构和数据分布,然而这些因素不是固定的,會随着数据集的改变而改变。
为此,笔者应用一种独立结构的人工神经网络来降低网络本身的复杂性。这个方法可以减少计算时间,降低计算成本,在处理比较小的数据集时也可以达到比较好的结果。应用岷江下流地区的2000年的日尺度水文数据来模拟当地的降雨径流,并与实测资料进行分析比较。
1 研究模型
1.1 研究地区的水文地质条件
研究区位于岷江下流、川西平原西南边缘。由于该区地形起伏大,地层裸露层多,属于水文地质条件复杂地区。该区地下水的类型有松散岩类孔隙水、碎屑岩类裂隙水和基岩裂隙水,其中以基岩裂隙水为主,主要由大气降水补给,向岷江及冲沟排泄。 含水岩组是指含水特征相近的一套岩层所构成的统一的含水岩体。研究区主要有以下3个含水岩组:①松散岩层孔隙水含水岩组,岩性为黏土混卵砾石、粉土、淤泥、砂砾石等。该含水岩组富水层为砂、砂砾石层,一般厚十数米至几十余米,多为潜水,具有分布广、孔隙连通性好、富水性弱等特点;②碎屑岩类裂隙孔隙含水岩组,主要是三叠系上统须家河组的裂隙孔隙层间水含水岩组;③基岩裂隙含水岩组,岩性以砂岩、粉砂岩、泥岩为主,在研究区内分布广泛,较富水,其中钙质含量丰富地区富水性好[1] 。
1.2 数据集处理
该研究的数据选取岷江下流地区2000年日尺度的雨量、流量和蒸发量水文数据。裂缝性媒体中的降雨径流依赖于断层和影响研究的网络故障。对于在裂缝性多孔介质中的地下水描述需要满足多孔基质和裂缝系统的控制方程。多孔基质中流动的控制方程用传统地下水在多孔介质中的流动方程[2]来描述:
Xi(K′ijh′Xj)+Q′=S′sh′t,i,j=1,2,3(1)
式中,h′是基体中的液压头;K′ij和S′s分别是渗透系数和多孔基体的特定存储。任何源和汇对于基体中流动的影响例如在裂缝中或由泵的提取引起的液体交换表示为式(1)中的Q′。
在任何方向、任何时间的基体中的液体流量都可以用达西方程来定义:
qi=-K′ijh′Xj,i,j=1,2,3(2)
在目前的工作中,用第二水文气象仿真模型MERO來确定裂隙渗流量。这个线性模型的概念基于多水库出口代表的水文地质单元组成的含水层系统(MERO和基利波)。在含水层中储藏水的总体积可以总结成以下方程:
Nj=1Vj=Nj=1∫∞0Qj(t).dt
=Nj=1∫∞0Q0,j·e(-t/t0,j)dt(3)
式中,j为储存单元的序号(包括浅表或深层地下水,地表径流);Q0,j为在水文循环开始第jth单元的初始流量;T0,j为第j单元的补给系数=1/αj。
式(4)表明一个储存单元的回填流量与体积变化和地下水位波动呈正比:
Nj=1dVdt=Nj=1SjAj·dhjdt
=Nj=1Qj(t)(4)
式中,hj为第j单元内的地下水平均深度;t为时间;Sj为第j单元的存储系数;Aj为回流单元露出地面的岩层(自由水可以移动的时候)的等效表面的估计从地质表面到模型楔入进行调整。
(1)→Qj(t)=Q0j·e-αj·t
其中
Qj(t)Q0,j=e-t/t0=e-1=0.367 8,
for t=t0=1αj(5)
2 模块神经网络(MNN)模型理论
2.1 多层感知(MLP)和模块神经网络(MNN)概念
多层感知是一种最普通的连接输入输出层的正反馈人工神经网络。通常,多层感知的隐藏层之间是相互联系的。一般来说,有两种学习过程:监督和非监督。很明显,在有监督的学习过程,对于每个训练的输入都可以给出理想的输出;然而对于无监督的学习过程,理想的输出不能给出。同样地,多层感知(MLP)利用反向传播技术(BP)来训练网络在本质上也是一种监督学习方法。
在该研究中,需要探查的是ANN的优化问题。最好的方法是使它的学习过程具有灵活性,所以在多层感知的基础上,引入模块神经网络(MNN)。它是根据大脑原理来构造的。大脑由3个主要部分组成。实际上,一个复杂的任务在大脑中被分成简单的几个部分。大脑的这种功能可以使动物更有效地处理复杂的任务。所以可以把大脑看成由几个模块组成的组合体。这些模块可以相互工作,有效地将复杂的问题分为几个简单的部分。根据大脑原理,将多层感知中的隐藏层分为几个模块。这些模块拥有不同的输入,在网络结构中相互独立。最后,每个模块的输出组成最后的网络输出。这样,MNN中的每部分做独特的计算任务,每个模块之间相互独立,互不影响。这种网络比之MLP结构更加简单。
ANN的误差一般由不同的准则来决定,其中一项准则是均方根误差,公式为[3]:
RMSE=Ni=1(Qi-Q^i)2N(6)
R2=F0-FF0(7)
式中,Q为观测到的流量值;Q^为观测时间段内计算得到的流量的平均值;RMSE表示预测值与实际值的偏差;R2是对模型效率准则的描述。理想的RMSE是0,R2的值是90%[4]。RMSE和R2的理想值是统一的。
2.2 模块神经网络(MNN)的构架
该研究选取如图1所示的神经网络构架[5]。
图1 模块神经网络构架
很显然,MNN具有更少数量的节点和权重。在网络结构复杂度降低的情况下,可以在更少的时间里找到全局最小值。而且,网络模型可以使用更少的数据来实现,这一点对于降雨径流问题有非常大的实际意义。
2.3 隐含层的结点数
隐含层的结点数选择是一个十分复杂的问题,目前还没有一个准确的理论来确定结点数目而达到最好的训练结果。所以在训练神经网络时,需要不停地调整结点数目,根据训练结果来确定最后的结点数目。这是一个不断重复的过程。
2.4 模型的校准和验证
ANN建模的重要一步是确保从数据中提取必要的特性。这是基于ANN的处理训练数据,这些数据对于学习目的必须是可用的。这些训练数据必须有充足的代表性来提供足够的知识检索。这些检索会在之后的神经网络的推理中所用到。另一个数据集被用来测试神经网络的合理性和评估训练过程的质量[6]。
在训练网络之前,由于采集的各数据单位不一致,因而需要对数据预处理。这里使用MATLAB的统计工具箱,对每个输入变量的数据进行统计分析,从而找到匹配的分布函数[7]。根据分布函数计算累计分布函数值,这些值是[0,1]之间的数,和一般的线性归一化得到的数据比较,分布更为均匀,比较容易被神经网络模型识别。进行过预处理的原始数据转化成分布在[0,1]之间的数,这些数据分为3个部分:75%用来训练网络,15%用于测试网络,剩余的15%用于评估网络。 3 结果与分析
图2、3为一般的多层感知器训练的结果;图4、5为模块神经网络(MNN)的训练结果。
比较图2、4,很显然模块神经网络比一般的多层感知器收敛到最佳结果需要更少的时间,而且比较稳定,不容易陷入局部最小。这是由于使用了较少的权重向量降低了网络的复杂性,所以CPU运行时间减少。而应用的学习算法因为变量的权值减少,所以可以更快地找到全局最优点。
比较图3,相比多层感知器,模块神经网络的R2由0.4提高到0.6,显然用模块神经网络模拟的效果更好。
比较表1、图6,模块神经网络模拟结果的精度更高。
图2 多层感知器收敛结果
图3 多层感知器的误差
图4 模块神经网络收敛结果
图5 模块神经网络的误差
图6 MLP和MNN模拟结果与实际值对比
表1 MLP和MNN的部分模拟结果
实际值MNN结果MLP结果
504361
474662
424763
454663
524463
434769
4 结论
人工神经网络在降雨径流中的模型中被广泛地应用。但人工神经网络在处理实际问题中存在一些缺陷。所以该研究引用模块神经网络的思想(MNN)[1],优化了人工神经网络的构架。这种具有独立结构的模块神经网络具有更多的优势。它可以利用许多其他来源的数据,并且可以独立地定义模块之间的连结。这种分块处理的思想使得MNN在处理大量复杂问题时也可以快速而准确。通过模块神经网络和一般的多层感知器的训练结果比较,前者CPU消耗更低,运行更快,并且独立的结构使得结果精度更高。
模块神经网络的最大优势就是可以降低裂缝媒体中降雨径流的复杂性,对于不同的环境具有更高的稳定性,对于不同的模块应用不同的算法,通过将问题分解为几个简单的任务获得更高的学习能力,对于新的数据集更加灵活。该研究中的运行结果表明,R2由多层感知器的0.4提高到模块神经网络的0.6,显然,这种独立结構的网络具有更高的效率。
安徽农业科学 2014年
参考文献
[1] 王金鹏.某研究区水文地质条件研究[J].商情,2012(27):116,113.
[2] LALLAHEM S,MANIA J.A Nonlinear rainfallrunoff model using neural network technique:Example in fractured porous media[J].Mathematical and Computer Modelling,2003,37:1047-1061.
[3] KUMAR J,BROOKS B J,THORNTON P E,et al.Subdaily statistical downscaling of meteorological variables using neural networks[J].Procedia Computer Science,2012,9:887-896.