img

QQ群聊

img

官方微信

  • CN 62-1112/TF 
  • ISSN 1005-2518 
  • 创刊于1988年
高级检索

黄金科学技术, 2023, 31(4): 613-623 doi: 10.11872/j.issn.1005-2518.2023.04.171

采选技术与矿山管理

CNN-LSTM模型在边坡可靠度分析中的应用

荣光旭,1, 李宗洋2

1.安徽工业经济职业技术学院地质与建筑工程学院,安徽 合肥 230051

2.安徽省地勘局第一水文工程地质勘查院,安徽 蚌埠 233000

Application of CNN-LSTM Model in Slope Reliability Analysis

RONG Guangxu,1, LI Zongyang2

1.School of Geology and Construction Engineering, Anhui Technical College of Industry and Economy, Hefei 230051, Anhui, China

2.The First Institute of Hydrology and Engineering Geological Prospecting, Anhui Geological Prospecting Bureau, Bengbu 233000, Anhui, China

收稿日期: 2022-11-12   修回日期: 2023-02-03  

基金资助: 国家重点研发计划项目“强震区特大型泥石流防控标准化体系及示范应用”.  2018YFC1505406
安徽省高校自然科学研究项目“深度学习在边坡稳定分析应用中的原理·方法·程序”.  KJ2021A1536

Received: 2022-11-12   Revised: 2023-02-03  

作者简介 About authors

荣光旭(1986-),男,安徽桐城人,讲师,从事岩土结构稳定分析研究工作506774520@qq.com , E-mail:506774520@qq.com

摘要

为了准确高效地对边坡可靠度进行分析,在对420个边坡数据进行整理分析的基础上,建立了基于卷积神经网络(Convolutional Neural Network,CNN)与长短时记忆网络(Long Short-Term Memory,LSTM)的混合可靠度分析模型。首先,通过CNN模块提取数据特征;其次,构建LSTM模块并对边坡失效概率进行预测;然后,通过5因素4水平正交表L16对模型超参数进行优化;最后,通过2个算例进行对比验证。结果表明:(1)相比传统的蒙特卡洛法(MCS),CNN-LSTM模型预测失效概率相对误差仅为4.35%,而一次二阶矩法和响应面法相对误差为169.6%;在计算耗时方面,CNN-LSTM模型耗时45 s,MCS耗时119 s,CNN-LSTM模型效率比MCS提高了近2倍。(2)对比分析CNN、LSTM模型和多元线性回归模型(Multiple Linear Regression,MLR)等多种机器学习方法用于可靠度分析方面的计算性能,得出CNN-LSTM模型边坡失效概率预测相对误差远远小于CNN(104%)、LSTM(91.3%)和MLR(34.78%)的相对误差,且计算耗时最少;(3)算例验证了CNN-LSTM模型在边坡可靠度分析方面具有可行性和优越性。

关键词: 边坡 ; 可靠度 ; 正交试验设计 ; 超参数 ; CNN-LSTM模型

Abstract

When the traditional limit equilibrium method is used for slope reliability analysis,because of the performance function is implicit and the form is complicated,the iterative process of solving the function becomes complicated and the computational efficiency is low.Aiming at the above problems,a CNN-LSTM model method was proposed.The principle of this method is to first extract the data features by using convolutional neural network(CNN),and then predict the slope failure probability by using short and long time memory network(LSTM).On the basis of fully considering the value range of the CNN-LSTM model’s hyperparameters,the five-factor and four-level orthogonal test table was used to design the hyperparameters.Finally,the convolutional output dimension of the first layer and the second layer of the CNN network architecture in the CNN-LSTM model were determined to be 64 and 8 respectively.Dropout ratio is 0.5,the number of the first layer of the LSTM structure is 5 units and the number of the second layer of hidden layers is 20 units,respectively.The 420 slope sample data collected from central and western regions of China were used to train the model according to the ratio of 7∶3 between the training set and the verification set,and the optimal parameters of the CNN-LSTM model were obtained. Finally,Yanshanji landslide was taken as an example to illustrate the feasibility of the model method.The CNN-LSTM model was compared with Monte Carlo method(MCS),response surface method,single CNN,LSTM model and multiple linear regression model in terms of computational efficiency and failure probability prediction.The results show that:(1)When the MCS sampling times is 10 000,compared with the traditional MCS,although the CNN-LSTM model has a relative error of 4.35% in predicting the slope failure probability,in terms of computational efficiency,the CNN-LSTM model takes 45.28 s and the MCS takes 119 s,so the CNN-LSTM model increases the efficiency nearly 2 times.(2)When the single CNN model and LSTM model both adopt two-layer architecture,although the number of parameters of the CNN-LSTM model is not optimal,it has excellent performance in terms of calculation time and prediction accuracy of failure probability due to the small overfitting risk of the model.Compared with the multiple linear regression model,the relative error of CNN-LSTM prediction is 4.35%,and that of multiple linear regression is 34.78%.Through the above two points,the CNN-LSTM model can well complete the analysis of slope reliability,and avoid solving the implicit performance function,and the work efficiency is high.

Keywords: slope ; reliability ; orthogonal test design ; hyperparameter ; CNN-LSTM model

PDF (2631KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

荣光旭, 李宗洋. CNN-LSTM模型在边坡可靠度分析中的应用[J]. 黄金科学技术, 2023, 31(4): 613-623 doi:10.11872/j.issn.1005-2518.2023.04.171

RONG Guangxu, LI Zongyang. Application of CNN-LSTM Model in Slope Reliability Analysis[J]. Gold Science and Technology, 2023, 31(4): 613-623 doi:10.11872/j.issn.1005-2518.2023.04.171

边坡稳定性分析一直是岩土工程领域中的重要课题。由于传统的稳定性分析方法不能定量地考虑岩土体力学参数以及计算模型的不确定性,因此以不确定性问题作为研究对象的边坡可靠度分析方法受到研究人员的重视(舒苏荀等,2014牛草原等,2017)。该类方法基于概率统计知识来计算边坡的可靠指标和失效概率,以概率的形式表征边坡的安全可靠程度。常用的方法有蒙特卡洛法(MCS)、一次二阶矩法(FORM)和响应面法(RSM)等(谢秀栋等,2008蒋水华等,2013)。MCS法确定结构失效概率的原理是统计样本点功能函数出现失效点的频数,方法简单易行,但是需要大量样本数据支持,效率较低;一次二阶矩法将非线性功能函数在某点用Taylor级数展开计算得到可靠指标,但是由于边坡是一个动态变化的开放系统,影响因素众多,且这些因素与边坡稳定性之间的作用机理和映射关系尚未探究清楚,因此该方法计算结果精度较差。

为了克服传统方法的局限性,研究人员将机器学习方法引入边坡可靠度分析领域。Wang et al.(2021)利用卷积神经网络(Convolutional Neural Networks,CNN)对足够数量的随机场样本数据进行训练,然后通过随机有限元方法(Random Field Finite Element Method,RF-FEM)对一多层土质边坡的可靠度进行了预测;黄卓涛(2022)利用CNN算法计算了非均质水库边坡在暴雨和库水位骤降的极端条件下的失效概率。上述文中只对比分析了CNN算法与其他单一的机器学习方法计算结果的差异,均未对融合2个或多个模型后计算结果的差异进行讨论。姬建等(2022)利用K-L展开法将边坡土体随机场离散为数字图像,建立了边坡功能函数与随机场图像之间的CNN代理模型,进而计算得到边坡的失效概率,但该方法建立代理模型的过程较为复杂,效率偏低。

上述研究都是建立在机器学习单一模型应用的基础上,由于单一模型架构的限制,在进行分析预测时可能会存在误差较大的问题。已有研究表明融合2个或多个模型可有效避免该问题。宗广昌(2021)王朝阳等(2022)融合卷积神经网络与长短时记忆网络(Long Short-Term Memory,LSTM)模型对边坡位移进行了预测研究,并对比了融合后CNN-LSTM模型和单一模型的预测结果,结果表明相比单一机器学习模型,混合模型的均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)更低,计算效率高,预测效果更好,整体上优于单一模型。虽然前述研究证明了CNN-LSTM模型的可行性及预测性能优势,但是在模型应用中模型超参数的选择都是依据经验而定,未能对超参数的选择进行讨论。模型超参数是模型外部的配置,而超参数的调优过程则是为了提高模型预测准确性反复调整的过程。

因此,本文基于超参数的视角提出了一种用于边坡可靠度分析的CNN-LSTM混合模型方法。首先构建CNN模块,用于学习包含有关空间分布和强度的变量,提取数据特征,被“压平”(Flatten)后作为LSTM模块的输入;其次构建双架构LSTM模块用于深层次模型训练输出结果进而得到边坡失效概率,对边坡进行可靠度分析;在模型构建过程中,CNN-LSTM模型中超参数采用5因素4水平正交试验表L16进行优化调整。

1 基本原理

1.1 卷积神经网络(CNN)

卷积神经网络(CNN)由输入层、卷积层、ReLU层、池化层、全连接层和输出层组成(Rawat et al.,2017),如图1所示。在特征提取中,CNN一般是通过核或卷积滤波器的卷积算子来完成,每个单元的激活由输入信号表示核或卷积滤波器(Bisharad et al.,2019),多用于学习数据的特征。

图1

图1   卷积神经网络模型示意图

Fig.1   Schematic diagram of CNN model


CNN特征提取一般通过式(1)对卷积层各层进行二维位移计算实现。

ail+1=σ(j=1Jlwjlai+jl+bil)

式中:ail+1i到卷积层l+1的特征映射;wjl为卷积层l中核函数的权值矩阵,通过前一层的输出ail+1进行卷积运算创建下一层的输入;bil为偏置量。为了更好地发挥多层网络叠加的优势,激活函数采用非线性ReLU函数,表达式如下:

relu(x)=x,x>00,x0

池化层一般通过最大池化(Maxpooling)调整神经元的输出以达到减少数据大小、降低特征维度的目的。

1.2 LSTM块

虽然特征提取层可以完成对样本数据的重要特征保留,但是缺乏捕捉数据间关系的学习能力。为此,引入可以关联长短期信息记忆的LSTM网络。LSTM由遗忘门(ft)、输入门(it)和输出门(ot)组成,除了外部的循环神经网络(Recurrent Neural Network,RNN)外,还具有内部的“LSTM细胞”循环(Graves et al.,2013),如图2所示。

图2

图2   LSTM循环网络“细胞”的框图

circulation network

Fig.2   Block diagram of ‘Cells’ in the LSTM


三类门控系统计算公式如下:

ft=σ(Wf[ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
C˜t=tanh(WC˜[ht-1,xt]+bC˜)
Ct=ft*Ct-1+it*C˜
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)

式中:σ为激活函数;ott时刻xt的输出序列;WfWiWC˜Wo为对应的权重;bfbibC˜bo为对应的偏置;CtC˜t分别表示新单元和候选单元的状态;htt时刻单元的输出。

2 优化的CNN-LSTM模型可靠度分析方法

2.1 正交试验

在处理多因素多水平的概率统计问题时常采用正交试验设计,由于其均匀分散的特点被广泛应用于参数优化中。当变量数量较多时,所需试验的数量随变量增加表现出几何增加的趋势。正交试验可以有效减少试验数量(Wan et al.,1994Devesa et al.,2007Yang et al.,2008),被用来在一系列试验组合中分配试验因素,得到的结果可以用通用程序进行分析。正交数组中任意2列不同的组合出现频率是相同的。因此,可以将不同因素的影响分离出来(Chen et al.,2017)。

2.2 CNN-LSTM模型超参数正交设计优化

CNN-LSTM模型中CNN模块部分每个卷积层和池化层之间均采用ReLU激活函数,在进行数据特征融合后得到卷积神经网络的特征描述;将特征描述经过reshape函数调整数据类型后作为输入数据传递给LSTM,通过LSTM层和dropout层的处理,最终在全连接层输出数据。具体模型结构如图3所示。

图3

图3   CNN-LSTM模型结构

Fig.3   Structure of the CNN-LSTM model


本文在确定CNN-LSTM网络超参数时采用正交试验方法。已有研究表明,影响模型准确性的超参数主要有卷积核数量(kernel)、卷积层输出维度(filters)、LSTM隐藏层单元个数(hidden)以及随机丢弃的神经元比例(dropout)(Sun et al.,2016)。超参数取值范围见表1

表1   超参数取值范围

Table 1  Range of hyperparameters

超参数取值范围
kernel1,2,3,4,5,6,7,8
filters8,16,32,64,256,512
hidden8,16,32,64,256
dropout0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9

新窗口打开| 下载CSV


同时,研究表明LSTM中适当增加隐藏层单元的数目会提高模型的预测准确率(Chen et al.,2015)。综上,本文正交试验设计对具有代表性的超参数进行优化:根据表1及文献(Liu et al.,2017Liu et al.,2020),采用2层CNN,第一层和第二层卷积层输出维度取值范围为8,16,32,64;LSTM结构隐藏层第一层和第二层单元数量取值范围为5,10,15,20;考虑到模型训练参数较多,但是样本数较少,为了避免产生过拟合,随机丢弃的神经元比例取值范围为0.3,0.4,0.5,0.6。根据因素和水平数,选择L1645)正交表,正交试验结果见表2。一般采用均方根误差(RMSE)对结果进行评价。表达式如下:

RMSE=i=1n(Pi-P^i)2n

式中:Pi为实际值;P^i为预测值;n为数据个数。

表2   正交试验数据及RMSE结果

Table 2  Orthogonal test data and RMSE results

方案编号ABCDERMSE
188550.30.2878
281610100.40.1366
383215150.50.1307
486420200.60.1150
516810150.60.1849
616165200.50.1266
716322050.40.1452
8166415100.30.1632
932815200.40.1594
10321620150.30.1438
1132325100.60.1460
1232641050.50.1512
1364820100.50.0837
1464161550.60.1648
15643210200.30.1653
1664645150.40.2099

新窗口打开| 下载CSV


表2可知,方案13的RMSE值最小,因此CNN网络架构中第一层卷积输出维度为64,第二层卷积输出维度为8;dropout比例为0.5,LSTM结构第一层和第二层隐藏层数量分别为5个单元和20个单元。上述即为本文CNN-LSTM模型的最优超参数。

2.3 优化器与损失函数

在模型训练过程中,选择Adam(Adaptive Moment Estimation)作为优化迭代更新神经网络权值的算法(Diederik et al.,2016)。Adam是一种学习率自适应的优化算法,可以替代传统的随机梯度下降过程。在Adam中,动量被直接并入梯度一阶矩的估计,用以动态调整参数的学习率。同时,Adam中可以偏置修正,修正后每一次迭代的学习率都有一个确定的范围。因此,通常认为Adam对超参数的选择相当稳健。损失函数采用均方误差(MSE)。

采用RMSEMAE(平均绝对误差)2种不同的误差度量公式评价本文提出的模型(Ahmed et al.,2020)。其中,MAE表达式如下:

MAE=i=1nPi-P^in

式中:Pi为实际值;P^i为预测值;n为数据个数。

2.4 CNN-LSTM可靠度分析方法

考虑到边坡可靠度分析的各种影响因素,如岩土体材料性能、几何参数和各种作用效应等,将上述因素作为基本变量x1,x2,,xn,则边坡的功能函数可表示为

Z=g(x1,x2,,xn)=Fs-1

式中:Fs为确定性方法求出的安全系数。

失效概率pf是在规定的时限及条件下,岩土体边坡不能完成预定功能的概率,即当安全系数Fs-10时的概率。可表示为

pf=p(Z0)

计算流程包括预处理、CNN-LSTM模型训练、正交试验、计算可靠指标和失效概率4个部分,如图4所示。

图4

图4   基于正交试验设计的CNN-LSTM模型计算流程

Fig.4   Calculation flow of CNN-LSTM model based on orthogonal test design


具体步骤如下:

(1)获取原始边坡数据集。归一化后获得CNN和LSTM训练数据样本集。

(2)模型训练。使用CNN模型对划分后的数据集进行训练,然后对LSTM模型进行训练得到边坡的失效概率,并通过正交试验设计对CNN-LSTM模型超参数进行优化。正交试验设计优化步骤如下:首先根据超参数设计正交表表头;其次,选择合适的正交表,确定试验方案;最后,根据试验方案对CNN-LSTM模型进行多次性能测试,根据结果最终确定模型的超参数,完成对模型的优化。

(3)训练结束,保存模型。将待预测边坡数据作为测试数据输入已训练好的模型,得到边坡失效概率。

深度学习模型通过Keras库和TensorFlow后端实现,其中TensorFlow 2.9.0版本代码的编写利用Python3.6完成。全部计算所用计算机的配置为Intel(R)Core(TM)i7-11800CPU@2.3GHz,NVIDIA GeForce RTX 3060 GPU,内存为32 GB。

3 数据集

在使用机器学习方法对边坡稳定性进行分析的相关研究中,数据库是十分重要的因素,数据库变量选择的合理性直接影响着最终结果。结合近年来相关研究(Das et al.,2011Suman et al.,2016Xue,2017)及工程实践,选择高度(h)、坡角(α)、孔隙压力比(μ)、内聚力(c)、内摩擦角(ϕ)、土体容重(γ)和年平均降雨量(p)共7个因素作为研究变量。在剔除重复数据及不完整数据的情况下,本文共收集420组包含上述7个研究变量的土质边坡数据,其中稳定状态238组,破坏状态182组。在模型训练过程中,稳定状态下标签值为“1”,破坏状态下标签值为“0”。数据集部分原始数据及相关指标描述分别见表3表4

表3   数据集部分数据

Table 3  Partial data of data sets

样本编号h/mα/(°)μc/kPaφ/(°)γ/(kN·m-3p/mm稳定状态标签值
样本190.0180.2719.559.9123.049501
样本2136.5220.3221.3010.1020.031 2000
样本337.0250.3411.008.5020.501 0951
样本433.0150.3221.0010.0018.809951
样本570.0130.309.6110.4419.471 0200
样本41641.7120.2934.7213.3019.941 2701
样本41785.0180.3518.6015.1019.501 0671
样本418183.0400.2817.6020.3025.001 1100
样本41950.0130.3031.0015.7319.301 3201
样本42040.0120.3120.8014.5819.321 2600

新窗口打开| 下载CSV


表4   数据集相关指标描述

Table 4  Description of the relevant indexes of datasets

项目h/mα/(°)μc/kPaφ/(°)

γ

/(kN·m-3

p/mm
最大值511.0053.000.42107.0045.0031.301 479.00
最小值16.668.000.270.000.0012.00876.00
平均值112.4334.510.3227.9423.0120.811 203.00
标准差129.2910.110.0622.5716.333.366.77

新窗口打开| 下载CSV


由于特征向量量纲不统一,为了消除特征间单位和尺度差异的影响以便于模型的训练,在训练前需要对数据进行预处理。本文选择min-max方法对特征值进行归一化处理,表示为

xn=x-xminxmax-xmin,n=7

式中:xn为上述7个因素中某因素归一化的指标数据;x为原始输入数据值;xmaxxmin分别对应该因素中所有数据的最大值和最小值。根据式(13),表3中原始数据集部分数据对应各变量归一化后的结果如式(14)所示:

x'=0.14840.222200.18270.22020.57200.12270.24240.31110.33330.19910.22440.41610.53730.04120.37780.46670.10280.18890.44040.36320.03310.15560.33330.19630.22220.35230.19730.10790.11110.20000.08980.23200.38700.23880.05070.08890.13330.32450.29560.41140.65340.13820.22220.53320.17380.33560.38860.31670.33650.71110.06670.16450.45110.67360.38810.06740.11110.20000.28970.34960.37820.73630.04720.08890.26670.19440.23400.37930.6368

由数据集样本特征可知,图1中每个输入的x均由7个维度构成,即输入层有7个特征字段,对应7个神经元;所有数据共420行,故输入向量Xn×m为420×7的矩阵形式。

4 算例研究与分析

4.1 算例1

将样本数据集随机划分为训练集和验证集,数据量之比为7∶3。根据表2中数据,设置训练模型的最优超参数如下:CNN输出维度为64,第二层为8;dropout比例为0.5,LSTM结构第一层和第二层隐藏层数量分别为5个单元和20个单元。最大迭代轮次为300次。训练过程中损失函数值(MSE)的变化过程如图5所示。

图5

图5   CNN-LSTM模型训练损失函数值(MSE

Fig.5   Training loss function value(MSE) of the CNN-LSTM model


图5可以看出,训练过程中误差(MSE)逐渐下降并趋于稳定,总体上没有出现上升趋势,说明在训练过程中没有发生过拟合。训练集中在训练256轮次后,误差曲线振荡幅度明显减小。验证集误差(MSE)在第158轮次到达稳定值,总历时约44.8 s,可见CNN-LSTM模型的训练时间很短。至此,CNN-LSTM模型训练结束,保存得到的模型。

为分析本文方法与传统可靠度计算方法的差异,采用文献(安正明等,2022)中算例进行验证。该算例中边坡位于贵州省六盘水市,处于亚热带季风湿润气候区,年平均降雨量为1 300 mm。该边坡为一土质边坡,坡高为23.3 m,坡角为28.4°,土体内聚力为15.3 kPa,内摩擦角为18.5°,土体重度为19.05 kN/m3表5为应用本文模型得到该边坡失效概率与文献中传统蒙特卡洛方法计算结果对比。由表5可知,本文方法与文献中计算得出的失效概率结果基本一致,相对误差仅为0.26%,说明本文方法对该边坡稳定状态的判断是准确的。

表5   算例1不同方法可靠度分析结果

Table 5  Reliability analysis results of different methods for example 1

分析方法失效概率/%相对误差/%
蒙特卡洛法(安正明等,2022)15.36-
本文方法15.400.26

新窗口打开| 下载CSV


4.2 工程实例

燕山集滑坡(荣光旭等,2021)位于重庆市万州区燕山集镇,平面形状呈“长舌状”,高程为405~406 m,前缘至燕山场镇沿江公路边,剪出口高程为328~329 m。滑坡纵向长度为305 m,横向宽度约为155 m,如图6所示。该滑坡相关参数见表6

图6

图6   燕山集滑坡

(a)燕山集滑坡位置;(b)现场图片

Fig.6   Yanshanji landslide


表6   燕山集滑坡相关参数

Table 6  Parameters of Yanshanji landslide

参数及单位参数值参数及单位参数值
h/m78c/kPa9.81
α/(°)13φ/(°)9.34
μ0.31p/mm1 191.3
γ/(kN·m-319.58

新窗口打开| 下载CSV


表5中燕山集滑坡相关数据作为测试数据输入已训练好的模型进行预测,设置最大迭代轮次为160次,得到该滑坡的失效概率为0.0024%。

MCS法根据随机变量的分布特性抽取样本进而实现模型的求解,需要大量抽样才能保证结果的准确性。因此,当不考虑计算成本时,MCS法可作为衡量其他算法优劣的标准(徐潇源等,2021)。根据段楠等(2002)的研究,确定MCS抽样10 000次。将CNN-LSTM模型与MCS方法、响应面法、一次二阶矩法等常规方法进行比较,计算结果及计算耗时对比结果见表7

表7   CNN-LSTM与其他模型计算结果对比

Table 7  Comparison of calculation results between CNN-LSTM and other models

模型失效概率/%相对误差/%计算耗时/s
MCS0.0023-119
CNN-LSTM0.00244.3545
RSM0.0062169.6068
FORM0.0062169.60151

新窗口打开| 下载CSV


表7可知,采用正交设计优化超参数后的CNN-LSTM模型求出的边坡失效概率pf预测值相比MCS方法计算得出的结果相对误差仅为4.35%,令人满意;然而由于功能函数的高度非线性,一次二阶矩法和响应面法的失效概率相对误差均高达169.6%,说明本文模型能克服传统方法精度不高的局限性;在计算耗时方面,CNN-LSTM模型用时为45 s,MCS方法用时为119 s,用时相差74 s,且从表7中可以看出,相比传统的RSM和FORM方法,CNN-LSTM模型计算耗时均有所下降,说明本文模型在计算效率方面优于MCS方法及传统方法。

4.3 与其他机器学习方法对比分析

为进一步验证本文模型的有效性,将CNN-LSTM模型与单一的CNN模型、LSTM模型和机器学习中多元线性回归算法(Multivariable Linear Regression,MLR)进行对比,分析各模型的优劣性。其中,CNN和LSTM模型均采用2层拓扑结构,并根据RMSE最小原则对网络结构进行了优化。所有深度学习模型均采用Adam进行训练,Adam算法可以保证训练过程中学习步骤相对于参数梯度的尺度不变,损失函数为MSE。机器学习模型使用Scikit-learn库实现(Pedregosa et al.,2011),MLR采用随机梯度下降(Stochastic Gradient Descent,SGD)算法,损失函数同样采用MSE函数。所有模型均采用MAERMSE进行度量。表8给出了所有模型的相关描述、参数数量、训练和测试时间的平均结果。

表8   各模型的参数及测试结果对比

Table 8  Comparison of parameter and testing results of each model

模型名称模型描述参数数量/个训练用时/s测试用时/s
CNN1filter3283 23245.212.23
CNN2filter64166 17647.532.26
LSTM150个单元74 20043.722.10
LSTM2100个单元168 40048.242.16
CNN-LSTM

CNN:第一层卷积核为64,第二层卷积核为8;

LSTM:第一层20个单元,第二层10个单元

76 71343.301.98

注:加粗数据表示该项目的最优值

新窗口打开| 下载CSV


表8可知,CNN-LSTM模型的参数总量为76 713,仅次于隐含层为50个单元的LSTM1,而训练时间和测试集用时均优于其他模型,在综合考虑参数数量少、计算效率高等多个因素的情形下,确定最优模型是CNN-LSTM。图7给出了各模型训练集及验证集损失函数MSE值,由图7可知,CNN-LSTM模型在训练阶段的过拟合风险均小于CNN、LSTM和MLR模型。

图7

图7   各模型训练集/验证集损失值(MSE

Fig.7   Training set/validation set loss value(MSE) of each model


采用这4个模型对燕山集滑坡进行失效概率预测,对比分析不同模型的预测性能,结果见表9

表9   各模型预测性能及结果比较

Table 9  Comparison of predictive performance and results of each model

模型MAERMSE失效概率/%pf相对误差/%
MCS--0.0023-
CNN0.09490.10240.0047104.00
LSTM0.09260.09420.004491.30
CNN-LSTM0.07940.08370.00244.35
MLR0.08210.08860.003134.78

新窗口打开| 下载CSV


表9可知,CNN-LSTM模型整体上优于其他3个模型(CNN、LSTM和MLR),其MAERMSE得分最低,均方根误差和平均绝对误差最大值分别降低了16.3%和22.3%,说明相比单一模型在处理复杂数据方面的能力不足,CNN-LSTM模型取得了比CNN模型精确度更高的最优结果。CNN-LSTM模型以较小的噪声和偏差实现了近似预测,表现出最佳的性能。

此外,CNN模型提供了较差的预测结果,但CNN可以通过使用不同的优化方法来提高预测效果;MLR法耗时较长,这是由于MLR在训练时将整个数据集作为训练样本,且每次更新可能并不会按照正确的方向进行,因此可能带来优化波动,收敛较慢,这一点有别于Adam算法。在pf预测精度方面,CNN、LSTM、MLR模型与MCS的相对误差分别为104.00%,91.30%,34.78%,均高于本文模型。可见,在边坡可靠度分析方面,本文模型相比其他机器学习模型的适用性更好。

5 结论

(1)提出了一种基于正交设计优化超参数的CNN-LSTM模型,用于边坡可靠度分析。通过正交设计考虑多因素影响,优化确定CNN模型和LSTM模型的超参数的取值,以获得理想的模型超参数,从而提高模型的预测能力。

(2)CNN可用于学习数据中包含有关空间分布和强度的变量特征,将学习后的数据特征作为LSTM输入从而实现预测失效概率,实现可靠度分析的功能。

(3)CNN-LSTM模型较单一的CNN、LSTM模型在数据集训练时效及失效概率预测精度方面更有优势;相比传统的MCS方法,其失效概率相对误差仅为4.35%,但是计算效率提高了近2倍;相比MCS、RSM和FORM等传统方法,CNN-LSTM模型在计算耗时方面优势并不明显,但是其预测精度大幅提高。

http://www.goldsci.ac.cn/article/2023/1005-2518/1005-2518-2023-31-4-613.shtml

参考文献

Ahmed RSreeram VMishra Yet al2020.

A review and evaluation of the state of the art in PV solar power forecasting:Techniques and optimization

[J].Renewable and Sustainable Energy Reviews,124109792.

[本文引用: 1]

An ZhengmingFang ZhengfengZhou Xingtonget al2022.

Reliability analysis of the slope stability of the soil disposal area in a mountainous highway construction

[J].Soil Engineering and Foundation,364):626-629.

Bisharad DLaskar R H2019.

Music genre recognition using convolutional recurrent neural network architecture

[J].Expert Systems,364):e12429.

[本文引用: 1]

Chen KZhou YDai F2015.

A LSTM-based method for stock returns prediction:A case study of China stock market

[C]//IEEE International Conference on Big Data.Santa ClaraIEEE.

[本文引用: 1]

Chen TXu RHe Yet al2017.

Improving sentiment analysis via sentence type classification using BiLSTM-CRF and CNN

[J].Expert Systems with Applications,72221-230.

[本文引用: 1]

Das S KBiswal R KSivakugan Net al2011.

Classification of slopes and prediction of factor of safety using differential evolution neural networks

[J].Environmental Earth Sciences,641):201-210.

[本文引用: 1]

Devesa RMoldes ADiaz-Fierros Fet al2007.

Extraction study of algal pigments in river bed sediments by applying factorial designs

[J].Talanta,724):1546-1551.

[本文引用: 1]

Diederik P KJimmy B2016.

Adam:A method for stochastic optimization

[C]//The 4th International Conference on Learning Representations(ICLR),2016.San Juan,Puerto Rico:International Machine Learning Society.

[本文引用: 1]

Duan NanXue HuiminPan Yue2002.

A method for determining the number realizations in the calculation of reliability by Monte Carlo simulation method

[J].Coal Mine Machinery,(3):13-14.

Graves AJaitly NMohamed A2013.

Hybrid speech recognition with deep bidirectional LSTM

[C]//2013 IEEE Workshop on Automatic Speech Recognition and Understanding.Xi’anIEEE: 273-278.

[本文引用: 1]

Huang Zhuotao2022.

Reliability Analysis of Heterogeneous Reservoir Slopes Using Machine Learning Algorithms

[D].NanchangNanchang University.

Ji JianJiang ZhenYin Xinet al2022.

Slope reliability analysis based on deep learning of digital images of random fields using CNN

[J].Chinese Journal of Geotechnical Engineering,448):1463-1473.

Jiang ShuihuaLi DianqingZhou Chuangbing2013.

Non-intrusive stochastic finite element method for slope reliability analysis based on Latin hypercube sampling

[J].Chinese Journal of Geotechnical Engineering,35Supp.2):70-76.

Liu CHou WLiu D2017.

Foreign exchange rates forecasting with convolutional neural network

[J].Neural Processing Letters,462):1095-1119.

[本文引用: 1]

Liu YZhao ZZhang Set al2020.

Identification of abnormal processes with spatial-temporal data using convolutional neural networks

[J].Processes,81):73-91.

[本文引用: 1]

Niu CaoyuanWang LehuaXu Xiaoliang2017.

Study on impact from statistical characteristics of soil mass shear strength parameters on slope reliability

[J].Water Resources and Hydropower Engineering,4812):195-198206.

Pedregosa FVaroquaux Get al2011.

Scikit-learn:Machine learning in python

[J].Journal of Machine Learn Research,122825-2830.

[本文引用: 1]

Rawat WWang Z2017.

Deep convolutional neural networks for image classification:A comprehensive review

[J].Neural Computer,299):2352-2449.

[本文引用: 1]

Rong GuangxuPeng YanTian Kai2021.

Application of ABAQUS finite element strength reduction program based on Python in slope stability analysis

[J].Journal of North University of China(Natural Science Edition),424):332-339.

Shu SuxunGong Wenhui2014.

Fuzz random reliability analysis of slopes considering spatial variability of soil parameters

[J].Huazhong University of Science and Technology(Natural Science Edition),429):93-97.

Suman SKhan S ZDas S Ket al2016.

Slope stability analysis using artificial intelligence techniques

[J].Natural Hazards,842):727-748.

[本文引用: 1]

Sun XLi CRen F2016.

Sentiment analysis for Chinese microblog based on deep neural networks with convolutional extension features

[J].Neurocomputing,210227-236.

[本文引用: 1]

Wan H BLan W GWong M Ket al1994.

Orthogonal array designs for the optimization of liquid chromatographic analysis of pesticides

[J].Analytica Chimica Acta,2893):371-380.

[本文引用: 1]

Wang ChaoyangLi LiminWen Zongzhouet al2022.

Dynamic prediction of landslide displacement based on time series and CNN-LSTM

[J].Foreign Electronic Measurement Technology,413):1-8.

Wang Z ZGoh S G2021.

Novel approach to efficient slope reliability analysis in spatially variable soils

[J].Engineering Geology,281105989.

[本文引用: 1]

Xie XiudongFang JianruiFan Weiet al2008.

Research on analysis of slope stability based on reliability theory

[J].Journal of Natural Disasters,172):110-115.

Xu XiaoyuanWang HanYan Zhenget al2021.

Overview of power system uncertainty and its solutions under energy transition

[J].Automation of Electric Power Systems,4516):2-13.

Xue X2017.

Prediction of slope stability based on hybrid PSO and LSSVM

[J].Journal of Computing in Civil Engineering,311):04016041.

[本文引用: 1]

Yang L QLi P CFan S J2008.

The extraction of pigments from fresh Laminaria japonica

[J].Chinese Journal of Oceanology and Limnology,262):193-196.

[本文引用: 1]

Zong Guangchang2021.

Study on Slope Displacement Prediction Based on Conv-LSTM

[D].ShijiazhuangShijiazhuang Tiedao University.

安正明方正峰周兴彤2022.

山区高速公路弃渣场边坡稳定性可靠度分析

[J].土工基础,364):626-629.

[本文引用: 1]

段楠薛会民潘越2002.

用蒙特卡洛法计算可靠度时模拟次数的选择

[J].煤矿机械,(3):13-14.

[本文引用: 1]

黄卓涛2022.

基于机器学习算法的非均质水库边坡可靠度分析

[D].南昌南昌大学.

[本文引用: 1]

姬建姜振殷鑫2022.

边坡随机场数字图像特征CNN深度学习及可靠度分析

[J].岩土工程学报,448):1463-1473.

[本文引用: 1]

蒋水华李典庆周创兵2013.

基于拉丁超立方抽样的边坡可靠度分析非侵入式随机有限元法

[J].岩土工程学报,35增2):70-76.

[本文引用: 1]

牛草原王乐华许晓亮2017.

土体抗剪强度参数统计特性对边坡可靠性影响研究

[J].水利水电技术,4812):195-198206.

[本文引用: 1]

荣光旭彭艳田凯2021.

基于Python的ABAQUS有限元强度折减法程序在边坡稳定性分析中的应用

[J].中北大学学报(自然科学版),424):332-339.

[本文引用: 1]

舒苏荀龚文惠2014.

考虑参数空间变异性的边坡模糊随机可靠度分析

[J].华中科技大学学报(自然科学版),429):93-97.

[本文引用: 1]

王朝阳李丽敏温宗周2022.

基于时间序列和CNN-LSTM的滑坡位移动态预测

[J].国外电子测量技术,413):1-8.

[本文引用: 1]

谢秀栋方建瑞范炜2008.

基于可靠度理论的边坡稳定性分析研究

[J].自然灾害学报,172):110-115.

[本文引用: 1]

徐潇源王晗严正2021.

能源转型背景下电力系统不确定性及应对方法综述

[J].电力系统自动化,4516):2-13.

[本文引用: 1]

宗广昌2021.

基于Conv-LSTM的边坡位移预测研究

[D].石家庄石家庄铁道大学.

[本文引用: 1]

/