基于核主成分分析与SVM的岩爆烈度组合预测模型
1.
2.
Combined Prediction Model of Rockburst Intensity Based on Kernel Principal Component Analysis and SVM
1.
2.
通讯作者:
收稿日期: 2019-12-25 修回日期: 2020-04-22 网络出版日期: 2020-08-27
基金资助: |
|
Received: 2019-12-25 Revised: 2020-04-22 Online: 2020-08-27
作者简介 About authors
许瑞(1995-),女,山西晋中人,硕士研究生,从事深部地下工程灾害防治研究工作
关键词:
Keywords:
本文引用格式
许瑞, 侯奎奎, 王玺, 刘兴全, 李夕兵.
XU Rui, HOU Kuikui, WANG Xi, LIU Xingquan, LI Xibing.
很多学者从强度、刚度、能量和声发射等不同角度对岩爆现象进行了分析研究,提出了诸多岩爆预测的单一因素理论判据[2-3]。然而,岩爆是一种复杂的动力学现象,其发生与否由众多因素共同决定,且与各影响因素之间存在极其复杂的非线性关系[3]。因此,有必要建立考虑多种影响因素的岩爆综合预测模型。基于此,王元汉等[2]采用模糊数学综合评判方法,选取影响岩爆的一些主要因素,对岩爆的发生与否及烈度大小进行了预测。宫凤强等[4]基于距离判别分析理论,建立了距离判别分析模型,用以预测岩爆的发生和烈度分级。近年来,随着人工智能技术的发展,人工智能算法及其组合算法在岩爆预测中得到了一定的推广和应用。赵洪波等[5]提出了基于支持向量机的岩爆分类方法,对岩爆的烈度进行分级预测。白明洲等[6]依据隧道岩爆发生的条件,应用神经网络方法,建立了岩爆危险性预测的评价模型。高玮[7]以工程类比的思想判断岩爆,首次把蚁群聚类算法引入岩爆预测领域。还有一些学者提出组合算法,将遗传算法、粒子群算法、BP神经网络、聚类算法、随机森林模型、支持向量机、最优路径森林算法和主成分分析等方法组合起来,综合利用各种方法的优点,丰富了岩爆的预测理论,取得了一定的效果[8-14]。
以上模型或只选取影响岩爆的部分指标,或未考虑岩爆评价指标之间的多维交叉冗余性,具有一定的局限性。为了克服现有模型的缺点,进一步提高地下工程岩爆发生及其烈度预测的精度,建立了基于不同核函数的主成分分析方法与遗传算法或粒子群优化算法(GA/PSO)优化的支持向量机(SVM)相结合的岩爆烈度组合预测模型。先利用核主成分分析法对原始数据进行降维处理,形成新的特征集合。再将降维后的数据输入到GA/PSO-SVM模型进行预测。
1 理论基础
1.1 基于核函数的主成分分析
主成分分析法(Principal Components Analysis,PCA)是一种多指标数据的特征信息提取方法,利用投影的方式,把高维数据投影到低维层面,在保证原始数据信息量的基础上,将原始数据中多个有一定相关性的指标变量转化为一组个数较少且互不相关的综合性指标变量,新的变量按照方差递减的顺序排列。一般累积贡献率达到85%~95%的特征值
传统主成分分析法(PCA)是一种线性算法,不能提取出数据中的非线性结构。基于核函数的主成分分析法(Kernel Principal Components Analysis,KPCA)是一种非线性特征提取方法,通过引入核函数,用非线性映射将原始数据特征空间映射到高维特征空间,使非线性问题转化为线性问题,然后在高维空间中使用常规的PCA方法提取主成分,在保持原始数据信息量的基础上达到降维的目的[15]。具体步骤如下:
设数据样本
式中:
设非线性映射为
因此,
然后,求出特征空间中的协方差矩阵C
从而,特征空间中PCA的求解方程为
式中:
并且存在参数
合并
将核函数代入,得到等价形式
最后求出
1.2 GA/PSO优化的支持向量机分类预测原理
支持向量机(Support Vector Machine,SVM)是由Vapnik在1995年提出的一种基于统计学习理论的模式识别方法。统计学习理论基于结构风险最小化准则,使模型具有较好的泛化能力。SVM的基本思想是在特征空间找到使得训练集上的正负样本间隔最大的最佳分离超平面[16]。支持向量机的分类原理如下:
对于线性可分问题,设训练样本为
最终得到的最优分类函数为
式中:
对于线性不可分问题,常用的方法是通过非线性映射
问题转化为
最终得到的最优分类函数为
SVM的性能主要取决于核参数
遗传算法[15](Genetic Algorithm,GA)是通过模拟达尔文的自然进化过程中随机化搜索最优解的方法,其具有高效启发式搜索及并行计算等优点。一般认为,在遗传算法中有8个组件,即
粒子群优化算法[18](Particle Swarm Optimization, PSO)是一种源于对鸟群捕食行为研究的全局优化进化算法。该方法通过个体间的协作和竞争,实现复杂空间最优解的搜索。粒子群初始化为一组随机解,每个粒子具有位置向量
式中:
1.3 岩爆烈度预测模型
为了综合利用KPCA的非线性特征提取和SVM的分类优势,提出了一种基于不同核函数的主成分分析与GA/PSO优化的SVM相结合的岩爆烈度预测模型,将2种数学方法的思想整合在一起。基本思路是:根据岩爆的特点及成因,构建岩爆预测指标体系,收集整理国内外具有代表性的岩爆实例数据,利用基于不同核函数的主成分分析进行对比研究,根据主成分的累积贡献率选择主成分,实现数据降维,同时减少了SVM模型的输入参数,降低了算法的复杂度。最后利用GA/PSO-SVM对降维后的输入参数进行分类和烈度预测。岩爆烈度组合预测模型的运行步骤和流程如图1所示。
图1
图1
岩爆烈度组合预测模型运行流程图
Fig.1
Flowchart of the rockburst intensity forecasting model
2 模型验证
2.1 岩爆烈度的影响因素分析及评价指标的确立
一般认为,岩爆发生有2个基本条件:一是岩体处于高地应力环境下,这是岩爆产生的外因;二是岩体本身结构致密、坚硬且完整,具备较高的储能能力,这是岩爆发生的内因。岩体在变形破坏过程中聚集的弹性应变能一部分被岩体变形和破裂所消耗,剩余的能量以动能的形式释放出来,使逐渐被剥离的岩块弹射出去,而形成岩爆[2]。因此,岩爆的发生与围岩应力、岩石岩性以及能量有关。为充分利用指标信息,本文选取围岩最大切向应力
2.2 原始数据分析
表1 部分岩爆样本原始数据
Table 1
序号 | SCF | B1 | B2 | 岩爆烈度 | ||||
---|---|---|---|---|---|---|---|---|
1 | 90.00 | 170.00 | 11.30 | 0.53 | 15.04 | 0.88 | 9.00 | M |
2 | 90.00 | 220.00 | 7.40 | 0.41 | 29.73 | 0.93 | 7.30 | L |
3 | 62.60 | 165.00 | 9.40 | 0.38 | 17.53 | 0.89 | 9.00 | L |
4 | 55.40 | 176.00 | 7.30 | 0.32 | 24.11 | 0.92 | 9.30 | M |
5 | 30.00 | 88.70 | 3.70 | 0.34 | 23.97 | 0.92 | 6.60 | M |
6 | 48.75 | 180.00 | 8.30 | 0.27 | 21.69 | 0.91 | 5.00 | M |
243 | 126.72 | 189.70 | 8.95 | 0.67 | 21.20 | 0.91 | 5.43 | L |
244 | 57.97 | 125.37 | 7.74 | 0.67 | 21.20 | 0.46 | 2.86 | L |
245 | 57.97 | 96.16 | 3.77 | 0.46 | 16.20 | 0.20 | 2.53 | L |
246 | 57.97 | 70.68 | 4.19 | 0.60 | 25.51 | 0.19 | 2.87 | L |
图2
2.3 核主成分分析
表2 岩爆评价指标的相关系数
Table 2
指标 | SCF | B1 | B2 | ||||
---|---|---|---|---|---|---|---|
1.000 | 0.034 | 0.334 | 0.918 | -0.248 | -0.219 | 0.468 | |
0.034 | 1.000 | 0.422 | -0.265 | 0.076 | 0.234 | 0.193 | |
0.334 | 0.422 | 1.000 | 0.164 | -0.625 | -0.471 | 0.329 | |
SCF | 0.918 | -0.265 | 0.164 | 1.000 | -0.258 | -0.252 | 0.329 |
B1 | -0.248 | 0.076 | -0.625 | -0.258 | 1.000 | 0.526 | -0.108 |
B2 | -0.219 | 0.234 | -0.471 | -0.252 | 0.526 | 1.000 | -0.082 |
0.468 | 0.193 | 0.329 | 0.329 | -0.108 | -0.082 | 1.000 |
表3 原始数据标准化处理结果
Table 3
序号 | SCF | B1 | B2 | ||||
---|---|---|---|---|---|---|---|
1 | 0.5917 | 1.3704 | 0.9878 | -0.0869 | -0.3864 | 0.1446 | 0.9237 |
2 | 0.5917 | 2.5425 | 0.0553 | -0.2655 | 0.6451 | 0.6570 | 0.5147 |
3 | 0.0850 | 1.2532 | 0.5335 | -0.3101 | -0.2116 | 0.2470 | 0.9237 |
4 | -0.0482 | 1.5111 | 0.0314 | -0.3994 | 0.2505 | 0.5545 | 0.9959 |
5 | -0.5179 | -0.5353 | -0.8294 | -0.3697 | 0.2407 | 0.5545 | 0.3463 |
6 | -0.1711 | 1.6049 | 0.2705 | -0.4738 | 0.0805 | 0.4520 | -0.0387 |
243 | 1.2708 | 1.8322 | 0.4259 | 0.1215 | 0.0461 | 0.4520 | 0.0648 |
244 | -0.0006 | 0.3243 | 0.1366 | 0.1215 | 0.0461 | -4.1597 | -0.5536 |
245 | -0.0006 | -0.3604 | -0.8126 | -0.1911 | -0.3050 | -6.8242 | -0.6330 |
246 | -0.0006 | -0.9577 | -0.7122 | 0.0173 | 0.3488 | -6.9267 | -0.5512 |
使用标准化处理后的246组岩爆数据作主成分分析以及基于3种不同核函数(KPCA1、KPCA2和KPCA3分别代表线性核、RBF核和MLP核)的主成分分析,按照前文所述步骤,通过MATLAB R2019a实现计算。RBF核和MLP核中最优核参数选择第一主成分贡献率大时的参数。以高斯核为例,图3为核参数对第一主成分贡献率的影响关系图,可以得到当
图3
图3
RBF核主成分分析第一主成分贡献率与核参数关系
Fig.3
Relationship between the first principal component contribution rate and the kernel parameters in the RBF kernel
图4
表4 核参数及主成分的选择
Table 4
核函数类型 | 核函数表达式 | 核参数 | 第一主成分贡献率/ | 主成分个数 |
---|---|---|---|---|
主成分分析 | - | - | 40.20 | 4 |
线性核函数 | - | 59.19 | 2 | |
高斯核函数 | 58.52 | 3 | ||
多层感知器核函数 | 61.59 | 3 |
图5
2.4 GA/PSO-SVM模型训练和岩爆烈度预测
利用MATLAB R2019a及林智仁libsvm-3.24工具箱进行仿真测试。将基于不同核函数(KPCA1、KPCA2和KPCA3分别代表线性核、RBF核和MLP核)的主成分分析方法和GA-SVM、PSO-SVM组合对比分析。为不失一般性,通过十折交叉检验[18]的方法确定SVM参数,即将岩爆数据集随机划分为10份,每次将其中的9份作为训练集建立模型,剩余的1份作为测试集检验模型性能,共执行10次性能测试。最后将10次测试结果的均值作为算法精度的估计。
表5 模型参数及模型训练集和测试集准确率
Table 5
模型 | SVM参数 | 训练集准确率/ | 测试集准确率/ | ||
---|---|---|---|---|---|
PCA | GA-SVM | 81.4710 | 56.6212 | 96.8 | 84.6 |
PSO-SVM | 97.6345 | 118.4431 | 98.2 | 84.6 | |
KPCA1 | GA-SVM | 50.5654 | 890.2415 | 94.6 | 73.1 |
PSO-SVM | 51.3095 | 586.1588 | 89.6 | 76.9 | |
KPCA2 | GA-SVM | 3.1284 | 256.1905 | 91.4 | 88.5 |
PSO-SVM | 31.2537 | 145.4178 | 94.6 | 92.3 | |
KPCA3 | GA-SVM | 73.1933 | 282.2821 | 93.2 | 80.8 |
PSO-SVM | 82.0614 | 491.9322 | 97.7 | 88.5 |
图6
图6
部分模型的适应度曲线
Fig.6
Fitness curves of the optimal parameters selected by the generated models
图7
图7
部分模型测试样本预测结果
Fig.7
Partial prediction results for the test samples of generated models
到PSO-SVM模型的预测精度最高,达到了92.3%。
3 结论
(1)综合考虑了影响岩爆发生及其烈度的7个指标,采用基于不同核函数的主成分分析法对样本数据进行非线性特征提取,将影响岩爆的7个指标缩减为2~4个综合预测指标,减少了各指标之间的相关性,同时减少了SVM模型的输入参数,简化了训练过程,提升了模型的预测精度和效率。
(2)SVM参数的选择对预测结果有很大影响,因此采用遗传算法和粒子群优化算法对SVM的参数寻优,通过十折交叉检验的方法确定参数
(3)将基于不同核的主成分分析与GA/PSO优化的SVM相结合,建立岩爆烈度的组合预测模型,并对国内外246组岩爆实例进行训练、学习、预测和评估。结果表明:基于RBF核函数的主成分分析方法与PSO-SVM相结合的模型预测准确率达到了92.3%,为最佳组合模型,说明构建的组合预测模型能够准确地处理影响岩爆烈度的各因素之间的复杂非线性关系,将该模型用于岩爆烈度的预测方面有较强的工程实用性。
http://www.goldsci.ac.cn/article/2020/1005-2518/1005-2518-2020-28-4-575.shtml
参考文献
岩爆预测的模糊数学综合评判方法
[J].
Method of fuzzy comprehensive evaluations for rockburst prediction
[J].
深部硬岩矿山岩爆的动静组合加载力学机制与动力判据
[J].
Coupled static-dynamic loading mechanical mechanism and dynamic criterion of rockburst in deep hard rock mines
[J].
岩爆发生和烈度分级预测的距离判别方法及应用
[J].
A distance discriminant analysis method for prediction of possibility and classification of rockburst and its application
[J].
岩爆分类的支持向量机方法
[J].
Classification of rockburst using support vector machine
[J].
岩爆危险性预测的神经网络模型及应用研究
[J].
Study on a neutral network model and its application in predicting the risk of rock blast
[J].
基于蚁群聚类算法的岩爆预测研究
[J].
Prediction of rock burst based on ant colony clustering algorithm
[J].
Long-term prediction model of rockburst in underground openings using heuristic algorithms and support vector machines
[J].
基于模型可靠性检查的QGA-SVM岩爆倾向性分类研究
[J].
Research on QGA-SVM rock burst orientation classification based on model reliability examination
[J].
基于粒子群算法和广义回归神经网络的岩爆预测
[J].
Rockburst prediction using particle swarm optimization algorithm and general regression neural network
[J].
A principal component analysis/fuzzy comprehensive evaluation model for coal burst liability assessment
[J].
基于PCA-PNN原理的岩爆烈度分级预测方法
[J].
Prediction of intensity classification of rockburst based on PCA-PNN principle
[J].
Classification of rockburst in underground projects comparison of ten supervised learning methods
[J].
岩爆等级预测的PCA-OPF模型
[J].
PCA-OPF model for rock burst prediction
[J].
Application of KPCA combined with SVM in Raman spectral discrimination
[J].
岩爆预测的支持向量机
[J].
Prediction of rockburst using support vector machine
[J].
基于粒子群算法的支持向量机的参数优化
[J].
Parameters optimization for SVM based on particle swarm algorithm
[J].
Rockburst prediction in kimberlite with unsupervised learning method and support vector classifier
[J].
/
〈 |
|
〉 |
