As a kind of dynamic instability geological disaster with strong abruptness and randomness,rockburst poses a great threat to the safety of personnel,equipment and buildings.Timely and accurate prediction of rockburst grade has become a hot issue in the field of underground engineering.At present,the amount of real training data of rockburst prediction is small and the data is missing.In order to predict the rockburst grade more accurately,a combined weighting-extremely randomized trees(ET) prediction model based on chain random forest multiple interpolation(MICE_RF) algorithm was proposed.According to the characteristics and causes of rockburst,six evaluation indexes including maximum shear stress,uniaxial compressive strength,uniaxial tensile strength,stress coefficient,brittleness coefficient and elastic energy index were selected to form the rockburst evaluation index,and MICE_RF algorithm was used to interpolate the missing data of rockburst data set.Then,a new combined weighting method was proposed,which is the improved analytic hierarchy process(IAHP)-weight determination method based on index correlation(CRITIC),and the weight of each index was comprehensively calculated by using the concept of weight vector distance. Finally,the ET algorithm was used to construct the rockburst prediction model after interpolation,weighting and normalization.Using the existing engineering example data at home and abroad,20 random sampling tests were carried out,and compared with other models to verify the superiority of this model in rockburst grade prediction.In this study,the interpolation effect based on MICE_RF missing value,the combined weighting effect of IAHP-CRITIC index and the comparison of the prediction effects of different models were analyzed and verified respectively.So,the ET rockburst prediction model based on MICE_RF and improved combined weighting was applied and the result of accuracy,precision,recall and RMSE were 93.10%,94.17%,93.44% and 0.2626.The results show that the MICE_RF missing data interpolation method not only increases the available rockburst data set,but also can effectively improve the prediction accuracy of three levels of no rockburst,intermediate rockburst and strong rockburst,and the average prediction accuracy of the complete data set has also been significantly improved.The improved AHP-CRITIC method has more advantages than the previous one,and the ET algorithm is significantly better than other comparison models in the results of four comparison indexes,that is,IAHP-CRITIC-ET model based on MICE_RF can significantly improve the prediction accuracy of rockburst grade,and the prediction results are more stable,which can provide effective guidance for similar projects.
Keywords:rockburst grade prediction
;
missing data
;
multiple interpolation algorithm of chain random forest (MICE_RF)
;
combination weighting
;
weight vector distance
;
extremely randomized trees(ET) algorithm
WEN Tingxin, SU Huanbo. Combined Weighting-Extremely Randomized Trees Rockburst Prediction Model Based on MICE_ RF[J]. Gold Science and Technology, 2022, 30(3): 392-403 doi:10.11872/j.issn.1005-2518.2022.03.145
岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018)。近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020)。岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a)。因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题。
关于岩爆等级预测问题,国内外学者开展了大量研究。相关研究主要包括判据预测、现场监测和综合预测等。近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021)。以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等。迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020)。鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性。上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重。此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题。
缺失数据插补是最常用于处理缺失数据问题的方法,常用的插补技术包括基于统计分析和机器学习2种类型。在统计分析领域,学者们做了大量研究,并提出了许多有效的方法,多重插补是众多方法中最完善的一种(刘凤芹,2009)。Boshuizen et al.(1999)提出的基于链式方程多重插补(MICE)是一种特殊的多重插补方法,其链式方程是一个形象的称谓,具体算法由一系列模型组成,任何能够推理的预测模型均可作为插补模型用于MICE中(刘凤芹,2009)。MICE可有效代表数据的统计属性,即缺失数据插补前后具有近似相同的分布,然而插补过程中存在随机性,随着缺失率上升,其插补效果越来越差(宋亮等,2020)。理论上,并没有一种方法适用于所有缺失问题,需对具体问题提出适合的插补方法(刘凤芹,2009)。随机森林方法是基于机器学习领域的插补技术,通过构造多棵决策树对缺失数据进行插补,插补后数据具有随机性,使其抗干扰能力和泛化能力较强,故受异常数据影响较小,插补精度更高,此外,随着缺失比例增大,其误差上升不明显,说明稳健性更好,较好地弥补了MICE的不足,但该方法在数据分布上有待进一步提高(钱超等,2016)。对岩爆预测中的缺失数据插补时,基于案例分析的历史数据,将模型应用于实际工程预测中,当预测新样本出现新的异常值或数据缺失率增大时,对插补方法的稳健性和精度要求更高。因此,利用MICE_RF缺失数据插补方法来处理岩爆数据的缺失问题,即将RF作为MICE的插补预测模型,在保证精度的同时,提高数据分布能力,其插补过程如图1所示。
CRITIC法是由Diakoulaki et al.(1995)提出的一种客观赋权法。应用文献(黄建等,2019)的改进CRITIC法,由于指标间的量纲、数据级不同,需对矩阵进行标准化处理,再采用变异系数对CRITIC法进行改进,根据指数的信息及指标间的相关性来分配指数权重,该方法明显优于目标加权法中的熵权法(Wu et al.,2020)。其主要步骤如下:
Fig.3
Operation steps and process of rockburst grade prediction model
2 试验与结果分析
2.1 岩爆评判指标选取
岩爆是地下工程开挖过程中高地应力区的一种动态不稳定现象,通常是由岩体内部和外部的多种因素共同引起的。基于国内外现有权威学者研究成果,提出了岩爆发生的必备条件:岩体处于高应力状态,其主应力接近或超过其强度岩石质量本身;岩石具有很大的弹性和脆性,说明在应力失效过程中,岩石断裂和变形所消耗的能量不足,剩余的势能转化为动能,以岩石喷射、非坍塌和强冲击波的形式立即释放(Xie et al.,2021)。
由表1可知,188组原始岩爆数据中,完整的数据有137组,有51组部分数据缺失。缺失数据的指标包括X1、X2、X3和X5,其中,X3缺失最多,为51组。数据缺失率达到27.13%,当缺失率大于15%时,需进行插补处理(Acurna et al.,2004),若仅选用完整的数据样本,则数据量少,模型训练不充分,导致预测准确率及泛化能力降低,岩爆指标中数据的缺失为非单调缺失,故采用MICE_RF算法插补缺失数据。
缺失数据插补性能的评估主要基于预测准确度(PAC)和分布准确度(DAC)2个评估指标(Nugroho et al.,2021)。PAC主要通过Pearson相关系数(r)和均方误差(RMSE)来验证插补效果,其中,Pearson相关系数用来度量插补结果值与实际值间的差异,当r接近1时,表明插补技术是有效的;均方误差则用来描述插补结果值与真实值间的密切关系,RMSE值越小,表明插补效果越好(Nugroho et al.,2021)。DAC表示维持数据值真实分布的技术能力,使用Kolmogorov-Smirnov距离进行评估,通过K-S statistic和K-S p-value统计量,量化数据集一次插补所执行的经验分布与原始数据集作为参考分布的累积分布函数间的距离,若K-S statistic很小或K-S p-value很大,则表明缺失数据插补前后具有相同的分布,插补效果更好。6种插补算法的评估指标结果比较如表2所示。
Table 2
表2
表2不同插补方法的效果对比
Table 2 Comparison of effects of different interpolation methods
The treatment of missing values and its effect in the classifier accuracy
[C]//Proceedings of the Meeting of the International Federation of Classification Societies (IFCS).Chicago:International Federation Classification Societies:639-647.
Developing intelligent classification models for rockburst prediction after recognizing significant predictor variables,Section 1:Literature review and data preprocessing procedure
The treatment of missing values and its effect in the classifier accuracy
1
2004
... 由表1可知,188组原始岩爆数据中,完整的数据有137组,有51组部分数据缺失.缺失数据的指标包括X1、X2、X3和X5,其中,X3缺失最多,为51组.数据缺失率达到27.13%,当缺失率大于15%时,需进行插补处理(Acurna et al.,2004),若仅选用完整的数据样本,则数据量少,模型训练不充分,导致预测准确率及泛化能力降低,岩爆指标中数据的缺失为非单调缺失,故采用MICE_RF算法插补缺失数据. ...
Developing intelligent classification models for rockburst prediction after recognizing significant predictor variables,Section 1:Literature review and data preprocessing procedure
2
2019
... 综上可知,岩爆的发生与岩石应力状态、岩性和储存能量等多种因素密切相关,根据上述岩爆的必要条件和特征,对大量岩爆案例和现有研究(田睿等,2020b;张翔宇,2021;卢富然等,2018;殷欣等,2020;Afraei et al.,2019)进行综合分析,选取围岩最大切应力X1(MPa)、单轴抗压强度X2(MPa)、单轴抗拉强度X3(MPa)、应力系数X4(X1 / X2)、脆性系数X5(X2 /X3)和弹性能量指数X6组成岩爆评判指标,选取理由(田睿等,2020a;张翔宇,2021)如下: ...
... 基于文献(Afraei et al.,2019),选取地下工程岩爆案例共188组.其中,岩爆等级1、2、3、4的样本数目分别为31、52、73、32.该岩爆数据集的统计描述见表1. ...
Multiple imputation of missing blood pressure covariates in survival analysis
1
1999
... 缺失数据插补是最常用于处理缺失数据问题的方法,常用的插补技术包括基于统计分析和机器学习2种类型.在统计分析领域,学者们做了大量研究,并提出了许多有效的方法,多重插补是众多方法中最完善的一种(刘凤芹,2009).Boshuizen et al.(1999)提出的基于链式方程多重插补(MICE)是一种特殊的多重插补方法,其链式方程是一个形象的称谓,具体算法由一系列模型组成,任何能够推理的预测模型均可作为插补模型用于MICE中(刘凤芹,2009).MICE可有效代表数据的统计属性,即缺失数据插补前后具有近似相同的分布,然而插补过程中存在随机性,随着缺失率上升,其插补效果越来越差(宋亮等,2020).理论上,并没有一种方法适用于所有缺失问题,需对具体问题提出适合的插补方法(刘凤芹,2009).随机森林方法是基于机器学习领域的插补技术,通过构造多棵决策树对缺失数据进行插补,插补后数据具有随机性,使其抗干扰能力和泛化能力较强,故受异常数据影响较小,插补精度更高,此外,随着缺失比例增大,其误差上升不明显,说明稳健性更好,较好地弥补了MICE的不足,但该方法在数据分布上有待进一步提高(钱超等,2016).对岩爆预测中的缺失数据插补时,基于案例分析的历史数据,将模型应用于实际工程预测中,当预测新样本出现新的异常值或数据缺失率增大时,对插补方法的稳健性和精度要求更高.因此,利用MICE_RF缺失数据插补方法来处理岩爆数据的缺失问题,即将RF作为MICE的插补预测模型,在保证精度的同时,提高数据分布能力,其插补过程如图1所示. ...
Missing value filling effect:A comparison between machine learning and statistical learning
0
2020
Determining objective weights in multiple criteria problems:The CRITIC method
1
1995
... CRITIC法是由Diakoulaki et al.(1995)提出的一种客观赋权法.应用文献(黄建等,2019)的改进CRITIC法,由于指标间的量纲、数据级不同,需对矩阵进行标准化处理,再采用变异系数对CRITIC法进行改进,根据指数的信息及指标间的相关性来分配指数权重,该方法明显优于目标加权法中的熵权法(Wu et al.,2020).其主要步骤如下: ...
Study on multi-dimensional cloud model prediction of rockburst based on improved combination weighting
0
2019
Discussion and selection of machine learning algorithm model for rockburst intensity grade prediction
0
2021
A PSO-RBF neural network model for rockburst tendency prediction
0
2020
Study on the Evolution and Warning of Rockbursts in Deep-buried Tunnels of the Hanjiang-to-Weihe River Diversion Project by Microseismic Monitoring
0
2020
Multiple imputation of missing values of income variables based on chain equation
0
2009
Research on Short-term Traffic Flow Prediction Model Based on Ensembles of Extremely Randomized Trees
0
2017
Rockburst prediction method based on AHP and entropy weight TOPSIS model
0
2018
Class center-based firefly algorithm for handling missing data
2
2021
... 缺失数据插补性能的评估主要基于预测准确度(PAC)和分布准确度(DAC)2个评估指标(Nugroho et al.,2021).PAC主要通过Pearson相关系数(r)和均方误差(RMSE)来验证插补效果,其中,Pearson相关系数用来度量插补结果值与实际值间的差异,当r接近1时,表明插补技术是有效的;均方误差则用来描述插补结果值与真实值间的密切关系,RMSE值越小,表明插补效果越好(Nugroho et al.,2021).DAC表示维持数据值真实分布的技术能力,使用Kolmogorov-Smirnov距离进行评估,通过K-S statistic和K-S p-value统计量,量化数据集一次插补所执行的经验分布与原始数据集作为参考分布的累积分布函数间的距离,若K-S statistic很小或K-S p-value很大,则表明缺失数据插补前后具有相同的分布,插补效果更好.6种插补算法的评估指标结果比较如表2所示. ...
... 值越小,表明插补效果越好(Nugroho et al.,2021).DAC表示维持数据值真实分布的技术能力,使用Kolmogorov-Smirnov距离进行评估,通过K-S statistic和K-S p-value统计量,量化数据集一次插补所执行的经验分布与原始数据集作为参考分布的累积分布函数间的距离,若K-S statistic很小或K-S p-value很大,则表明缺失数据插补前后具有相同的分布,插补效果更好.6种插补算法的评估指标结果比较如表2所示. ...
Missing data interpolation method for highway tunnel operation based on random forest
0
2016
How to make a decision:The analytic hierarchy process
1
1994
... Step 1:利用Saaty(1994)提出的1~9标度方法得到k个两两比较判断矩阵 Ck =(cab,k ) n×n,可表示为 ...
Rockburst prediction based on rough set and weighted grey correlation analysis
0
2017
Comparative study on missing data interpolation methods
0
2020
Strong rockburst prediction based on LOF and improved SMOTE algorithm
0
2021
Research on rockburst prediction based on nine machine learning algorithms
0
2020
Prediction of intensity classification of rockburst based on deep neural network
0
2020a
Prediction model of rockburst intensity classification based on RF-AHP-Cloud model
0
2020b
Research on performance evaluation of rural public goods supply based on combination weighting method
0
2013
An active learning method for unbalanced sample set of pipeline blockage
0
2021
Fuzzy mathematics comprehensive evaluation method for rockburst prediction
0
1998
Urban rail transit operation safety evaluation based on an improved CRITIC method and cloud model
1
2020
... CRITIC法是由Diakoulaki et al.(1995)提出的一种客观赋权法.应用文献(黄建等,2019)的改进CRITIC法,由于指标间的量纲、数据级不同,需对矩阵进行标准化处理,再采用变异系数对CRITIC法进行改进,根据指数的信息及指标间的相关性来分配指数权重,该方法明显优于目标加权法中的熵权法(Wu et al.,2020).其主要步骤如下: ...
Missing value interpolation of statistical data based on kernel principal component analysis and particle swarm optimization support vector machine
0
2018
Research on rockburst prediction classification based on GA-XGB model
2
2021
... 岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018).近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020).岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a).因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题. ...
... 岩爆是地下工程开挖过程中高地应力区的一种动态不稳定现象,通常是由岩体内部和外部的多种因素共同引起的.基于国内外现有权威学者研究成果,提出了岩爆发生的必备条件:岩体处于高应力状态,其主应力接近或超过其强度岩石质量本身;岩石具有很大的弹性和脆性,说明在应力失效过程中,岩石断裂和变形所消耗的能量不足,剩余的势能转化为动能,以岩石喷射、非坍塌和强冲击波的形式立即释放(Xie et al.,2021). ...
Prediction model of rockburst tendency grade based on CRITIC-XGB algorithm
0
2020
Prediction model of rockburst intensity classification based on combined weighting and attribute interval recognition theory
0
2020
Study on Rock Burst Mechanism and Comprehensive Prediction Method of Rock Mass with Structural Plane
0
2021
Rockburst prediction model based on entropy weight integrated with grey relational BP neural network
1
2019
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
... CRITIC法是由Diakoulaki et al.(1995)提出的一种客观赋权法.应用文献(黄建等,2019)的改进CRITIC法,由于指标间的量纲、数据级不同,需对矩阵进行标准化处理,再采用变异系数对CRITIC法进行改进,根据指数的信息及指标间的相关性来分配指数权重,该方法明显优于目标加权法中的熵权法(Wu et al.,2020).其主要步骤如下: ...
岩爆烈度等级预测的机器学习算法模型探讨及选择
1
2021
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
基于PSO-RBF神经网络模型的岩爆倾向性预测
1
2020
... 岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018).近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020).岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a).因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题. ...
引汉济渭深埋隧洞岩爆孕育特征与微震监测预警研究
1
2020
... 岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018).近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020).岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a).因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题. ...
基于链式方程的收入变量缺失值的多重插补
3
2009
... 缺失数据插补是最常用于处理缺失数据问题的方法,常用的插补技术包括基于统计分析和机器学习2种类型.在统计分析领域,学者们做了大量研究,并提出了许多有效的方法,多重插补是众多方法中最完善的一种(刘凤芹,2009).Boshuizen et al.(1999)提出的基于链式方程多重插补(MICE)是一种特殊的多重插补方法,其链式方程是一个形象的称谓,具体算法由一系列模型组成,任何能够推理的预测模型均可作为插补模型用于MICE中(刘凤芹,2009).MICE可有效代表数据的统计属性,即缺失数据插补前后具有近似相同的分布,然而插补过程中存在随机性,随着缺失率上升,其插补效果越来越差(宋亮等,2020).理论上,并没有一种方法适用于所有缺失问题,需对具体问题提出适合的插补方法(刘凤芹,2009).随机森林方法是基于机器学习领域的插补技术,通过构造多棵决策树对缺失数据进行插补,插补后数据具有随机性,使其抗干扰能力和泛化能力较强,故受异常数据影响较小,插补精度更高,此外,随着缺失比例增大,其误差上升不明显,说明稳健性更好,较好地弥补了MICE的不足,但该方法在数据分布上有待进一步提高(钱超等,2016).对岩爆预测中的缺失数据插补时,基于案例分析的历史数据,将模型应用于实际工程预测中,当预测新样本出现新的异常值或数据缺失率增大时,对插补方法的稳健性和精度要求更高.因此,利用MICE_RF缺失数据插补方法来处理岩爆数据的缺失问题,即将RF作为MICE的插补预测模型,在保证精度的同时,提高数据分布能力,其插补过程如图1所示. ...
... 岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018).近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020).岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a).因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题. ...
... 综上可知,岩爆的发生与岩石应力状态、岩性和储存能量等多种因素密切相关,根据上述岩爆的必要条件和特征,对大量岩爆案例和现有研究(田睿等,2020b;张翔宇,2021;卢富然等,2018;殷欣等,2020;Afraei et al.,2019)进行综合分析,选取围岩最大切应力X1(MPa)、单轴抗压强度X2(MPa)、单轴抗拉强度X3(MPa)、应力系数X4(X1 / X2)、脆性系数X5(X2 /X3)和弹性能量指数X6组成岩爆评判指标,选取理由(田睿等,2020a;张翔宇,2021)如下: ...
基于随机森林的公路隧道运营缺失数据插补方法
1
2016
... 缺失数据插补是最常用于处理缺失数据问题的方法,常用的插补技术包括基于统计分析和机器学习2种类型.在统计分析领域,学者们做了大量研究,并提出了许多有效的方法,多重插补是众多方法中最完善的一种(刘凤芹,2009).Boshuizen et al.(1999)提出的基于链式方程多重插补(MICE)是一种特殊的多重插补方法,其链式方程是一个形象的称谓,具体算法由一系列模型组成,任何能够推理的预测模型均可作为插补模型用于MICE中(刘凤芹,2009).MICE可有效代表数据的统计属性,即缺失数据插补前后具有近似相同的分布,然而插补过程中存在随机性,随着缺失率上升,其插补效果越来越差(宋亮等,2020).理论上,并没有一种方法适用于所有缺失问题,需对具体问题提出适合的插补方法(刘凤芹,2009).随机森林方法是基于机器学习领域的插补技术,通过构造多棵决策树对缺失数据进行插补,插补后数据具有随机性,使其抗干扰能力和泛化能力较强,故受异常数据影响较小,插补精度更高,此外,随着缺失比例增大,其误差上升不明显,说明稳健性更好,较好地弥补了MICE的不足,但该方法在数据分布上有待进一步提高(钱超等,2016).对岩爆预测中的缺失数据插补时,基于案例分析的历史数据,将模型应用于实际工程预测中,当预测新样本出现新的异常值或数据缺失率增大时,对插补方法的稳健性和精度要求更高.因此,利用MICE_RF缺失数据插补方法来处理岩爆数据的缺失问题,即将RF作为MICE的插补预测模型,在保证精度的同时,提高数据分布能力,其插补过程如图1所示. ...
基于粗糙集和加权灰色关联分析的岩爆预测
1
2017
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
缺失数据插补方法的比较研究
1
2020
... 缺失数据插补是最常用于处理缺失数据问题的方法,常用的插补技术包括基于统计分析和机器学习2种类型.在统计分析领域,学者们做了大量研究,并提出了许多有效的方法,多重插补是众多方法中最完善的一种(刘凤芹,2009).Boshuizen et al.(1999)提出的基于链式方程多重插补(MICE)是一种特殊的多重插补方法,其链式方程是一个形象的称谓,具体算法由一系列模型组成,任何能够推理的预测模型均可作为插补模型用于MICE中(刘凤芹,2009).MICE可有效代表数据的统计属性,即缺失数据插补前后具有近似相同的分布,然而插补过程中存在随机性,随着缺失率上升,其插补效果越来越差(宋亮等,2020).理论上,并没有一种方法适用于所有缺失问题,需对具体问题提出适合的插补方法(刘凤芹,2009).随机森林方法是基于机器学习领域的插补技术,通过构造多棵决策树对缺失数据进行插补,插补后数据具有随机性,使其抗干扰能力和泛化能力较强,故受异常数据影响较小,插补精度更高,此外,随着缺失比例增大,其误差上升不明显,说明稳健性更好,较好地弥补了MICE的不足,但该方法在数据分布上有待进一步提高(钱超等,2016).对岩爆预测中的缺失数据插补时,基于案例分析的历史数据,将模型应用于实际工程预测中,当预测新样本出现新的异常值或数据缺失率增大时,对插补方法的稳健性和精度要求更高.因此,利用MICE_RF缺失数据插补方法来处理岩爆数据的缺失问题,即将RF作为MICE的插补预测模型,在保证精度的同时,提高数据分布能力,其插补过程如图1所示. ...
LOF与改进SMOTE算法组合的强烈岩爆预测
1
2021
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
基于9种机器学习算法的岩爆预测研究
1
2020
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
基于深度神经网络的岩爆烈度分级预测
2
2020a
... 岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018).近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020).岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a).因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题. ...
... 综上可知,岩爆的发生与岩石应力状态、岩性和储存能量等多种因素密切相关,根据上述岩爆的必要条件和特征,对大量岩爆案例和现有研究(田睿等,2020b;张翔宇,2021;卢富然等,2018;殷欣等,2020;Afraei et al.,2019)进行综合分析,选取围岩最大切应力X1(MPa)、单轴抗压强度X2(MPa)、单轴抗拉强度X3(MPa)、应力系数X4(X1 / X2)、脆性系数X5(X2 /X3)和弹性能量指数X6组成岩爆评判指标,选取理由(田睿等,2020a;张翔宇,2021)如下: ...
RF-AHP-云模型下岩爆烈度分级预测模型
2
2020b
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
... 综上可知,岩爆的发生与岩石应力状态、岩性和储存能量等多种因素密切相关,根据上述岩爆的必要条件和特征,对大量岩爆案例和现有研究(田睿等,2020b;张翔宇,2021;卢富然等,2018;殷欣等,2020;Afraei et al.,2019)进行综合分析,选取围岩最大切应力X1(MPa)、单轴抗压强度X2(MPa)、单轴抗拉强度X3(MPa)、应力系数X4(X1 / X2)、脆性系数X5(X2 /X3)和弹性能量指数X6组成岩爆评判指标,选取理由(田睿等,2020a;张翔宇,2021)如下: ...
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...
基于组合赋权和属性区间识别理论的岩爆烈度分级预测模型
4
2020
... 岩爆是地下岩石工程开挖或外界扰动下,岩体聚积的弹性变形势能突然释放,导致围岩爆裂、弹射的动力灾害现象(李任豪等,2020;刘飞,2020;卢富然等,2018).近年来,随着采矿业不断向深部推进以及隧道等地下工程的扩大,岩爆灾害呈频发趋势(Xie et al.,2021;殷欣等,2020).岩爆作为一种具有很强突发性和随机性的动力失稳地质灾害,对人员、设备和建筑的安全构成了巨大的威胁(田睿等,2020a).因此,如何及时、准确地预测岩爆等级已成为地下工程领域亟需解决的热点问题. ...
... 关于岩爆等级预测问题,国内外学者开展了大量研究.相关研究主要包括判据预测、现场监测和综合预测等.近年来,随着岩爆预测研究的不断深入,指标赋权类算法和机器学习算法得到了较快发展(谭文侃等,2021).以指标权重为核心的岩爆等级预测方法包括层次分析法(AHP)(田睿等,2020b)、改进熵权-CRITIC法(黄建等,2019)和粗糙集理论(商欢迪等,2017)等;以机器学习算法为核心的预测模型包括支持向量机(SVM)(李明亮等,2021)、神经网络(Zheng et al.,2019)和K近邻(汤志立等,2020)等.迄今为止还没有一种理论或方法能够非常准确地预测岩爆,岩爆预测需结合多种方法和理论(殷欣等,2020).鉴于此,谢学斌等(2020)提出了一种基于CRITIC-XGB算法的岩爆等级预测模型,该模型具有更快的收敛速度和更高的预测精度;殷欣等(2020)提出了一种基于AHP和反熵权法的综合赋权,再通过属性区间识别理论建立岩爆烈度预测模型,综合考虑了各指标权重的主观性和客观性.上述模型均显著提高了岩爆预测精度,但也存在一些问题有待改进,如:CRITIC法仅计算客观权重,过度依赖指标的变异程度;传统的AHP法中,各指标权重在选择判断矩阵时是随机的,导致计算的权重可能会偏离实际权重.此外,关于岩爆灾害发生的数据难以收集,特别是强烈岩爆数据较少,即使能在灾害发生前记录相关数据,也存在个别数据缺失的情况,导致岩爆预测时存在精度较低和性能不稳定等问题. ...