img

QQ群聊

img

官方微信

  • CN 62-1112/TF 
  • ISSN 1005-2518 
  • 创刊于1988年
高级检索

黄金科学技术, 2019, 27(2): 207-215 doi: 10.11872/j.issn.1005-2518.2019.02.207

采选技术与矿山管理

多元统计分析在滨海矿区水源识别中的应用——以三山岛金矿为例

刘国伟,1,2,3, 马凤山,1,2, 郭捷1,2, 杜云龙4, 侯成录4, 李威4

1. 中国科学院地质与地球物理研究所,中国科学院页岩气与地质工程重点实验室,北京 100029

2. 中国科学院地球科学研究院,北京 100029

3. 中国科学院大学,北京 100049

4. 山东黄金矿业(莱州)有限公司三山岛金矿,山东 莱州 261442

Application of Multivariate Statistical Analysis to Identify Water Source in Coast Mine Area:As Example of Sanshandao Gold Mine

LIU Guowei,1,2,3, MA Fengshan,1,2, GUO Jie1,2, DU Yunlong4, HOU Chenglu4, LI Wei4

1. Key Laboratory of Shale Gas and Geoengineering,Institute of Geology and Geophysics,Chinese Academy of Sciences,Beijing 100029,China

2. Institutions of Earth Science,Chinese Academy of Sciences,Beijing 100029,China

3. University of Chinese Academy of Sciences,Beijing 100049,China

4. Sanshandao Gold Mine,Shandong Gold Mining(Laizhou)Co. ,Ltd. ,Laizhou 261442,Shandong,China

收稿日期: 2018-07-31   修回日期: 2018-11-01   网络出版日期: 2019-04-29

基金资助: 国家重点研发计划项目“黄渤海不同类型海岸带海水入侵发生机理研究”(编号:2016YFC0402802)和国家自然科学基金重点项目“海底采矿对地质环境的胁迫影响与致灾机理”.  编号:41831293

Received: 2018-07-31   Revised: 2018-11-01   Online: 2019-04-29

作者简介 About authors

刘国伟(1991-),男,山东菏泽人,博士研究生,从事矿山水文地质、工程地质研究工作l1014893489@163.com , E-mail:l1014893489@163.com

马凤山(1964-),男,河北吴桥人,研究员,博士生导师,从事地质工程与地质灾害研究工作fsma@mail.iggcas.ac.cn , E-mail:fsma@mail.iggcas.ac.cn

摘要

海底矿山突水是矿山开采亟待解决的问题,通过对矿山巷道水的研究,能够划分出矿山突水水源类型,进而对突水可能性作出预测。以山东三山岛金矿西山矿区地下水系统为例,对其31个水样的水化学资料进行多元统计分析研究。利用因子分析法对存在相关关系的变量进行空间降维处理,找出能够反映大于90%水样水化学信息的公共正交因子,以其作为系统聚类变量。运用系统聚类并结合实际地下水性质,将研究区地下水划分为典型的2类,然后建立矿区水源的Bayes线性模型,并对其进行验证。通过因子分析法和系统聚类分析法得出,-375 m中段涌水水源划分为2种类型,并得出2种具体的判别函数。结果表明:多元统计方法判别水源具有快速、准确且经济的特点。

关键词: 三山岛金矿 ; 矿山突水 ; 因子分析 ; 系统聚类分析 ; Bayes线性模型 ; 水源判别

Abstract

Xishan gold mine is subordinate to the Sanshandao gold mine and located in the coastal area of Laizhou Bay,Laizhou City,Shandong Province.In terms of geotectonic,it is located in the western part of the second up-warping zone of the Neocathaysian structural system,which is also Sanshandao-Cangshang fracture of the eastern side of Yishu deep facture.Xishan gold mine has been exploited in under the Bohai sea.Submarine mine water inrush has become an urgent problem to be solved in mine mining.The research on subway water can classify the types of mine groundwater and then predict the possibility of water inrush.Taking groundwater system of Sanshandao gold mine for example,hydrochemical data of 31 water samples was chosen to study with multivariate statistical analysis methods.By using factor analysis,it can reduce the spatial dimension of many variables with correlation relationship,and then identify principle factors which represent over ninety percent information of hydrochemical data.Hierarchical clustering analysis(HCA)uses these principle factors as clustering variables.HCA combined with actual groundwater quality divided the studied groundwater into 2 classic groups,then established and validated Fisher identification model.Through FA and HCA,the groundwater of -375 m subway were divided into two types which all have a specific discriminant function could determine which type of water is.The results represent that the water samples were divided into two typical M1 and M2 by factor analysis combined with principle component analysis.Among the 31 water samples,three of them were discriminated wrong,and the correct rate of discriminant reached 90.3%.Stepwise discriminant analysis and factor analysis were combined to process the seven conventional ions data.Bayes linear discriminant function and function values from 1740 exploration line to 2740 exploration line in -375 m sublevel was obtained.Bayes linear function discriminant results are completely consistent with the results of the factor analysis method,and the two selected discriminant water samples also agree.The consistency of the discriminant results shows that the factor analysis method and the stepwise analysis method are mutually verified.A multivariate statistical method was combined to obtain a quantitative Bayes linear discriminant function,which was applied to the recognition of the source type in the mining area.It was only necessary to know the ion concentration of the corresponding variable,and the water sample type could be determined by substituting it.This method has the characters of accurate,fast,and economical.

Keywords: Sanshandao gold mine ; mine water inrush ; factor analysis ; systematic cluster analysis ; Bayes linear model ; discriminate of water sources

PDF (3570KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

刘国伟, 马凤山, 郭捷, 杜云龙, 侯成录, 李威. 多元统计分析在滨海矿区水源识别中的应用——以三山岛金矿为例[J]. 黄金科学技术, 2019, 27(2): 207-215 doi:10.11872/j.issn.1005-2518.2019.02.207

LIU Guowei, MA Fengshan, GUO Jie, DU Yunlong, HOU Chenglu, LI Wei. Application of Multivariate Statistical Analysis to Identify Water Source in Coast Mine Area:As Example of Sanshandao Gold Mine[J]. Gold Science and Technology, 2019, 27(2): 207-215 doi:10.11872/j.issn.1005-2518.2019.02.207

矿产资源是人类生产活动中最重要的物质基础之一,它对保障社会经济的持续和谐发展意义重大。随着陆地矿产资源的日趋减少,海洋矿产的开发已成为全球的新兴产业,而且占有越来越重要的地位,尤其是对滨海基岩矿床的开采已是目前矿业开发的重点。截至目前,世界上许多国家已经对滨海矿山实行了工业化生产,矿山潜在突水灾害无疑会成为海底矿山开采关注的焦点,而矿山巷道水源识别对于突水预警具有至关重要的作用。近年来,国内外学者围绕水源识别开展了大量的研究工作,例如:运用主成分分析法预测混合水的潜在混合比[1];运用多元统计方法中的主成分分析法对水化学数据进行降维,确定出混合端元模型,并进行混合比计算[2,3];针对端元不确定性问题,Carrera等[4]认为混合后的水样中包含了其端元值的信息,在没有确切端元信息的情况下,可以利用已知的混合水样进行端元值和混合比的计算,由此提出最大似然法(MIX法);相比系统聚类,模糊聚类是一种更好的分类工具,被应用于地区地下水系统的水化学倾向分布的刻划[5];基于水化学信息,综合运用主成分分析法、聚类分析法和混合端元法来评估地下水水流和混合比,Long等[6]运用主成分分析与混合端元分析相结合的方法来描述喀斯特地区地下水水流类型;采用多元统计方法中的分层聚类法和逐步判别分析方法来判别突水点类型归属[7];主成分分析与Bayes判别法判别突水水源;从水文地球化学的角度出发,提出采用主成分分析法和最大似然概率法对裂隙涌水水源及其混合比进行判识和计算[8,9]。综上可知,多元统计方法是研究矿区地下水源的有效工具,在实践中得到了广泛应用。

本文以山东三山岛金矿为例,运用2种多元统计分析方法互相验证、互为辅助进行水源识别,具有精确、简易及经济等优点。通过对三山岛金矿西山矿区-375 m中段31个水样的水化学资料进行多元统计分析,包括因子分析、聚类分析和判别分析,最后建立矿区水源识别的判别函数。

1 矿区控水概况

西山矿区隶属于三山岛金矿,位于山东省莱州市莱州湾滨海地带,大地构造上处于新华夏系第二隆起带之西缘,沂沭断裂东侧的次级断裂——三山岛—仓上断裂(图1,2)。矿区主要控水断裂有 3条[10]。F1断裂为矿区的控矿断裂,矿体分布在断层下盘,总体走向35°,倾向SE,倾角约为40°,在主裂面上发育有50~100 mm厚的断层泥,隔水性能良好。在F1断裂西侧发育有一条规模较小的伴生断裂F2,该断裂走向280°,倾角85°,上盘北移,下盘南移,具有扭性断层特点。断层两侧裂隙发育特征差异明显,其西侧NE向裂隙较发育、NW向裂隙少见;东侧主要发育NW向裂隙,靠近F2断裂,裂隙发育更密集。根据物探结果分析,F2断裂表现为明显的低阻特性,表明其具有良好的导水性能。矿区还发育有一条与F1断裂近直交并切断F1断裂的断层F3,其将F1断裂错断10~20 m。F3断层为一条横穿整个矿区的区域性断层,即三元—陈家大断裂,总体走向300°~310°,倾向NE,倾角近90°。F3断裂的主裂面位于南侧,其中有泥质物和断层角砾填充,南侧岩体完整性较好,主要发育NW-SE节理,节理面平直。F3断层北侧发育有NE-SW节理、SE-NW节理和水平节理,岩体破碎,节理开度大。根据目前勘采现状,F3断层深度应大于850 m,破碎带宽度为15~35 m,属于张性断裂。断层面未发现充填物,具有良好的导水性[11]

图1

图1   区域地质构造图

Fig.1   Regional geological tectonic map

1.第四纪沉积物;2.早白垩世花岗闪长岩;3.早白垩世火山岩;4.早白垩世花岗岩;5.晚侏罗世花岗岩类;6.晚三叠世花岗岩类;7.元古宙岩石;8.超高压变质岩;9.太古宙岩石;10.主要断裂;11.焦家式金矿;12.玲珑式金矿


图2

图2   研究区地质简图

Fig.2   Geological sketch of study area

1.第四系;2.郭家岭花岗闪长岩;3.玲珑花岗岩;4.片麻岩;5.绢云母化花岗岩;6.绢云母化和硅化花岗碎裂岩;7.绢云母化和硅化碎裂岩;8.断裂;9.倾向;10.矿体


2 矿区水源识别的多元统计分析

本文收集了山东三山岛金矿西山矿区-375 m中段(图3)32个水样水化学成分资料(表1),化学数据包含K+、Na+、Ca2+、Mg2+、Cl-、SO42-、CHO-、pH、电导率(EC)和总矿化度(TDC)10个变量。31个水样中7个阴阳离子占TDS总量的99%以上,所选离子具有合理性。水样自2009~2015年不间断获取,每年取一次水样,每次取200 mL。水样数据测量由中国地震局地质研究所完成。表中375-1~375-9号水点数据有多有少,这是因为-375 m巷道受季节性降雨和裂隙水间断性减少(或增多)所致,例如375-2号水点只在2005年8月取了一次水样,此后已干涸。

图3

图3   水样采集位置图

Fig.3   Location map of water samples collection


表1   -375 m中段水样水化学参数

Table 1  Hydrochemical parameters of water samples from -375 m middle section

水样位置K+/(mg·L-1Na+/(mg·L-1Ca2+/(mg·L-1Mg2+ /(mg·L-1Cl-/(mg·L-1SO42-/(mg·L-1HCO3-/(mg·L-1pH值(标准值)EC/(μs·cm-1TDS/(mg·L-1
375-1-1248.410 400761.51 287.919 8522 305.4219.67.1944 90035 074.8
375-1-21979 750801.61 222.318453.52 334.3233.77.7439 60032 995
375-1-320510 031.2849.71 239.318 916.12 497.6244.67.0742 30033 991.5
375-1-4190.29 800841.71 21519 224.5624.4250.77.3142 10032 147.5
375-1-5179.79 875721.41 166.418 402.12 372.7253.27.3440 00032 974.6
375-2-128610 650697.41 312.219 8522 286.2207.47.0345 20035 292.8
375-3-1299.29 445537.11 132.417 583.22 017.3219.67.3640 80031 233.8
375-3-22418 900681.41 04016 705.82 190.2233.77.5637 00029 992.1
375-3-3275.89 200753.51 069.217 579.72 286.2273.37.4539 80031 437.9
375-4-1316.89 825641.31 044.917 583.22 017.3201.37.4941 10031 629.8
375-4-22588 900921.8945.317 014.22 295.8181.27.4637 20030 516.3
375-4-3282.59 7251 122.21 001.218 607.72 516.8170.87.1141 80033 433.8
375-4-4285.59 9001 314.6831.118 710.52 401.5168.47.3240 80033 614.5
375-4-5285.110 0001 154.3916.118 874.32 401.5170.87.0340 90033 821.3
375-5-126012 0501 146.31 020.621 9792 459.1119.67.2950 40039 052.7
375-5-220810 886.21 52397220 8182 545.6114.17.4142 50037 081.6
375-5-319510 9001 595.2957.419 738.62 708.91087.0545 80036 216.5
375-5-4226.511 2501 643.3823.821 280.62 603.285.47.3244 70037 916.2
375-5-5252.511 50011 500517.621 471.72 353.581.87.0344 70038 156.3
375-6-1337.511 4502 084.2777.622 156.32 497.6107.47.0249 70039 411.6
375-6-226211 8192 276.5726.622 411.52 4881087.0644 40040 117.1
375-6-3257.89 062.55051 142.117 560.52 315236.17.6434 50031 080.1
375-7-130510 7001 723.4923.421 2702 363.1134.27.1748 10037 424.9
375-7-22519 562.55211 154.317 642.42 353.5225.77.1639 30031 716.5
375-7-3265.69 187.54811 161.517 731.72 238.22307.6634 40031 296.2
375-8-1290.410 3501 0261 078.918 965.71 729.1158.67.344 10033 598.7
375-8-229410 937.52 312.6626.921 794.72 257.4102.57.6643 90038 344.7
375-8-3198.110 438721.41 287.919 597.12 401.5233.77.2243 00034 884
375-8-4281.39 062.55211 154.317 389.32 353.52307.5435 00030 992.4
375-9-120510 375681.41 268.518 9192 449.5256.27.6342 50034 154.6
375-9-2262.59 2505211 154.317 731.72 343.9222.77.5734 90031 486.7

注:EC代表电导率,TDS代表总固体溶解量

新窗口打开| 下载CSV


2.1 因子分析(FA)

因子分析是主成分分析的推广,其利用主成分分析法的降维思想,从原始变量相关矩阵内部结构出发,把一些具有相关关系的变量归结为少数几个综合因子,是一种多元统计分析方法。因子分析根据相关性将变量进行分组,使得同组内变量相关性较高,不同组内变量相关性较低,每组变量用一个公共结构表示(公共因子)。本文水样中7种主离子占TDS总量的99%,电导率又与阴阳离子的量有关,与CHO-直接相关,由此可知,所研究矿区水中各离子具有一定的相关性,其并非独立存在于矿区巷道水中。离子间相关性越大,代表地质信息重合程度越高。利用SPSS软件对10个变量进行相关性分析(表2),结果表明:Na+与Cl-、EC、TDS具有良好的正相关性;Ca2+与Mg2+、CHO-具有良好的负相关性,而与TDS具有正相关;Mg2+与CHO-具有正相关性;Cl-与EC、TDS具有良好的正相关性;CHO-与TDS具有良好的负相关性;EC与TDS具有良好的正相关性。不作处理就对水样水化学数据进行聚类分析,将会导致重复使用变量数据,使变量数据所代表的地质信息被加权利用,导致计算的聚类结果发生畸变。这就要求首先对数据进行因子分析,把具有相关关系的变量归结为正交旋转因子,再以正交旋转因子作为变量进行聚类分析。

表2   变量相关系数矩阵

Table 2  Correlation matrix of variables

K+Na+Ca2+Mg2+Cl-SO42-CHO-pHECTDS
K+1.0000.0100.194-0.3660.0650.037-0.270-0.1050.1120.065
Na+0.0101.0000.763-0.4960.9560.260-0.766-0.5220.8780.969
Ca2+0.1940.7631.000-0.8600.8420.254-0.880-0.3980.6400.854
Mg2+-0.366-0.496-0.8601.000-0.555-0.2370.8290.235-0.334-0.576
Cl-0.0650.9560.842-0.5551.0000.209-0.777-0.4700.8350.987
SO42-0.0370.2600.254-0.2370.2091.000-0.328-0.1520.1170.345
CHO--0.270-0.766-0.8800.829-0.777-0.3281.0000.404-0.621-0.805
pH-0.105-0.522-0.3980.235-0.470-0.1520.4041.000-0.624-0.495
EC0.1120.8780.640-0.3340.8350.117-0.621-0.6241.0000.839
TDS0.0650.9690.854-0.5760.9870.345-0.805-0.4950.8391.000

新窗口打开| 下载CSV


本研究使用的31个水样水化学数据变量存在不同的量纲,不同量纲会引起各变量取值分散程度差异较大,这时总体方差将主要受方差较大的变量控制。为了消除量纲不同可能带来的影响,采用变量标准化的方法来处理变量,进而进行主成分分析。在SPSS软件中,因子分析或主成分分析所用的数据已作了标准化处理。运用SPSS软件对数据进行分析,提取初始因子,得到10个变量的特征值和总方差解释(表3)。若累计方差贡献率达到90%,则认为所提取的因子可以很好地解释数据所反映的水化学信息[12,13,14],因此提取4个初始因子,这4个初始因子解释了水化学信息总方差的91.79%。

表3   总方差解释

Table 3  Explanation of total variance

主成分特征值特征值
方差方差/%累计方差/%方差方差/%累计方差/%
16.04860.47660.4766.04860.47660.476
21.33113.31173.7871.33160.47673.787
30.9729.71583.5020.9729.71583.502
40.8298.29091.7920.8298.29091.792
50.5005.00396.794
60.1371.37098.164
70.1101.09999.263
80.0590.59199.854
90.0150.146100.000
100.0000020.000018100.000

新窗口打开| 下载CSV


建立因子分析模型的目的是不仅要找出主因子,更重要的是找出主因子所代表的明确意义,以便对变量进行更深层次的分析。因子旋转在保证公因子对变量贡献率不变的情况下,又能够使公因子之间的区分更明显。运用方差最大旋转法对因子载荷进行旋转,经过12次迭代之后收敛,由表4可以看出,各变量在因子中方差差异性更加明显,更容易得出各变量在特定因子中的贡献值大小。F1在Na+、Ca2+、Mg2+、Cl-、CHO-和TDS变量上因子载荷较大,F2在Na+、pH和EC变量上因子载荷较大,F3在K+变量上因子载荷较大,F4在SO42-变量上因子载荷较大。因子载荷矩阵是计算因子得分矩阵的基础,由此可以得出因子得分矩阵(表5)。

表4   因子载荷矩阵

Table 4  Factor component matrix

变量因子载荷旋转因子载荷方差HI2
F1F2F3F4F11F21F31F41
K+0.195-0.712-0.4510.3930.1360.055-0.938-0.0110.90
Na+0.9330.2720.014-0.0490.6950.6520.1780.0830.95
Ca2+0.918-0.2120.030-0.2130.9150.282-0.1000.0860.93
Mg2+-0.7220.575-0.0320.213-0.8690.0330.359-0.1170.90
Cl-0.9450.185-0.024-0.1360.7700.5780.1350.0220.95
SO42-0.330-0.1660.7940.4730.1700.0760.0060.9770.99

CHO-

pH

-0.9000.273-0.0590.096-0.865-0.2890.185-0.1790.90
-0.575-0.2970.264-0.557-0.071-0.8610.195-0.1200.80
EC0.8370.353-0.2350.1300.4780.8150.044-0.0520.90
TDS0.9660.1610.084-0.0530.7650.5830.1270.1610.97

新窗口打开| 下载CSV


表5   因子得分系数矩阵

Table 5  Factor score coefficient matrix

变量主成分得分系数
F1F2F3F4
K+0.195-0.712-0.4510.393
Na+0.9330.2720.014-0.049
Ca2+0.918-0.2120.030-0.213
Mg2+-0.7220.575-0.0320.213
Cl-0.9450.185-0.024-0.136
SO42-0.330-0.1660.7940.473
CHO--0.9000.273-0.0590.096
pH-0.575-0.2970.264-0.557
EC0.8370.353-0.2350.130
TDS0.9660.1610.084-0.053

新窗口打开| 下载CSV


2.2 聚类分析

聚类分析是多元统计学方法中的一个主要分支,其主要目标是根据变量特性进行聚类。聚类分析按照距离划分样本,使具有最相近特性的样本分为一类。聚类分析的结果就是在同类中的样本具有同性,在不同类中的样本具有异性。聚类分析中最常用的方法是系统聚类法,该方法能够提供任意样本与整个样本数据中的最初相似关系并形象地用系统聚类图(树状图)来表示。本文中,将原始数据标准化矩阵与因子得分系数矩阵相乘,得出因子得分矩阵,进而用因子得分作为聚类变量。在MATLAB软件中计算可得因子得分矩阵,如表6所示。以因子得分矩阵作为变量,对水样进行系统聚类分析,用Ward法进行类与类之间连接,用欧式距离表示因子得分值之间的相似性,欧式距离经常被用来描述2个样品的相似性,并且欧氏距离能够表达样品值的不同。欧式距离[15]计算公式如下:

表6   水样因子得分矩阵

Table 6  Factor scores matrix of water samples

水样位置因子得分
F1F2F3F4
375-1-10.1451.681-0.2990.707
375-1-2-4.6600.7811.220-1.139
375-1-3-1.5361.9690.5660.858
375-1-4-4.6602.575-3.173-2.340
375-1-5-3.6391.5950.991-0.270
375-2-11.1801.388-0.9401.441
375-3-1-4.223-0.812-1.1280.426
375-3-2-6.907-1.0240.311-0.483
375-3-3-5.205-0.758-0.1560.309
375-4-1-3.236-1.471-1.1330.118
375-4-2-4.830-1.6970.311-0.176
375-4-30.083-0.688-0.0631.154
375-4-40.297-1.496-0.0080.251
375-4-50.903-0.763-0.3631.059
375-5-18.1111.430-0.0230.119
375-5-23.9540.6561.285-0.716
375-5-34.9351.3221.1780.440
375-5-46.7170.2521.057-0.463
375-5-513.600-1.5550.094-1.265
375-6-110.150-0.631-0.9991.186
375-6-29.6440.1870.1850.061
375-6-3-6.903-1.1620.638-0.402
375-7-16.120-0.197-0.7850.665
375-7-2-3.7980.163-0.0050.873
375-7-3-6.697-1.1970.421-0.492
375-8-10.153-0.098-1.786-0.198
375-8-26.550-1.8470.027-1.430
375-8-3-0.8642.3460.5890.270
375-8-4-6.468-1.4290.3250.153
375-9-1-2.9161.5401.098-0.542
375-9-2-5.999-1.0600.569-0.175

新窗口打开| 下载CSV


Dik=j=1m(vij-vkj)2

式中:ik代表2个不同的水样;j代表变量类型;v代表变量数值。欧氏距离D越小,则相似程度越好,其大小定量地表示出水样之间的亲疏程度。

采用SPSS软件对31个水样进行聚类分析,聚类结果如图4所示。由聚类谱系图可以看出,-375 m中段1740~2740行线水点类型可以明显划分为2类,其中375-1、375-2、375-3、375-4、375-7、375-8和375-9为第一类(M1),375-5和375-6为第二类(M2)。由水点位置图也可以看出,375-5和375-6水点位置距离较近,其水化学特征具有相似性。这其中有375-6-3、375-7-1和375-8-2 这3个判别错误的水样。从图3可以看出,375-6和375-7水点的位置相近,且在水样获取过程中是区域性,这就又增加了两点之间的相近性。聚类分析无法将这2个水化学极其相近的水样区分开来,因此产生了2个判别错误的水样。375-8-3水化学数据中的3个常规离子K+、Ca2+、Mg2+的误差分别达到25.5%、37.0%和24.2%,由此可以看出,这组数据的误差是由取样过程所造成的。以上结果说明利用SPSS软件对金矿水样进行多元统计分析时,最大的局限性就是不能准确判别模糊数据,即对水化学数据区别不大的水点作出了错误判断。

图4

图4   系统聚类谱系图

Fig.4   Dendrogram of systematic cluster


2.3 逐步判别分析

在判别分析中,并非变量越多越好,而是应该选取主要变量进行判别分析,因为每一个变量在判别式中所起的作用不同,有些变量起主要作用,而有些变量起轻微作用,将起轻微作用的变量保留在判别式中,不仅会增加计算量,还会产生干扰,影响判别效果。逐步判别法主要是根据所给数据中的变量在每个判别式中的重要性来挑选出判别效果最优的变量进入判别式[16]。逐步判别的基本思想是:逐步引入一个“最重要”的变量进入判别式,同时对先引入判别式的一些变量进行检验,如果其判别能力随着引入的新变量而变得不显著了,则将其从判别式中剔除,直至没有新的变量能够进入,依然没有旧变量需要剔除为止。

数据选取:根据系统聚类结果,剔除375-6-3、375-7-1和375-8-2这3个判别错误的水样,另随机选择375-1-2和375-4-4作为检验水样,对剩余的26个水样建立Bayes线性判别函数。在选择的所有变量中,pH、EC和TDS是水样中七大常规离子最直接的体现,并且与其有较高的相关性。在前人研究的基础上,选择K+、Na+、Ca2+、Mg2+、Cl-、SO42-和CHO-作为判别分析变量,其数据如表1所示。

模型建立:在SPSS软件中对所选取的水样变量数据进行逐步判别分析,得到Bayes线性判别函数:

M1=0.037×V(Na)+0.338×V(CHO)-216.457
M2=0.022×V(Na)+0.356×V(CHO)-250.739

式中:M1代表水样类型1、M2代表水样类型2; V(Na)、V(CHO)代表相应离子的质量浓度。根据Bayes后验概率最大原则,将相应离子浓度代入Bayes线性判别函数中,哪一个判别函数中的数值较大,就属于哪一类水样。将26个水样和3个检验水样的相应离子浓度代入到上述2个Bayes线性判别函数中,所得数据如表7所示。通过交叉对比图4与表7发现,运用逐步判别分析法建立的Bayes线性函数对于水源类型识别的正确率达到了100%。结合多元统计分析方法,能够得出定量分析水源类型的Bayes线性函数。在西山矿区,开采活动不仅加快了地下水的流动速率,而且破坏了第四纪含水层。F3断裂和NW断层控制着海水和淡水的横向补给水量,并有一小部分的垂直补给,其补给深度达到了-510 m。更为重要的是,在-375 m中段,大部分水点的淡水补给甚至达到了40%[16]M1代表水样距离F3断层较近,对375-5和375-6水点进行实时监测及重点水流量数据的监测,能够对通过F3通道突水的可能性做出精准预测。

表7   水样类型的判别

Table 7  Identification of water samples

点号Bayes函数值
M1M2类型

375-1-1

375-1-3

375-1-4

375-1-5

375-2-1

375-3-1

375-3-2

375-3-3

375-4-1

375-4-2

375-4-3

375-4-5

375-5-1

242.5498

237.3542

230.8616

234.4816

247.6762

207.2148

191.8156

216.3004

215.0894

174.0706

201.0804

211.2554

269.7998

230.4202

219.9806

211.5024

215.1574

238.4558

190.3102

170.2684

190.8676

202.5736

159.6634

192.2126

203.7626

279.5202

M1

M1

M1

M1

M1

M1

M1

M1

M1

M1

M1

M1

M2

375-5-2

375-5-3

375-5-4

375-5-5

375-6-1

375-6-2

375-7-2

375-7-3

375-8-1

375-8-3

375-8-4

375-9-1

375-9-2

224.8802

223.3290

228.6402

236.6734

243.4762

257.3320

213.6241

201.2025

220.0818

248.7216

196.5775

253.9956

201.0476

229.5296

228.8770

239.0118

248.7846

251.8558

267.4750

196.4774

181.5960

215.9982

234.8644

176.3460

236.7634

182.7464

M2

M2

M2

M2

M2

M2

M1

M1

M1

M1

M1

M1

M1

检测水点Bayes函数值
M1M2类型
375-1-2223.2656205.9684M1
375-4-4206.7442199.0778M1

新窗口打开| 下载CSV


3 结论

(1)以山东三山岛西山金矿水样的水化学信息为基础,对水化学数据进行预处理,运用主成分分析中的因子分析法将水样划分为典型的M1和M2类型。其中,31个水样出现了3个错误判别,其判别正确率达到了90.3%。

(2)逐步分析法与因子分析法相结合,对所取水样中七大常规离子数据进行逐步分析,得出了 -375 m中段1740~2740勘探线的Bayes线性判别函数及函数值。Bayes线性函数判别结果与因子分析法的结果完全一致,并且所选择的2个判别水样也与其相吻合。判别结果的一致性表明:因子分析法与逐步分析法相互验证。

(3)结合多元统计方法,得出了定量化的Bayes线性判别函数,将其运用于矿区水源类型识别中,只需给出相应变量的离子质量浓度,代入该函数中便可判别其水样类型。该方法具有准确、快速且经济的特点。

(4)本文运用的2种多元统计方法既相辅相成又互相检验,增加了结论的可信度和准确率,而不仅仅是运用单一方法,这不同于大部分相关研究。

参考文献

ChristophersenNHooperR P.

Multivariate analysis of stream water chemical data:The use of principal components analysis for the end‐member mixing problem

[J]. Water Resources Research1992281):99-107.

[本文引用: 1]

LaaksoharjuMSkårmanCSkårmanE.

Multivariate mixing and mass balance (M3) calculations,a new tool for decoding hydrogeochemical information

[J].Applied Geochemistry1999147):861-871.

[本文引用: 1]

DoctorD HAlexanderE CPetričMet al.

Quantification of karst aquifer discharge components during storm events through end-member mixing analysis using natural chemistry and stable isotopes as tracers

[J]. Hydrogeology Journal2006147):1171-1191.

[本文引用: 1]

CarreraJVázquez-SuñéECastilloOet al.

A methodology to compute mixing ratios with uncertain end‐members

[J].Water Resources Research20044012):3687-3696.

[本文引用: 1]

GülerCThyneG D.

Delineation of hydrochemical facies distribution in a regional groundwater system by means of fuzzy c‐means clustering

[J].Water Resources Research20044012):87.

[本文引用: 1]

LongA JValderJ F.

Multivariate analyses with end-member mixing to characterize groundwater flow:Wind Cave and associated aquifers

[J].Journal of Hydrology20114091/2):315-327.

[本文引用: 1]

刘杰刚徐新启时艳茹.

多元统计分析模型在矿井突水水源判别中的应用

[J].中国煤炭,2013392):101-104.

[本文引用: 1]

LiuJiegangXuXinqiShiYanruet al.

Application of multivariate statistical model to identification of water inrush source in coal mines

[J].China Coal2013392):101-104.

[本文引用: 1]

李克蓬马凤山张洪训.

海底金矿矿坑涌水水源判识及演化研究

[J].工程地质学报,2017251):180-189.

[本文引用: 1]

LiKepengMaFengshanZhangHongxunet al.

Recharge source identification and evolution of inflowing water in a seabed gold mine

[J].Journal of Engineering Geology2017251):180-189.

[本文引用: 1]

张好姚多喜鲁海峰.

主成分分析与Bayes判别法在突水水源判别中的应用

[J].煤田地质与勘探,2017455):87-93.

[本文引用: 1]

ZhangHaoYaoDuoxiLuHaifenget al.

Application of principal component analysis and Bayes discrimination approach in water source identification

[J].Journal of Coal Geology and Exploration2017455):87-93.

[本文引用: 1]

刘春平郑长城谭红军.

矿坑涌水量的地质分析与模拟——以三山岛金矿为例

[J].工程地质学报,199423):81-90.

[本文引用: 1]

LiuChunpingZhengChangchengTanHongjun.

The geological analysis and modeling of mining water flow—as an example of Sanshan island gold mine

[J].Journal of Engineering and Geology199423):81-90.

[本文引用: 1]

FristonK JFrithC DLiddleP Fet al.

Functional connectivity:The principal-component analysis of large (PET) data sets

[J]. Journal of Cerebral Blood Flow and Metabolism:Official Journal of the International Society of Cerebral Blood Flow and Metabolism1993131):5-14.

[本文引用: 1]

ShresthaSKazamaF.

Assessment of surface water quality using multivariate statistical techniques:A case study of the Fuji river basin,Japan

[J].Environmental Modelling and Software2007224):464-475.

[本文引用: 1]

SalifuAPetrusevskiBGhebremichaelKet al.

Multivariate statistical analysis for fluoride occurrence in groundwater in the Northern region of Ghana

[J].Journal of Contaminant Hydrology2012140/14134-44.

[本文引用: 1]

OttoM.

Multivariate methods

[M]//KellnerRMermetJ MOttoMet al.

Analytical Chemistry

.WeinheimWiley VCH1998.

[本文引用: 1]

向东进.

实用多元统计分析

[M].武汉中国地质大学出版社2005.

[本文引用: 1]

XiangDongjin.

Applied Multivariate Statistical Analysis

[M].WuhanChina University of Geosciences Press2009.

[本文引用: 1]

GuH YMaF SGuoJet al.

A spatial mixing model to assess groundwater aynamics affected by mining in a coastal fractured aquifer,China

[J].Mine Water and the Environment2018372):405-420.

[本文引用: 2]

/