水质评价是目前水环境质量管理的重要支撑[1],目前河流水质评价方法较多,评价方法各有特色[2-3]。当对河流进行不同时空的监测数据量较大时,水质变化过程演变为多种污染指标构成的复杂系统,各因子之间具有不同程度的相关性[4-6]。主成分分析法的“降维”思维[7-9],可将多种变量简化,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则较低。主成分分析的适用条件为样本量必须达到一定条件以及各变量间必须有相关性。该方法可以直观地反映水质状况,对水质环境质量评价有很大的参考价值,使其成为一种水质综合评价方法。
平寨水库是黔中水利枢纽工程的水源区,直接入库河流水质对于保障水库水质安全至关重要[10]。本文以平寨水库张维河库区及上游河段为研究载体,通过主成分分析法分析张维河水质时空变化特征,充分考虑各个指标的关联性,结合研究区流域喀斯特地貌发育强烈的实际情况,将多指标简化为若干个彼此不相关的综合指标,确定重点污染河段及季节,得出不同污染形式及其主要污染物来源,并提出有效防治对策,为喀斯特山区地表水资源保护、生态恢复和可持续发展提供参考。
张维河位于贵州省毕节地区纳雍县张家湾镇(26°30′50″N—26°42′14″N,105°19′26″E—105°28′23″E)境内,属亚热带湿润型季风气候,四季分明,降水丰富。年均气温为11 ℃,年平均降水量为1300 mm,8月降水最丰富,无霜期240 d。利用纳雍县30 m精度DEM数据通过ArcGIS软件Spatial Analyst模块进行河网提取和流域划分(图1),得到张维河流域水系及流域范围。张维河流域主要位于张家湾镇境内,通过张家湾集镇,自北向南汇入平寨水库,是平寨水库的一条重要集水支流,其中游部分河段为地下河。
图1 张维河、平寨水库相对位置
Fig.1 Relative location of Zhangwei River and Pingzhai Reservoirs
根据张维河的流域特征,在研究区内选取8个采样点(图2),主要分布在上游河段和下游库区,其中ZW5—ZW8为地下河段。ZW1—ZW5为上游河段区域,ZW6—ZW8为下游水库区域。于2017年8月—2018年5月,分季度对张维河水进行采样,剔除未检测出最小值的指标,选取13项水质指标进行评价。样品采集后,总氮(TN)采用碱性过硫酸钾消解-紫外分光光度法(HJ 636—2012)检测,阴离子采用IS90型离子色谱仪(美国Dionex公司)测定,阳离子采用VBTA MPX型电感耦合等离子体—光发射光谱仪(美国Varian公司)测定,各采样点的溶解氧(DO)、电导率(EC)在采样现场使用Multi3430便携式多参数水质分析仪器(德国WTW公司)进行测定[10]。
图2 张维河水样采样点分布
Fig.2 Sampling point distribution map of Zhangwei River
本次试验所需数据共采集4次,通过对监测点水样2017年8月、11月、2018年1月、5月分季度的采集与实验,得到EC、DO、TN和10种阴、阳离子共13项指标的数据。各监测断面水质指标季节变化如图3所示:
图3 监测断面水质指标季节变化
Fig.3 Seasonal variation of water quality indicators on the monitoring sections
越往下游水库方向浓度越高,越往下游,浓度越低,其他指标浓度上游-下游各断面变化幅度较小,可初步判断上游(河段)水质优于下游(水库)。2)丰水期(8月),EC、Ca2+、K+、Mg2+、Sr2+上游浓度高于下游,枯水期(1月)下游浓度高于上游,DO流域空间变化与上述指标相反,上游上述指标的浓度与流域来水量存在一定的正相关性,污染物及水中元素主要来自降雨引起的地表径流。下游上述指标的浓度与流域来水量存在一定的负相关性,可能因为下游水库周边点源污染相对较多,枯水期水量较少造成指标浓度偏高。3)从全流域来看,浓度丰水期高于枯水期,说明上述指标主要通过地表径流进入河水。浓度枯水期高于丰水期,主要来自点源污染的固定排污。在ZW5号断面出现明显下降,DO在ZW5号断面出现明显上升,可能由于ZW4、ZW5之间有一条清澈支流汇入,且ZW5号断面为地下暗河的起点,水体向暗河流动时由于河道狭窄扩散较慢,水量的增加使指标浓度出现下降,DO浓度上升。
由此可知,张维河流域水质的影响因子是多方面的,影响状况也十分复杂。由于研究涉及的水质指标数据较多,分析张维河流域的水质状况,可将数据进行降维处理,用较少的变量解释原始数据中的大部分变异[8]。因此,通过主成分分析法对水质时空变化规律做出解释是一种可行的办法。
将初选因子在SPSS软件中进行KMO检验和巴莱特球形度检验(表1),以判断主成分分析是否能合理解释初选因子的变化规律[11-15]。表中KMO检验结果>0.6,Bartlett检验中的显著性<0.05,说明初选因子适合进行主成分分析。
表1 KMO和Bartlett检验结果
Table 1 KMO and Bartlett test results
KMO检验结果Bartlett检验近似卡方显著性(Sig)0.658380.2300.000
3.1.1 原始数据标准化处理
不同水质指标评价标准不同,使用原数据进行比较不能准确反映各指标的污染程度,为消除量纲影响,应使用标准化处理后的数据进行分析[14-16]。SPSS软件的“分析-描述统计-描述”菜单可对数据进行Z-score标准化处理,标准化数据的量代表该数据与原始数据平均值的离散程度,若该数据的值>数据平均值,则标准化数据为正,反之为负。
3.1.2 主成分的确定
在SPSS中单击“分析-降维-因子分析”命令,将数据进行主成分分析,得到降维后各主成分的特征值、方差贡献率及累积方差(表2)。根据特征值>1的原则[17],提取4个主成分,其累积的方差贡献率为85.904%,表明这4个主成分反映了原始变量提供的85.904%的信息,符合主成分分析的基本要求。
表2 特征值及方差贡献率
Table 2 Eigenvalue and contribution rates of primary fators
主成分初始特征值特征值方差贡献率/%累积/%14.92837.91137.91123.14324.18062.09131.74214.39976.49041.0949.41485.904
表3为旋转后的因子载荷矩阵。可知:在第1主成分上有较大载荷的变量是Cl-、K+和F-。Ca2+、EC和在第2主成分有较大载荷,可能因为流域位于喀斯特地区,反映了流域的地质状况。Na+在第3主成分有较大载荷。在第4主成分有较大载荷,可能与张维河沿岸工业排放物的流入有关。
表3 旋转后的因子载荷矩阵
Table 3 The rotated factor loading matrix
变量得分系数主成分1主成分2主成分3主成分4Cl-0.9240.073-0.228-0.042K+0.8870.3610.1250.055F-0.8850.160-0.102-0.187Mg2+0.5350.5010.5020.386Ca2+0.1060.927-0.0760.063EC0.2660.8260.3420.056HCO-3-0.0220.7080.101-0.560Sr2+0.4420.645-0.3660.275DO0.2310.6130.210-0.311Na+0.3590.1130.8580.061NO-30.3200.102-0.842-0.163TN0.278-0.218-0.715-0.108SO2-4-0.127-0.0010.3860.866
3.1.3 主成分得分
计算各采样点4个主成分得分F1、F2、F3和F4,并以4个主成分的贡献度为权重计算出综合主成分得分F。各采样点的各主成分得分和综合主成分得分及排序具体见表4。
各主成分得分计算公式为:
(1)
其中:
(2)
式中:f为成分矩阵中的相关系数;t为成分特征值。xi为相应指标的标准化数据。主成分综合得分公式为:
表4 各采样点水质状况综合评价
Table 4 Comprehensive evaluation result of water quality for each sampling point
采样点F1F2F3F4F排序ZW1-5.837-5.1850.385-1.518-4.2228ZW2-5.816-4.5280.323-2.014-4.0836ZW3-5.649-5.1350.311-1.849-4.1687ZW43.894-6.9422.1953.6630.4764ZW5-1.7850.740-3.8315.371-0.6665ZW66.1957.8550.808-1.3435.0571ZW74.7077.057-0.120-0.9474.0462ZW84.2916.138-0.071-1.3633.5603
F=[λ1/(λ1+λ2+λ3+λ4)]F1+…+
[λ4/(λ1+λ2+λ3+λ4)]F4
(3)
式中:λ为主成分的特征值[12]。综合主成分得分可反映张维河各采样点的水质状况。
由以上的主成分计算方法,再分别以季节和河段为出发点计算主成分得分,分析张维河水质状况的时空变化。
主成分分析中,样本的综合得分越高,其指标的方差贡献率越大,样本对整体数据的影响力越大。在水质评价中,综合得分越高,说明样品中污染物及水中元素的含量越高,水质越差[18-20]。由表4可看出:各采样点综合得分排序为:ZW6>ZW7>ZW8>ZW4>ZW5>ZW2>ZW3>ZW1。其中,ZW6、ZW7、ZW8号采样点位于下游水库,ZW1、ZW2、ZW3号采样点位于上游河段,说明上游河段水质优于下游库区。主要由于河流上游-下游比降达到200 m,河流流速较快,河水自净能力差,经历了污染物累计的过程,且上游采样点位于河流源头附近、张家湾镇上游,受人类活动影响较小,下游采样点水体流经张家湾镇以及冶炼、采矿密集区域,周边农田广布,同时受到生活污水、工业、农业的影响,水质较差。
以季节为出发点,对4次采样数据独立进行综合得分计算(表5),综合得分排序为:春季>冬季>夏季>秋季。说明枯水期水质状况比丰水期差。由此可知,流域内主要污染形式为点源污染,流域内污染物入河量较为稳定,枯水期由于水量较少,污染物稀释度差,引起水质恶化。春季采样数据综合得分高于冬季,可能由于春季采样时流域内有1次强降雨过程,污染物随地表径流进入河流,引起非点源污染,造成水质恶化。为此,对春季雨后ZW1号点进行了采样(表6),通过对比,发现NH3-N、TP和悬浮物在雨后都出现了明显上升,在一定程度上解释了春季水质比冬季差的原因。秋季采样数据综合得分低于夏季,可能由于降水类型不同所致。贵州高原山区降水主要集中在夏秋季,但秋季降水主要以锋面雨为主,持续时间长,降水强度小但降雨量较大,夏季降水以短时高强度的对流雨为主,会将地表土壤中氮磷等营养物质冲刷进水体。丰水期水质好于枯水期,说明水量变化是影响流域水质的主要因素。但枯水期内冬季水质好于春季,丰水期内秋季水质好于夏季,由于春夏季多雷雨,说明降雨类型变化是影响流域水质变化的次要因素。
表5 水质季节综合评价
Table 5 Comprehensive evaluation result of seasonal water quality
采样点F1F2F3F4F排序春-0.7755.26010.4270.0102.8314夏-0.8400.2925.0096.2971.1362秋-11.9320.672-6.8960.048-6.2941冬13.548-6.224-8.539-6.3552.3273
表6 春季ZW1雨前、雨后水质对比
Table 6 Comparison of water quality in ZW1 before and after rainfall mg/L
变量ρ(COD)ρ(SS)ρ(NH3-N)ρ(TP)ρ(TN)ZW1(雨前)24.2410.0540.0152.34ZW1(雨后)19.2760.3140.0272.24
以不同河段季节变化为出发点,分别计算河段、水库4次采样数据的综合得分(表7),河段部分综合得分排序为:夏季>春季>冬季>秋季。由于综合得分均为负数,说明河段全年水质较好。丰水期水质比枯水期稍差,说明河段水体污染物及水中元素主要来自地表径流。对河段水质数据进行主成分分析,参考旋转后成分矩阵(表8),与第1主成分有较大关联的指标为Ca2+、Sr2+、EC、Mg2+,为影响河段水体的主要水质指标,这些指标与喀斯特地区基岩有关,如石灰岩(CaCO3)、白云岩[CaMg(CO3)2]、天青石(SrSO4)、石膏(CaSO4),可将该主成分称为地质背景指数。丰水期河水温度高、水量大,水中CO2含量高,对基岩的溶蚀作用强烈,而水中所含元素主要来自基岩,指标浓度与流域来水量存在正相关性。
表7 不同季节的河段、水库水质综合评价
Table 7 Comprehensive evaluation of water quality of river sections and reservoirs in different seasons
变量得分变量得分河段(春)-2.687库区(春)5.487河段(夏)-0.787库区(夏)1.045河段(秋)-5.141库区(秋)0.137河段(冬)-3.859库区(冬)5.995
水库部分综合得分排序为:冬季>春季>夏季>秋季。四季综合得分均较高,说明库区水质状况相对较差,枯水期水质状况比丰水期差。参考水库数据旋转后成分矩阵(表8),与第1主成分有较大关联的指标为这些指标主要来自工矿废水以及农田化肥流失,可将该主成分称为人为影响指数。水库周边以及中游河段人类活动密集,上述水质指标的入河量较为稳定,枯水期水量小,稀释度差,因此水质指标浓度较高,与流域来水量存在负相关性。
表8 旋转后的因子载荷矩阵
Table 8 The rotated factor loading matrix
变量河段F1河段F2河段F3库区F1库区F2EC0.9220.0960.3420.0920.953Mg2+0.8880.2340.344-0.3410.920Sr2+0.8660.3920.2290.4450.856K+0.851-0.034-0.0070.8160.553Ca2+0.784-0.361-0.058-0.0640.979TN0.0200.900-0.270-0.9660.063F-0.290-0.7230.0880.864-0.400Cl-0.5810.714-0.3090.987-0.060DO0.3410.680-0.3570.9650.249SO2-40.6050.666-0.2820.8910.144HCO-30.163-0.2090.9440.6720.703NO-3-0.0180.546-0.7800.9140.386Na+0.548-0.3310.764-0.369-0.448
1)本文利用主成分分析法将张维河8个采样点的13个水质指标综合为4个主成分,解释了85.904%的原始变量。结果表明:张维河水质时空差异较大,空间上上游河段水质好于下游水库,丰水期水质好于枯水期,说明点源污染对流域水质影响较大。流域内污染情况比较复杂,不同河段不同季节呈现出不同的水质变化规律,是多种污染源共同作用的结果。
2)主成分分析能够较好地反映水质系统非线性变化过程,但其结果只是展示数据间的相互变化程度而非污染状况。因此在进行主成分分析时,应结合水环境质量标准对结果进行佐证,多种评价方法相辅相成,使水质变化和水质标准互为补充,评价结果更为完善。
3)由于喀斯特地区生态环境的特殊性,导致了喀斯特地区地表水硬度较高,故加入Ca2+作为评价指标。此外,喀斯特地区经济普遍欠发达,农户养殖、生活排水设施不完善,建议后续相关研究应加入粪大肠菌群作为检测指标,使评价结果更准确。
[1] 夏凡,胡圣,龚治娟,等.不同水质评价方法的应用比较研究:以丹江口水库入库河流为例[J].人民长江,2017,48(17):11-15.
[2] 杜泽兵,阳文静,向丽雄,等.湖泊水质影响因素研究综述[J].环境污染与防治,2017,39(3):120.
[3] 魏乐,裴国霞,郭琦,等.不同水质评价方法在金海水库的应用[J].湖北农业科学,2016,55(8):1974-1978.
[4] Hilary S Green,Xueqi Li,Mauro De Pra, et al. A rapid method for the detection of extra virgin olive oil adulteration using UHPLC-CAD profiling of triacylglycerols and PCA[J]. Food Control,2020,107.
[5] 徐光宇,柴国平,徐明德,等.主成分分析法在汾河太原城区段水质评价中的应用[J].环境工程,2014,32(6):122-124.
[6] 陆文,李北涛,郭治远,等.基于主成分分析的生活垃圾组分模型研究[J].环境工程,2013,31(6):100-103.
[7] 周忠发.基于GIS的喀斯特地区农村土地适宜性评价:以贵州省仁怀市为例[J].贵州师范大学学报(自然科学版),2006, 24(3):17-19.
[8] Mohammad Jafarzadegan,Faramarz Safi-Esfahani,Zahra Beheshti. Combining hierarchical clustering approaches using the PCA method[J]. Expert Systems With Applications,2019,137.
[9] David Rebollo Monedero,Ahmad Mohamad Mezher,Xavier Casanova Colomé, et al. Efficient k-anonymous microaggregation of multivariate numerical data via principal component analysis[J]. Information Sciences,2019,503.
[10] 曹明达,周忠发,潘艳喜,等.喀斯特洞穴滴水水文化学过程的时空变化及其环境指示:以贵州织金洞为例[J].水土保持研究, 2017,24(3):339-346.
[11] Zheng Fan, Ling Yalan, Tang Yuqing, et al. A fidelity-restricted distributed principal component analysis compression algorithm for non-cable seismographs[J]. Journal of Applied Geophysics,2019,169.
[12] Zhang Zhenhua, Hu Chuangye, Zhang Yifei, et al. The combined application of principal component analysis and decision tree in nuclear pulse shape discrimination[J]. Nuclear Inst. and Methods in Physics Research, A,2019,943.
[13] Stefano Ferrari Interlenghi,José Luiz de Medeiros,Ofélia de Queiroz Fernandes Araújo. A lifecycle sustainability assessment of CO2 emissions, energy consumption and social aspects of methylic and ethylic biodiesel using principal component analysis[J]. Materials Science Forum,2019,4919.
[14] 张宜松,曹国良,张萌. 基于主成分分析法的陕北地区可持续发展对比研究[J].环境工程,2017,35(5):136-140.
[15] 汪天祥,许士国,韩成伟.改进主成分分析法在南淝河水质评价中的应用[J].水电能源科学,2012,30(10):33-36.
[16] 李静,沈梦兰,王彦伟,等. 基于主成分分析法的巴彦浩特镇饮用水水源地水质评价[J].环境与发展,2018(10):125-134.
[17] 葛丽颖,王海鹤,傅成诚,等.基于主成分分析的红枫湖水质分析评价[J].环保科技,2018,24(3):21-26.
[18] 冉桂花,葛继稳,苗文杰,等.三峡库区古夫河水质时空分异特征[J].生态学报,2013,33(17):5385-5396.
[19] 龚清莲,刘颖,汤冰冰.长江宜宾段水质时空分布特性分析[J].环境科学与技术,2016,39(3):111-116.
[20] 李秋娟,李仰征,王芳,等.七星关区倒天河不同河段冬季水质污染状况及原因分析[J].贵州师范大学学报(自然科学版),2014,32(5):38-41.