基于主成分分析的spearman秩相关系数法在长江干流水质分析中的应用*

杨 盼1,2 卢 路1 王继保2 陈和春2

(1.长江水资源保护科学研究所,武汉 430051; 2.三峡大学 水利与环境学院,湖北 宜昌 443000)

摘要:基于长江干流宜宾、寸滩、宜昌、汉口、大通和上海(古洞口)6个断面2005—2016年的高锰酸盐指数、五日生化需氧量、氨氮和总磷4项指标的监测数据,采用主成分分析法提取所有主成分,计算得到包含所有水质指标信息的综合得分值,再通过spearman秩相关系数法分析主成分综合得分值的变化趋势。结果表明:长江干流上游水质优于中下游,上游水质呈变好的趋势,中下游水质表现出不断恶化的趋势。

关键词:主成分分析法;spearman秩相关系数法;水质评价;长江干流

0 引 言

长江流经我国11个省市,是我国最重要的河流之一。多年来,依托长江充沛的水资源,长江沿线城市经济高速持续发展,形成了沿江城市经济带[1-4]。在过去长江经济带经济的高速发展过程中,忽略了对环境的保护,导致长江干流的水质有变差趋势[5-8]。长江是沿江众多城市的取水水源地,长江干流水质恶化将影响长江沿线主要城市的正常用水,并制约长江经济带经济的发展。因此,研究近年长江干流水质的变化情况及当前长江干流水质状况,判定当前水质情况及变化,对提出应对策略、保障长江干流水质安全具有重要意义。

水质评价的本质是根据水质的一些指标值,通过建立数学模型,对水环境质量的好坏进行定性或定量地描述水质现状[9-13]。其中,代表性方法有主成分分析法、神经网络法、质量指数法等[14-20]。本文结合主成分分析法和spearman秩相关系数法对长江干流的水质进行了现状和趋势变化分析。由于获取的水质指标相对较少,本文摒弃了主成分分析法能够提取少量综合因子,简化计算的优势[21-23],主要利用主成分分析法综合水质指标信息,定量评价水质实际状态的特性。虽然提取所有主成分加大了计算量,但也保全了所有的水质指标信息。结合在水质趋势分析中广泛运用的spearman秩相关系数法,可有效判别时间序列数据趋势变化的显著性,对主成分综合得分值进行了再分析,指出当前长江干流污染变化情况并预测长江干流的水质变化趋势,以期为长江干流水质管理提供依据。

1 分析方法

1 .1 主成分分析法

Puckett等在1992年首次运用主成分分析法对美国弗吉尼亚州的部分河流水质进行了评价,这是主成分分析法在水质评价中的第一次应用。主成分分析法的基本原理是以降维的思想,通过正交变换,将多个分量相关的原随机变量转换成少数几个分量不相关的新变量。其主要计算步骤如下[24-25]:1)将原始数据标准化,转化为无量纲数据;2)计算标准化数据的相关系数矩阵,以及相关系数矩阵的特征根和特征向量;3)根据各特征根占比,按从大到小排序,选取累积占比>85%的前几项特征根作为主成分;4)特征向量除以对应特征根的绝对值,构成主成分系数矩阵;5)主成分系数矩阵与标准化数据相乘,得到各项主成分得分值;6)各项主成分得分值与对应主成分在所有主成分中的比值相乘后累加,即得到主成分综合得分值。

1.2 spearman秩相关系数法

秩相关系数法又称等级相关系数法,是衡量时间序列变化趋势在统计上有无显著性的常用方法,其原理是将两因子的样本值从小到大按顺序排列位次,以各因子样本值的位次代替实际数据加以计算[26-28]。秩相关系数计算公式见式(1):

(1)

di=Xi-Yi

(2)

式中:di为变量XiYi的差值;Xi为周期1~N按浓度值从小到大排列的序号;Yi为按时间排列的序号;N为年份。

将秩相关系数rs的绝对值与spearman秩相关系数统计表中的临界值Wp进行比较,如果|rs|>Wp,则表明变化趋势有显著意义;如果rs为正值,则表明数据序列具有上升趋势;如果rs为负值,则表明数据序列具有下降趋势。

2 长江干流水质评价与分析

本文在长江干流上选取宜宾、重庆寸滩、宜昌、汉口、大通和上海石洞口6个监测断面,通过这6个断面水质状况来概括长江干流整体的水质现状。其中,宜宾和寸滩位于长江上游,可反映长江上游水体的水质特征;宜昌位于长江上游和中游的结合处,完整控制长江上游100.6万km2的广大地区,反映上游水体进入中游时的最终状态;汉口则是长江中游的主要控制断面,控制流域面积为148.8万km2,水质体现长江中游的水体特征;大通地处长江下游,是长江干流的总控制断面,控制流域面积为170.5万km2[29];上海(古洞口)临近河口,反映入海前水体中的氮、磷浓度。分析数据采用上述6个断面2005—2016年的高锰酸盐指数(CODMn)、五日生化需氧量(BOD5)、氨氮(NH3-N)和总磷(TP)4个指标每月检测值,以下分析均采用年均值。各监测断面位置见图1。

图1 监测站点示意
Fig.1 Schematic diagram of the monitoring sites

2.1 主成分分析结果

主成分分析法计算结果见表1,对比单因子评价结果(见表2)可知,长江干流6个断面的水质评价结果在Ⅱ~Ⅲ类波动,各断面的水质评价结果12年来无变化,无法体现水质的动态变化过程。但各断面的主成分综合得分值存在变化。可见,长江干流的水质存在一定的变化规律,而单因子评价方法通过最差水质指标评级掩盖了其他水质指标的信息。主成分综合得分值综合了所有水质指标的信息,形成了代表4项指标的无量纲新指标,体现了水质的整体信息。从主成分综合得分值的数值特征(图2和图3)来看,长江干流的水质从上游到下游存在变差的趋势,上游断面的得分值均为负数,水质较好;中下游断面的得分值均>0,水质较差。其中,宜昌断面的水质最好,得分值为-0.54,上海(古洞口)断面的水质最差,得分值为0.45,二者相差0.99。各断面得分值12年来的变幅也从上游到下游存在增大的趋势,宜昌断面水质最稳定,上海(古洞口)断面水质波动较大。其中,宜宾和寸滩断面的水质波动可能是由于水质较好,易受外来污染影响。

表1 2005—2016年各断面水质的主成分得分值
Table 1 Principal component scores for water quality in each section from 2005 to 2016

监测断面2005年2006年2007年2008年2009年2010年2011年2012年2013年2014年2015年2016年宜宾0.63 -0.32 -0.53 -0.26 -0.85 0.40 -0.36 0.81 -0.86 -0.72 -0.84 -0.47 寸滩0.95 0.23 -0.32 1.24 -0.36 -0.88 0.33 0.86 -0.40 -0.21 -0.66 -1.18 宜昌0.28 -0.35 -0.33 -0.76 -0.19 -0.27 -0.36 -0.86 -0.73 -1.05 -0.73 -1.15 汉口0.33 -0.03 0.59 -0.02 0.39 -0.85 1.18 0.15 -0.38 -0.22 0.63 0.95 大通-1.08 -0.61 -0.35 -0.36 -0.02 1.17 -0.57 0.23 1.03 0.92 0.71 1.11 上海(古洞口)-1.11 1.08 0.93 0.17 1.02 0.43 -0.22 -1.19 1.34 1.29 0.90 0.73

表2 2005—2016年各断面水质单因子评价结果
Table 2 Single factor evaluation results of water quality in each section from 2005 to 2016

监测断面2005年2006年2007年2008年2009年2010年2011年2012年2013年2014年2015年2016年总体评价宜宾ⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡ寸滩ⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢ宜昌ⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡ汉口ⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢ大通ⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡⅡ上海(古洞口)ⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢⅢ

图2 各断面主成分综合得分值均值
Fig.2 Mean value of main component composite scores in each section

图3 各断面主成分综合得分值变幅
Fig. 3 Variations of main component scores in each section

2.2 长江干流水质趋势变化分析

采用spearman秩相关系数法对长江干流6个断面12年的主成分综合得分值进行再分析,计算结果见图4。可知:上游断面宜宾、寸滩和宜昌3处的主成分综合得分表现出波动减小的趋势,相对于2005年,宜宾、寸滩和宜昌3个断面的主成分综合得分值分别减少了1.1、2.13和1.43,说明水质在变好,其中寸滩断面的趋势最明显。宜宾断面的得分值在2010年和2012年集中出现2个波峰,最大值为2012年得分值0.81,最小值出现在2013年,为-0.86,说明宜宾断面在2010年和2012年有大量外来污染排入,但由于水质状况较好,自净能力较强,水质在2013年得到迅速好转;寸滩断面存在相似的情况,在2008年和2012年出现较大的波峰,最大值为2008年得分值1.24,之后水质状况迅速好转,一直到2016年水质持续变好;宜昌断面水质较为稳定,12年来水质一直持续变好;下游断面汉口、大通和上海(古洞口)3处的主成分综合得分值存在增大趋势,相对于2005年,汉口、大通和上海(古洞口)3个断面的主成分综合得分值分别增加了0.63、2.19和1.84,说明水质在不断恶化,其中大通断面最明显。汉口断面的得分值在2010年达到最小值-0.85,之后在2011年达到最大值1.18,说明汉口断面在2011年可能发生过较为严重的水质污染;大通断面的水质仅在2010—2011年出现较大波动,但一直呈现持续恶化的趋势;上海(古洞口)断面的得分值在2012年最低,为-1.19,其他年间得分值均较高,说明上海(古洞口)断面的水质在2009—2012年间可能得到了有效治理。

图4 各断面主成分综合得分值变化曲线
Fig.4 Variation of main component composite scores of each section

各断面的主成分综合得分值趋势变化显著性结果表明(表3):长江干流上游断面宜宾、寸滩和宜昌得分值呈减小趋势,其中,宜宾断面无显著意义,寸滩断面在置信水平95%时具有显著意义,宜昌断面在置信水平99%时具有显著意义;下游断面汉口、大通和上海(古洞口)得分值呈增大趋势,其中,仅大通断面在置信水平99%时具有显著意义。说明寸滩和宜昌断面水质变好的趋势明显,大通断面水质恶化趋势显著,其他断面有相应的变化趋势,但相对较微弱。

表3 各断面主成分综合得分值变化趋势显著性检验表
Table 3 Significance test table for the change trend of the main component comprehensive scores of each section

监测断面Nwp(单侧检验)rs值0.050.01趋势显著性宜宾12-0.420.5320.661下降无显著意义寸滩12-0.580.5320.661下降有显著意义(0.05)宜昌12-0.7430.5320.661下降有显著意义(0.01)汉口120.1610.5320.661上升无显著意义大通120.7550.5320.661上升有显著意义(0.01)上海(古洞口)120.1820.5320.661上升无显著意义

3 结 论

本文采用主成分分析法对长江干流2005—2016年水质进行了分析,在此分析结果的基础上采用spearman秩相关系数法对综合得分值进行了再分析,研究结果表明:1)长江干流水质呈现上游水质优于中下游水质的空间分布;2)寸滩和宜昌断面水质有明显好转趋势,大通断面水质存在变差趋势;3)长江干流的水质呈现出2种相反的两极分化表现,其中,上游水质较好,呈不断变好的趋势;而中下游断面水质较差,有变差的趋势;4)长江干流上游水体环境净化能力较强,在没有外来污染的情况下,水质状况能迅速恢复,中下游水质的好转可能更需要人为治理。研究结果表明,通过主成分分析法提取所有主成分,计算综合得分值,再通过分析得分值的变化规律可得出水质变化趋势,这种分析模式可为我国探究河流水质的变化趋势提供新思路。

参考文献

[1] 李长安, 殷鸿福, 俞立中, 等. 流域环境系统演化概念模型:山-河-湖-海互动及对全球变化的敏感响应——以长江为例[J]. 长江流域资源与环境, 2000,9(3):358-363.

[2] 陈辉, 施能, 王永波. 长江中下游气候的长期变化及基本态特征[J]. 气象科学, 2001,21(1):44-53.

[3] 尹炜. 长江经济带水生态环境保护现状与对策研究[J]. 三峡生态环境监测, 2018,3(3):2-7.

[4] 辛小康, 贾海燕. 长江流域水资源保护现状分析与关键技术研究展望[J]. 三峡生态环境监测, 2018,3(2):13-20.

[5] 续衍雪, 吴熙, 路瑞, 等. 长江经济带总磷污染状况与对策建议[J]. 中国环境管理, 2018,10(1):70-74.

[6] 王小焕, 邵景安, 王金亮, 等. 三峡库区长江干流入出库水质评价及其变化趋势[J]. 环境科学学报, 2017,37(2):554-565.

[7] 姚瑞华, 王东, 孙宏亮, 等. 长江流域水问题基本态势与防控策略[J]. 环境保护, 2017,45(19):46-48.

[8] 王方清. 保护优先 全面推进流域水资源保护[N]. 人民长江报, 2016-04-02.

[9] 王维, 纪枚, 苏亚楠. 水质评价研究进展及水质评价方法综述[J]. 图书情报导刊, 2012,22(13):129-131.

[10] 吴佳宁, 陈明, 袁润权, 等. 河流水质评价综述[J]. 广东水利水电, 2017(2):1-5.

[11] 李慧. 黑河流域水质评价及变化趋势分析[D]. 兰州:兰州理工大学, 2014.

[12] 陈荣. 东江湖流域水质变化趋势分析与水质评价[D]. 长沙:中南林业科技大学, 2016.

[13] 李斯婷. 地表水质评价方法的研究:以流溪河为例[D]. 广州:华南理工大学, 2013.

[14] 孙玲玲, 刘彬, 石宝红, 等. 基于贝叶斯理论和主成分分析法耦合的水质评价[J]. 水电能源科学, 2017,35(11):36-39.

[15] 杨磊磊, 卢文喜, 黄鹤, 等. 改进内梅罗污染指数法和模糊综合法在水质评价中的应用[J]. 水电能源科学, 2012,30(6):41-44.

[16] 向文英, 杨静, 张雪. 模糊综合评价法的改进及其在水库水质评价中的应用[J]. 安全与环境学报, 2015,15(6):344-348.

[17] 石丽莉, 秦春燕. PSO-RBF耦合神经网络在水质评价中的应用[J]. 安全与环境学报, 2018,18(1):353-356.

[18] 于淼, 王启山, 张旋, 等. 基于指标权重的综合水质标识指数法的应用[J]. 安全与环境学报, 2010,10(4):55-58.

[19] 童英伟, 刘志斌, 常欢. 集对分析法在河流水质评价中的应用[J]. 安全与环境学报, 2008,8(6):84-86.

[20] 王颖, 邵磊, 杨方廷, 等. 改进的集对分析水质综合评价方法[J]. 水力发电学报, 2012,31(3):99-106.

[21] 钱程, 穆文平, 王康, 等. 基于主成分分析的地下水水质模糊综合评价[J]. 水电能源科学, 2016,34(11):31-35.

[22] 汪天祥, 许士国, 韩成伟. 改进主成分分析法在南淝河水质评价中的应用[J]. 水电能源科学, 2012,30(10):33-36.

[23] 尹炜, 辛小康, 梁建奎, 等. 基于主成分分析的丹江口水库支流水质评价[J]. 水电能源科学, 2015,33(1):34-38.

[24] 吉祝美, 方里, 张俊, 等. 主成分分析法在SPSS软件中的操作及在河流水质评价中的应用[J]. 环保科技, 2012,18(4):38-43.

[25] 张海平, 郝彩侠, 郝敏霞, 等. 主成分分析法在河流水质评价中的应用[J]. 河北建筑工程学院学报, 2015,33(3):52-55, 60.

[26] 刘晓清, 于学峰, 黄艳燕, 等. 秩相关系数法评价渭南市1985—2003年生态安全变化趋势[J]. 安徽农业科学, 2010,38(29):16341-16342.

[27] 琚会艳, 李琳. 黄河小浪底水库营养化状况分析评价[J]. 环境与发展, 2017,29(5):170-171.

[28] 蔡敏, 王莹, 金安, 等. 2013—2015年十堰市环境空气质量变化趋势分析研究[J]. 环境科学与管理, 2016,41(12):130-136.

[29] 武旭同, 王腊春, 李娜. 近60 a来长江干流输沙量变化及原因分析[J]. 长江流域资源与环境, 2018,27(1):116-124.

ANALYSIS OF WATER QUALITY TREND IN THE MAIN STREAM OF THE YANGTZE RIVER BASED ON PRINCIPAL COMPONENT ANALYSIS

YANG Pan1,2, LU Lu1, WANG Ji-bao2, CHEN He-chun2

(1.Yangtze River Water Resources Protection Institute of Science,Wuhan 430051,China; 2. College of Water Resources and Environment, Three Gorges University,Yichang 443000,China)

Abstract: Based on the monitoring data of the four indicators of permanganate index, BOD5, ammonia nitrogen and total phosphorus (TP) in six sections of Yibin, Cuntan, Yichang, Hankou, Datong and Shanghai (Gudongkou) in the mainstream of the Yangtze River from 2005 to 2016. The principal component analysis method was used to extract all the principal components, and the comprehensive score value including all the water quality indexes information was calculated. The spearman rank correlation coefficient method was used to analyze the change trend of the main component composites score value. The results showed that the upstream water quality of the mainstream of the Yangtze River was better than that of the middle and lower reaches. The water quality showed a improving trend in the upper reaches, but a deteriorating trend in the middle and lower reaches.

Keywords: principal component analysis; Spearman rank correlation coefficient method; water quality evaluation; mainstream of the Yangtze River

DOI:10.13205/j.hjgc.201908014

*国家重点研发计划:江湖关系胁迫条件下两湖水生态环境效应及适应性调控(2017YFC0405303);中科院重点部署项目长江中下游物质通量演变态势及水生态安全保障总体战略(ZDRWZS201735)。

收稿日期:2018-09-26

第一作者:杨盼,男,硕士研究生,主要从事水环境数值模拟研究。1024468461@qq.com

通信作者:卢路,男,高级工程师,主要从事水文与水资源工程。253625263@qq.com