本发明属于水质监测的,特别涉及岩溶湿地水体的水体光谱形态特性和水体弱光学活性参数的敏感光谱波段,基于偏最小二乘算法、xgboost、gboost、randomforest、catboost以及mdn算法,利用直接估算、间接估算以及辅助估算策略,将模型输入特征分为直接输入和间接输入两种模式,实现岩溶湿地水体弱光学活性水质参数的遥感估算。
背景技术:
1、根据《湿地分类》中国国家标准的定义(gb/t 24708-2009),喀斯特溶洞湿地即岩溶湿地,指某些水斑块由发育岩溶溶洞或管道的地下水补给,是零星的、不连续的、可变的。喀斯特溶洞湿地的特殊性包括通过地下水补给或与地下水有密切联系,而当地下水到达岩溶地表时,捕获二氧化碳形成碳酸(h2co3)会渗透到岩石中,导致岩溶含水层的孔隙和裂缝或裂缝结构,形成了复杂的水流系统。由于岩溶湿地具有地表水和地下水相互转化的高渗透性,来自地表的污染物很容易通过落水孔,并迅速地污染地下水。而岩溶湿地地区复杂的暗河和水文洞穴系统,使得污染物进入水体时更难控制和处理。
2、我国境内典型的岩溶湿地包括:云南的滇池、贵州的威宁草海以及桂林会仙喀斯特国际重要湿地(会仙湿地)等。近年来,由于人为和自然因素,这些湿地均遭受了不同程度的污染和破坏,流域内水环境问题日益凸显。为了响应国家湿地保护政策,构建可持续发展的自然环境,对岩溶湿地水环境研究迫在眉睫。其中,国内学者通过多种机器学习算法探究了滇池流域极端降水与水质变化的关系,利用实测水质参数与遥感影像数据实现了滇池水质的时空分布规律探究。威宁草海作为贵州高原上最大的天然淡水湖泊,何等人通过对比分析沉水植物内源磷释放通量和贡献率,探讨草海水生环境的生态修复情况。以往,对于桂林会仙喀斯特国际重要湿地的环境研究主要集中在生态敏感性、重金属污染评估等,近些年,也有研究通过多源遥感影像、以及深度学习实现了会仙湿地水质参数遥感估算,或是利用综合评价指数法和模糊综合评价法对会仙岩溶湿地的生态系统进行了健康评价。
3、根据以往研究结果,大多数旨在通过生态方法实现岩溶湿地水环境保护,或者利用遥感方法实现湿地水质参数遥感估算,且遥感估算方法大多依赖于构建多种算法模型实现。以往的研究,很少对岩溶水体与其他内陆水体(如一般河流、湖泊)进行对比分析。因而,岩溶水体与其他内陆水体的光谱特性差异尚不清晰,无法获取水质参数遥感反演的敏感特征,导致遥感估算模型的构建高度依赖于算法模型。同时,对于岩溶湿地的特殊水文特性,水体光谱与水质参数的响应关系仍需深入探究。
4、当前,水体弱光学活性水质参数浓度估算的方法,包括直接估算、间接估算。直接估算是指分析反射率与实测水质参数浓度之间的相关性,通过多元逐步回归等回归方法推导水质参数遥感算法。间接估算则是利用弱光学活性水质参数与其他具有光学活性的水质因子间的相关性,利用估算光学活性因子的波段特征,间接估算弱光学活性水质参数的浓度。但以上方法均难以解决复杂光学特性的水体,高度依赖于数据质量。机器学习算法可灵活处理复杂的非线性关系,被应用于水质参数估算,可以解决不具有光学活性因子与水体遥感反射率间关系复杂的问题,成为预测弱光学活性水质浓度的有效方法。基于此,亟需开发一种在传统间接估算基础上,结合机器学习、深度学习算法,为弱光活性水质参数估算的新方法。
技术实现思路
1、为了解决上述问题,本发明的首要目的在于提出一种基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,该方法能够快速、稳定和较高精度的定量分析岩溶湿地水体多尺度光谱形态,精准提取岩溶湿地水体水质参数的敏感光谱域,并利用高相关剔除和竞争自适应重加权算法(cars)选取最优光谱特征。
2、本发明的另一个目的在于提供一种基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,该方法通过量化岩溶湿地水体与其余水体的形态差异特征方法,评估岩溶湿地水体与其他水体光谱形态,厘清了岩溶湿地水体光谱特异性。
3、本发明的再一个目的在于提出一种基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,该方法利用岩溶湿地4种弱光学活性水质参数(nawqps)直接估算、间接估算以及辅助估算模型,并采用直接输入、光谱聚类输入两种模式对比分析四种弱光学活性水质参数的估算精度差异,并定量评估多种估算方法对岩溶湿地水体弱光学活性水质参数的反演精度。
4、为实现上述目的,本发明提供如下技术方案:
5、一种基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,该方法包括如下步骤:
6、步骤(1):实测水体光谱和多种水质参数的预处理;测量的水质参数包括tn、tp、nh3_n和do以及辅助参数chla、turb和ph;
7、步骤(2):岩溶湿地水体多尺度光谱形态特征提取;
8、步骤(3):岩溶湿地水体特征优选和数据降维;
9、步骤(4):岩溶湿地水体的光谱特性分析;
10、步骤(5):岩溶湿地弱光学活性水质参数敏感光谱域分析;
11、步骤(6):构建弱光学活性水质参数直接估算模型;
12、步骤(7):构建弱光学活性水质参数间接估算模型;
13、步骤(8):构建弱光学活性水质参数辅助估算模型;
14、步骤(9):评估岩溶湿地水体弱光学活性水质参数不同模型的反演精度;
15、所述步骤(2)中,所述多尺度光谱形态特征提取,为一种多尺度光谱特征提取(msfe)方法,包括:光谱形态特征提取(smf)、光谱形态差异特征提取(smdf)、水质参数敏感光谱特征提取(ssf)三个模块,如下式所示:
16、msfe=smf+smdf+ssf
17、其中,选取400~1000nm范围的asd实测的水体高光谱数据,以0.1阶为步长,分析更精细的光谱形态特征,作为光谱全局形态特征(gmf);全局形态特征(gmf)和局部形态特征(lmf)生成光谱形态特征(smf),如下式所示:
18、smf=gmf+lmf
19、lmf=lmf1+lmf2
20、
21、
22、式中,sf1和sf2分别表示筛选后相邻的两个光谱特征对应波长位置,rrs表示反射率值;
23、通过对比不同光谱的反射峰的位置、反射率值以及相邻反射峰间的峰值位置和反射率值变化规律,获取实测原位水体光谱的形态峰值差异(dspf),如下式所示:
24、smdf=dspf+dsprf
25、dspf=pw+pr
26、pw=peaki+peakj
27、
28、式中,dspf表示光谱形态峰值差异值,pw表示峰值位置的波长变化值,pr表示峰值位置的反射率变化值,i、j表示不同反射峰,i≠j>0,peak表示反射峰峰值位置,rrspeak表示反射峰峰值对应的反射率值;
29、同时,利用相关性分析获取岩溶湿地弱光学活性水质参数与光谱敏感域,提取敏感光谱特征(ssf),如下式所示:
30、wrrrs+nawqps→ssf
31、式中wrrrs值为反射率值,nawqps指非光学活性水质参数。
32、进一步,设计了光谱峰值范围形态差异值(dsprf),量化水体光谱反射峰波长范围及峰内反射率值变化速率,如下式所示:
33、dsprf=pwr+prr
34、pwr=wmax+wmin
35、
36、ρ=prr/pwr
37、式中,pwr为反射峰范围对应的波长范围,w表示波长(单位为nm),prr为反射峰范围对应的反射峰范围,rrs表示反射率值,ρ表示反射峰范围的反射率值变化率(单位为nm-1)。
38、所述步骤(3)中,岩溶湿地水体特征优选和数据降维是为了提高水质参数的估算精度,对获取的光谱形态特征、光谱敏感特征进行数据降维和特征优选。具体过程包括:首先,利用python中mcorr包对光谱形态特征与实测水质参数数据进行低相关剔除,筛除相关性小于0.2的光谱特征;其次,依次对筛选出的光谱特征进行高相关剔除,结合水体弱光学活性参数的敏感光谱特征,生成特征数据集;然后,再结合实测水质数据和逐步线性回归法,对特征数据集进行进一步筛选,最后,采用竞争自适应重加权算法(cars),重复50次cars选择过程,最终生成水体弱光学活性参数的最优特征数据集。
39、所述步骤(4)中,光谱特性分析是指定量分析400~1000nm范围内岩溶湿地水体光谱反射特性,对比岩溶湿地水体与典型内陆水体的光谱曲线,解析了岩溶湿地水体的光谱特性。具体地说,依据k-means聚类算法获取实测水体光谱数据间的相似性,将水样点光谱数据分为不同cluster,探究水体不同cluster内的弱光学活性水质参数分布规律;采用欧氏距离d,第i个对象和第j个对象的距离由具体公式计算,如下式所示:
40、
41、其中,rrsik是第i个水样点的第k个光谱反射率值,rrsjk是第j个水样点的第k个光谱反射率值。
42、进一步,为了扩大水样之间光谱形态的差异,并对测量到的水样光谱数据进行了形态归一化处理,得到了它们的形态归一化反射率(mnr),如下式所示:
43、
44、然后,使用k-均值聚类法将mnr分成三个光谱簇,进一步识别四种nawqps在不同水体cluster中的分布情况;同时,分析聚类分析的3类水体光谱的形态差异,对比cluster内及不同cluster间水样点光谱对应的水质参数浓度分布情况,获取不同cluster间水体光谱反射峰以及反射谷的光谱形态(prr、ρ)变化规律,评估不同水质参数对光谱形态影响效果。
45、所述步骤(5)中,岩溶湿地弱光学活性水质参数敏感光谱域分析中,将水质参数与fod光谱反射率值的相关系数(均值)最大值所对应的步长作为每种水质参数的最佳阶数,获取四种岩溶湿地非光学活性水质参数的最佳fod变化阶数,如下式所示:
46、
47、式中,值fod光谱对应的反射率值,odernawqps指非光学活性水质参数的最佳fod变化阶数。
48、所述步骤(6)中,构建弱光学活性水质参数直接估算模型,是利用四种弱光活性水质参数(tn、tp、nh3_n、do)与光谱间关系提取光谱特征,基于偏最小二乘算法(pls)、xgboost(xgb)、gboost(gb)、randomforest(rf)、catboost以及mdn算法,采用聚类输入、直接输入两种模式,构建了岩溶湿地弱光学活性水质参数直接反演模型,使用80%的样本进行训练,20%的样本进行验证,如下式所示:
49、
50、式中wrrrs表示光谱反射率,direct表示直接输入,cluster表示聚类输入。
51、所述步骤(7)中,构建弱光学活性水质参数间接估算模型是利用直接估算模型获取的最优估算模型得到强光学活性水质参数(chla、turb)的估算值,以ph作为辅助参数,依据弱光学活性水质参数(tn、tp、nh3_n、do)与的强光学活性水质参数经验验证关系,构建一元线性回归和多元线性回归方程,实现弱光学活性水质参数的间接估算,如下式:
52、awqps(ph)+wrrrs→model→estimationawqps(ph)
53、nawqps+estimationawqps(ph)→equation→estimationnawqps
54、式中,wrrrs表示光谱反射率,direct表示直接输入,cluster表示聚类输入,awpqs表示强光学活性水质参数。
55、所述步骤(8)中,构建弱光学活性水质参数辅助估算模型是引入三种与四种弱光学活性水质参数相关性较高的辅助水质参数(chla、turb、ph)作为模型输入特征,并设计直接输入和按cluster输入两种输入方式,构建了辅助估算模型,使用80%的样本进行训练,20%的样本进行验证,其公式如下:
56、
57、式中,wrrrx表示光谱反射率,direct表示直接输入,cluster表示聚类输入。
58、所述步骤(9)中,评估上三种岩溶湿地水体弱光学活性参数反演模型的估算精度,包括:12种直接估算的弱光学活性参数反演模型、4种间接估算的弱光学活性参数反演模型以及12种辅助估算的弱光学活性参数反演模型。获取最适用于估算岩溶湿地水体弱光学活性参数反演模型;使用决定系数(r2)和均方根误差(rmse)作为评价弱光学活性参数模型反演精度的标准,如下列公式所示:
59、
60、
61、其中,n是样本数,yi是水样i的实测水质参数浓度值,y′i是预测水质参数浓度值,是实测水质参数浓度平均值。
62、与现有技术相比,本发明有益效果是:
63、本发明能够定量分析岩溶湿地水体多尺度光谱形态,并与其他水体光谱形态进行对比分析,厘清了岩溶湿地水体光谱特异性,进一步提取四种弱光学活性水质参数遥感反演的敏感光谱特征。构建岩溶湿地4种弱光学活性水质参数(nawqps)估算模型,并对比分析四种弱光学活性水质参数的估算精度差异。
64、本发明基于实测的全谱段原位高光谱数据的预处理,提取岩溶湿地水体多尺度光谱形态特征生成高维数据集,对高维数据集进行特征优选和数据降维,并四种弱光学活性水质参数遥感反演的敏感光谱特征,为进一步评估不同水质反演算法(模型)的性能提供了参数。
65、同时,开发了一种联合反射峰形态分析和分数阶导数(fod)方法解析岩溶湿地水体光谱形态的特异性,探究岩溶湿地水体光谱与弱光学活性水质参数的光学响应关系,并利用多种典型内陆水体光谱数据,对比岩溶湿地水体光谱与其他水体的光谱差异,探究岩溶湿地水体光谱的特性。
66、最后,本发明提出了一种利用优选后的四种光谱的特征数据集,基于多种机器学习算法和深度学习算法构建四种岩溶湿地水体弱光学活性水质参数的反演模型,包括:直接反演、间接反演和辅助估算策略,并将模型输入特征分为直接输入和间接输入两种模式,定量评估三种估算方法对四种岩溶湿地水体弱光学活性水质参数的估算精度差异,为帮助指导岩溶湿地的保护和恢复工作提供依据。
1.一种基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,其特征在于包括如下步骤:
2.根据权利要求1所述的基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,其特征在于步骤(2)中,设计了光谱峰值范围形态差异值dsprf,量化水体光谱反射峰波长范围及峰内反射率值变化速率,如下式所示:
3.根据权利要求1所述的基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,其特征在于所述步骤(3)中,具体过程包括:首先,利用python中mcorr包对光谱形态特征与实测水质参数数据进行低相关剔除,筛除相关性小于0.2的光谱特征;其次,依次对筛选出的光谱特征进行高相关剔除,结合水体弱光学活性参数的敏感光谱特征,生成特征数据集;然后,再结合实测水质数据和逐步线性回归法,对特征数据集进行进一步筛选,最后,采用竞争自适应重加权算法(cars),重复50次cars选择过程,最终生成水体弱光学活性参数的最优特征数据集。
4.根据权利要求1所述的基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,其特征在于所述步骤(4)中,依据k-means聚类算法获取实测水体光谱数据间的相似性,将水样点光谱数据分为不同cluster,探究水体不同cluster内的弱光学活性水质参数分布规律;采用欧氏距离d,第i个对象和第j个对象的距离由具体公式计算,如下式所示:
5.根据权利要求4所述的基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,其特征在于所述步骤(4)中,对测量到的水样光谱数据进行了形态归一化处理,得到了它们的形态归一化反射率(mnr),如下式所示:
6.根据权利要求1所述的基于多尺度光谱形态特征的岩溶湿地水体弱光学活性参数反演方法,其特征在于