本发明涉及水利水电工程生态环境保护,具体是一种鱼类产卵行为与生态水文指标响应关系量化方法。
背景技术:
1、近年来,随着对水资源需求的增加,水利水电工程的建设也在不断增加,截至2020年,全球已建成坝高超过15米的大坝58000余座,相当于每年流入海洋的河流总水量的六分之一。水文情势改变是引起河流生态系统改变的主要驱动力,水利水电工程建设运行不可避免改变了河流水文情势,鱼类繁殖季节洪峰过程坦化,将减弱产漂流性卵鱼类繁殖所需的涨水水流刺激,进而影响鱼类自然繁殖。
2、因此,从众多生态水文指标中识别出关键指标,建立鱼类产卵行为与水文指标响应关系,并量化相应指标阈值,是开展生态调度人为营造洪水过程的重要基础。当前已存在一些方法用于分析鱼类产卵行为与生态水文指标相关性的方法,筛选代表性水文指标并量化了相关阈值作为水库生态调度的参考依据。如相关分析法、系统重构法、冗余分析方法等。
3、现有方法存在如下不足:
4、(1)当前存在的方法多关注生态水文指标是否可以有效刺激鱼类产卵,即把生态水文指标与鱼类行为的响应问题概化为“是、否”刺激产卵的“二分类”问题。没有进一步辨识出低效、高效刺激鱼类产卵的生态水文指标及其阈值。
5、(2)当前存在方法结果形式较为复杂,不直观,对结果的解读存在困难,且不能直观的展示结果生成的过程,不利于分析。
6、(3)当前存在方法,多对数据分布具有一定要求,需要对数据进行预处理,流程较为复杂。
技术实现思路
1、鉴于上述问题,本发明提出了为克服上述技术问题或者至少部分地解决上述技术问题的一种鱼类产卵行为与生态水文指标响应关系量化方法。
2、一种鱼类产卵行为与生态水文指标响应关系量化方法,所述方法包括:
3、收集和梳理鱼类早期资源数据及生态水文指标;
4、基于分类树确定鱼类产卵行为与生态水文指标响应关系;
5、利用分类树结果得出与鱼类产卵行为具有响应关系的生态水文指标及其阈值。
6、可选的,将产卵事件划分为无效产卵响应事件和有效产卵响应事件,以有效产卵响应事件在当年产卵总量占比的中位数作为划分标准,将产卵事件划分为无效产卵响应事件、低效产卵响应事件和高效产卵响应事件。
7、可选的,整理各产卵响应事件对应的生态水文指标,置于数据集中,并按比例将数据集划分为训练集数据和测试集数据。
8、可选的,以生态水文指标为预测变量,以生态水文指标对鱼类产卵无效刺激、低效刺激和高效刺激作为响应变量,构建分类树。
9、可选的,设置分类树的停止条件,对分类树进行剪枝,减小分类树的复杂性,提高泛化性能;删除分类树中的一些子分类树,防止过拟合。
10、可选的,利用构建的分类树对测试集数据进行分类,评估分类树的性能。
11、可选的,根据评估结果,调整分类树参数设置,改进分类树性能。
12、可选的,构建分类树时设置分裂标准,采用基尼系数进行特征选择,基尼系数计算公式如下:
13、
14、其中d是样本集合,k是类别个数,ck是第k个类别的样本子集,是第k个类别的样本占比。
15、可选的,对分类树进行剪枝的基本方法包括预剪枝和后剪枝,其中:
16、预剪枝:决策树生成过程中,对每个结点在划分前先进行估计,若当前结点的划分不能带来决策树泛化性能提升,则停止划分并将当前结点标记为叶结点;
17、后剪枝:先从训练集生成一棵完整的决策树,然后自底向上地对非叶结点进行考察,若将该结点对应的子树替换为叶结点能带来决策树泛化性能提升,则将该子树替换为叶结点。
18、可选的,应用分类回归树方法,根据历史水文数据,进行指标独立性分析剔除共线性后的生态水文指标来构建鱼类产卵响应模型,并量化响应阈值,指标独立性分析计算初选的生态水文指标之间的相关系数,所述相关系数包括pearson相关系数、spearman等级相关系数和kendall相关系数。
19、综上所述,由于采用了上述技术方案,本发明的有益效果是:
20、1.本发明改进了现有的鱼类产卵行为与生态水文指标响应关系研究方法只关注于生态水文指标是否可以有效刺激鱼类产卵,即把生态水文指标与鱼类行为的响应问题概化为“是、否”刺激产卵“二分类”问题的缺陷。随着水库生态调度实践的深入推进,在有效刺激鱼类产卵的基础上,通过水文指标与鱼类行为的响应研究,进一步辨识出低效、高效刺激鱼类产卵的生态水文指标及其阈值,对生态调度的优化改进具有重要的现实意义。
21、2.本发明使用分类回归树量化鱼类产卵行为与生态水文指标响应关系的方法与传统方法相比,结果更易于理解和解释,分类树的结构类似于人类的决策过程,因此很容易理解和解释。通过树的节点和分支,可以清晰地展示特征的重要性以及模型如何做出预测。
22、3.本发明使用的分类回归树方法可以同时处理包含数值型和分类型特征的数据,而不需要额外的数据预处理。可以简化数据的预处理流程,减少数据准备阶段的工作;由于树的结构是通过递归地划分数据集得到的,局部的异常值不太可能对整个模型产生很大的影响。因此具有较强的鲁棒性。
23、4.很多生态水文指标与鱼类产卵行为之间存在的是非线性关系,现存传统的方法不能很好的识别这样的非线性关系。分类回归树可以自然地捕捉特征之间的非线性关系,而无需进行复杂的特征工程。这使得它在处理非线性模型的问题上表现得相对较好。
1.一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,将产卵事件划分为无效产卵响应事件和有效产卵响应事件,以有效产卵响应事件在当年产卵总量占比的中位数作为划分标准,将产卵事件划分为无效产卵响应事件、低效产卵响应事件和高效产卵响应事件。
3.如权利要求2所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,整理各产卵响应事件对应的生态水文指标,置于数据集中,并按比例将数据集划分为训练集数据和测试集数据。
4.如权利要求3所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,以生态水文指标为预测变量,以生态水文指标对鱼类产卵无效刺激、低效刺激和高效刺激作为响应变量,构建分类树。
5.如权利要求4所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,设置分类树的停止条件,对分类树进行剪枝,减小分类树的复杂性,提高泛化性能;删除分类树中的一些子分类树,防止过拟合。
6.如权利要求5所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,利用构建的分类树对测试集数据进行分类,评估分类树的性能。
7.如权利要求6所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,根据评估结果,调整分类树参数设置,改进分类树性能。
8.如权利要求4所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,构建分类树时设置分裂标准,采用基尼系数进行特征选择,基尼系数计算公式如下:
9.如权利要求4所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,对分类树进行剪枝的基本方法包括预剪枝和后剪枝,其中:
10.如权利要求1所述的一种鱼类产卵行为与生态水文指标响应关系量化方法,其特征在于,应用分类回归树方法,根据历史水文数据,进行指标独立性分析剔除共线性后的生态水文指标来构建鱼类产卵响应模型,并量化响应阈值,指标独立性分析计算初选的生态水文指标之间的相关系数,所述相关系数包括pearson相关系数、spearman等级相关系数和kendall相关系数。