本发明涉及降水预报领域,尤其涉及一种基于二次筛选的融合多头自注意力机制的中长期降水预报方法及系统。
背景技术:
1、可靠的中长期降水预报能够降低自然风险所带来的损失,并为水利工程的防洪和调度提供可靠的技术和数据参考,有助于优化水文气象灾害预警系统,来实现水资源的可持续利用。然而,中长期降水预报研究预见期长,受到的影响因素复杂、模型泛化能力欠佳,预报精度难以得到有效保障。利用历史气象数据和气象预报数据来进行基于过程的中长期预测是目前的研究主要方向之一。
2、在中长期降水预报的研究中预报因子的选择和多样性模型的集成构建一直是中长期预报研究的难点。近年来,围绕预报因子选择识别、预报模型构建优化等环节学术界展开了大量的研究。目前,随着研究对象实况复杂程度的不断加深,采用单一方法进行预报模型的构建难以体现机器学习中各模式机制的优势,很难规避其固有缺陷,据此预报模型的构建耦合需要愈发深化,通过构建组合预报模型一定程度上能够有效的发挥各模式各机制的优势从而提高预报精度。
技术实现思路
1、发明目的:提出一种基于二次筛选的融合多头自注意力机制的中长期降水预报方法,并进一步提出一种用于实现上述方法的系统,以解决现有技术存在的上述问题。
2、第一方面,提出一种基于二次筛选的融合多头自注意力机制的中长期降水预报方法,该方法包括如下步骤:
3、步骤1、获取预定研究区域的历史气象因子数据,构建基础气象因子库;获取该研究区域的水文站降水数据,并基于该水文站降水数据计算该研究区域月度面下的平均降水数据序列;依次将所述历史气象因子数据前推预定月份从而与水文站降水数据的月度时间尺度匹配,构建逐月的气象因子预报库;
4、步骤2、计算所述平均降水数据序列与气象因子预报库的相关系数,获得平均降水数据序列与气象因子预报库在不同前推月份的相关系数结果集合;对所述相关系数结果集合进行分析,筛选出多组预报因子序列,得到该研究区域下的最终预报因子库;
5、步骤3、将多头自注意力机制与卷积长短记忆神经网络融合得到中长期降水预报模型并对其进行参数优化;
6、步骤4、将所述最终预报因子库分别输入参数优化后的中长期降水预报模型中,输出目标区域的中长期降水预报结果,对预报结果执行统计学分析:
7、若预报结果符合预期,则直接输出当前预报结果;
8、若预报结果不符合预期,则重复执行步骤1至步骤3,直至迭代出符合预期的中长期降水预报模型、输出符合预期的预报结果。
9、在第一方面进一步的实施例中,步骤1具体包括:
10、步骤1-1、获取预定研究区域、预定研究时段的气象因子数据,构成基础气象因子库;其中所述气象因子数据包括大气环流因子和海温因子;
11、步骤1-2、获取研究区域各水文站对应研究时段的点降水数据,通过泰森多边形法计算得到该研究区域的面降水量;
12、步骤1-3、从1月逐月推至12月,将所述基础气象因子库与研究区域的面降水量的时间序列进行组合,形成多个不同前推月份的气象因子-目标降水组合,以此作为气象因子预报库。
13、在第一方面进一步的实施例中,步骤2具体包括:
14、步骤2-1、针对步骤1-3中所得到的气象因子预报库,匹配后计算气象因子-目标降水组合的秩相关系数,计算所有组合的秩相关系数后构建序列相关系数集合。秩相关系数计算如下式:
15、
16、式中,n表示样本序列长度,表示两个变量分别排序后成对的变量位置差;相关系数值介于-1与1之间,绝对值越大意味着相关性越强,当绝对值为0时,不存在等级与秩次相关;
17、步骤2-2、对构建得到的序列相关系数集合进行分析,筛选出排位靠前的前推月份的气象因子-目标降水组合,采用随机森林法评估气象因子-目标降水组合中的各个特征的重要性,并计算各个特征的基尼指数;
18、以基尼系数作为评价指标对预报因子二次筛选得到多组预报因子序列,多组预报因子序列构成最终预报因子库。
19、在第一方面进一步的实施例中,步骤2-1中,采用随机森林法评估气象因子-目标降水组合中的各个特征的重要性,具体如下:
20、总计有j个特征、i棵决策树和c个类别,第棵树节点的基尼指数的计算式如下:
21、
22、式中,表示第棵树的节点中类别所占的比例;
23、计算第个特征在整个随机森林系统中的重要性:
24、
25、式中,和分别为分枝后两个新节点的基尼指数;为第个特征在第棵树节点的重要性;为特征在决策树中出现的节点集合。
26、在第一方面进一步的实施例中,步骤3具体包括:
27、步骤3-1、以步骤2-2中筛选得到的多组预报因子序列作为输入,以步骤1-2中计算得到的研究区域的面降水量作为输出,构建多组预报序列组合并将其输入至卷积长短记忆神经网络;所述卷积长短记忆神经网络包括信号输入层、cnn卷积层、池化层、lstm层、分类输出层;其中所述lstm层包含两个隐藏层;
28、步骤3-2、采用麻雀算法对所述lstm层的进行参数优化:将lstm层中的参数映射为麻雀位置;麻雀位置、、是优化目标,其中是隐藏层节点数,是初始学习率,是l2正则化系数;
29、经过多轮迭代找到卷积长短记忆神经网络的最佳隐藏层节点数、最佳初始学习率、最佳l2正则化系数;
30、步骤3-3、将多头自注意力机制层插入经过步骤3-2参数优化的lstm层,得到中长期降水预报模型。
31、在第一方面进一步的实施例中,步骤3-2具体包括:
32、通过人工调参确定隐藏层节点数、初始学习率、l2正则化系数中的若干参数样本,将参数样本按照预定比例划分为追随者和探索者;探索者用于跳出局部最优,追随者用于在探索者附近进行搜索;
33、探索者的位置更新规则如下:
34、
35、式中,为最大迭代次数;为[0,1]内的一个随机数;和st分别为预警值和安全值;q为服从正态分布的随机数;l为一个维度为的矩阵,d为矩阵的列数,矩阵中任意元素均为1;表示第u只麻雀在第t次迭代中的第v维位置信息;表示探索者的位置更新后的第u只麻雀在第t+1次迭代中的第v维位置信息;
36、追随者的位置更新规则如下:
37、
38、式中,为最优探索者的位置;为当前全局最差位置;s为种群规模;a为一个维度为的矩阵,d为矩阵的列数,矩阵中每个元素随机赋值为±1;为a的转置矩阵;为最大迭代次数;为[0,1]内的一个随机数;u为麻雀数。
39、在第一方面进一步的实施例中,步骤4中对预报结果执行统计学分析,具体包括:
40、将最终预报因子库分别输入参数优化后的中长期降水预报模型中,输出目标区域的中长期降水预报结果序列;
41、计算预报结果序列的决定系数、平均绝对误差和均方误差;
42、其中,决定系数计算如下式:
43、
44、平均绝对误差mae计算如下式:
45、
46、均方误差mse计算如下式:
47、
48、式中,n为序列长度;为序列实际值;为序列实际平均值;为序列中第i个预报值。
49、本发明的第二方面,提出一种中长期降水预报系统,该降水预报系统包括数据获取单元、第一数据库构建单元、计算单元、第二数据库构建单元、预报模型构建单元、预报结果输出单元。
50、数据获取单元用于获取预定研究区域的历史气象因子数据,构建基础气象因子库;此外,所述数据获取单元还获取该研究区域的水文站降水数据,并基于该水文站降水数据计算该研究区域月度面下的平均降水数据序列。
51、第一数据库构建单元用于依次将所述历史气象因子数据前推预定月份从而与水文站降水数据的月度时间尺度匹配,构建逐月的气象因子预报库。
52、计算单元用于计算所述平均降水数据序列与气象因子预报库的相关系数,获得平均降水数据序列与气象因子预报库在不同前推月份的相关系数结果集合。
53、第二数据库构建单元用于对所述相关系数结果集合进行分析,筛选出多组预报因子序列,得到该研究区域下的最终预报因子库。
54、预报模型构建单元用于将多头自注意力机制与卷积长短记忆神经网络融合得到中长期降水预报模型并对其进行参数优化。
55、预报结果输出单元用于将所述最终预报因子库分别输入参数优化后的中长期降水预报模型中,输出目标区域的中长期降水预报结果,对预报结果执行统计学分析:
56、若预报结果符合预期,则直接输出当前预报结果;
57、若预报结果不符合预期,则反馈给所述预报模型构建单元,直至迭代出符合预期的中长期降水预报模型、输出符合预期的预报结果。
58、该降水预报系统可以自动执行如第一方面及其进一步的实施例所公开的基于二次筛选的融合多头自注意力机制的中长期降水预报方法。
59、本发明的第三方面,提出一种电子设备,该电子设备包括处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如第一方面所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法。
60、本发明的第四方面,提出一种计算机可读存储介质,该存储介质中存储有至少一个可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行如第一方面所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法。
61、与现有技术相比,本发明提出的技术方案至少具备如下有益效果:
62、(1)采用统计学方法和随机森林算法筛选预报因子,通过二次筛选更加准确的遴选出合适的区域主要影响预报因子,获取了目标研究区域最终的报因子库。
63、(2)通过将多头自注意力机制与卷积长短记忆神经网络融合,采用麻雀算法进行优化耦合构建中长期降水预报模型,有效的结合多模型机制的优点,分层进行模型训练拟合,有效缓解模型易于局部最优的问题从而更全面的分析隐式规则得到更优的中长期降水预报结果,通过结合精选的预报因子来实现研究区域中长期降水的预估。
1.一种基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,步骤1进一步包括:
3.根据权利要求2所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,步骤2进一步包括:
4.根据权利要求3所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,步骤2-2中,采用随机森林法评估气象因子-目标降水组合中的各个特征的重要性,具体包括:
5.根据权利要求3所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,步骤3进一步包括:
6.根据权利要求5所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,步骤3-2进一步包括:
7.根据权利要求5所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法,其特征在于,步骤4中对预报结果执行统计学分析,具体包括:
8.一种中长期降水预报系统,用于执行如权利要求1至7中任一项所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法;其特征在于,所述中长期降水预报系统包括:
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1至7中任一项所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一个可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行如权利要求1至7中任一项所述的基于二次筛选的融合多头自注意力机制的中长期降水预报方法。