本发明涉及虚拟电厂资源调度,特别是涉及一种基于联邦学习的虚拟电厂资源调度方法。
背景技术:
1、随着以综合能源系统、能源互联网为代表的现代能源系统的持续升级,能源行业以高效、安全和可持续为目标逐步拓展新的能源利用模式,虚拟电厂作为一种高效聚合并优化利用可再生能源、可控负荷和储能系统等灵活性资源的先进技术,能有效促进电力系统绿色低碳转型。随着智能电网和能源互联网的快速发展,分布式电力资源在虚拟电厂中的比例越来越高,合理利用分布式电力资源可以显著提高虚拟电厂的运行效率,但繁多的小规模分布式电力资源调度将极大增加电力系统的计算复杂度,电力系统信息维护的成本提高,数据信息泄露风险增大。
2、公开号为cn115062835a,名称为基于虚拟发电厂的主动配电网分布式资源优化调度方法的专利文献,利用虚拟发电厂技术聚合大量小规模分布式资源;基于双层规划建立了分布式能源、虚拟发电厂与主动配电网间的协同调度方案,上层为包含多种分布式资源的虚拟发电厂的最优投标问题,目标为利润最大化,下层为主动配电网的市场出清模型,目标为最小化配电系统的运行成本;针对原始问题的非凸非线性,利用线性支路潮流、多边形内逼近法、kkt条件及强对偶定理将其转换为一个混合整数线性规划问题并进行求解。虽然该方法改善多种类型分布式资源在优化调度中的可视性与可控性,但在实际操作中,对于虚拟发电厂的隐私数据的处理方式较为薄弱。
3、公开号为cn113919717a,名称为面向多目标同步优化的虚拟电厂资源调度方法和装置的专利文献,通过获取区域能源网的日前预测风光出力、日前预测负荷波动、配电网系统网架结构参数、和虚拟电厂可调度设备参数;构建虚拟电厂优化调度模型及所述优化调度模型的约束条件;基于预定调度目标,建立虚拟电厂优化调度分目标;对分目标分别进行优化求解上下限计算,如某一分目标无解,则退回至第一步获取数据阶段修正前述数据;确定各个分目标的权重系数,并对所选分目标进行归一化,得到虚拟电厂优化调度目标函数;最后对虚拟电厂优化调度目标函数求解,并根据求解结果调度虚拟电厂可控资源。该方法基于小范围区域高比例新能源的能源结构和多种可调度的灵活性资源配置,利用多目标同步方法,能够找到多个符合目标预期的资源调度方案,然而该方法没有考虑虚拟电厂的整体运营成本,以及未考虑数据隐私泄露情况。
技术实现思路
1、为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于联邦学习的虚拟电厂资源调度方法,该方法包括:
2、s100:通过边缘计算电力网络获取各分布式电厂运行数据,以及电力市场电价交易数据;
3、s200:根据所述分布式电厂运行数据和所述电力市场电价交易数据,计算分布式能源生产成本、分布式能源储能成本和市场交易成本,并设定分布式电厂平衡约束;
4、s300:根据所述分布式能源生产成本、分布式能源储能成本和市场交易成本,建立以最小化运营成本的调度优化目标函数;
5、s400:确定联邦学习参与方并初始化参与方的环境;
6、s500:建立联邦学习全局模型,将联邦学习全局模型发送至各参与方;
7、s600:各参与方在本地边缘计算服务器采用q-learning算法训练所述联邦学习全局模型,得到各参与方个性化局部模型;
8、s700:各参与方将所述个性化局部模型发送至虚拟电厂中央服务器进行聚合得到虚拟电厂调度模型,利用虚拟电厂调度模型对各分布式电厂终端设备进行调度;
9、所述边缘计算电力网络,是由三层架构组成,分别为分布式电厂终端设备,分布式电厂边缘计算服务器和虚拟电厂中央服务器;
10、所述分布式电厂终端设备,包括光伏发电设备、风力发电设备、热燃机发电设备和储能设备;
11、所述分布式电厂运行数据,包括:热燃机发电机组的发电量、风力发电机组的发电量、光伏发电机组的发电量和储能单元充放电量。
12、进一步地,所述分布式能源生产成本,是指由热燃机发电机组生产成本、风力发电机组生产成本及光伏发电机组生产成本进行计算,计算公式为:
13、;
14、其中,是指分布式能源生产成本,是指热燃机发电机组数量,是指风力发电机组数量,是指光伏发电机组数量,,,是指热燃机发电机组成本特征系数,是指风力发电机组成本系数,是指光伏发电机组成本系数,是指热燃机发电机组中第台热燃机发电机的发电量,是指风力发电机组中第台风力发电机的发电量,是指光伏发电机组中第台光伏发电机的发电量;
15、所述分布式能源储能成本,计算公式为:
16、;
17、其中,是指分布式能源储能成本,是指分布式电厂中储能单元数量,是指储能单元充放电的成本系数,是指第个储能单元充放电量;
18、所述市场交易成本,是根据电力市场电价进行计算,计算公式为:
19、;
20、其中,是指市场交易成本,是指时刻电力市场电价,是指时刻电力市场交易电量;
21、所述分布式电厂平衡约束,是为保障分布式电厂发电量、储能单元充放电量和电力市场交易电量与负荷设备的消耗电量之间平衡,平衡约束表示为:
22、;
23、其中,是指负荷设备数量,是指第个负荷设备的消耗电量,是指热燃机发电机组中第台热燃机发电机的发电量,是指风力发电机组中第台风力发电机的发电量,是指光伏发电机组中第台光伏发电机的发电量,是指第个储能单元充放电量,是指时刻电力市场交易电量,是指热燃机发电机组数量,是指风力发电机组数量,是指光伏发电机组数量,是指分布式电厂中储能单元数量。
24、进一步地,所述调度优化目标函数,是指以最小化虚拟电厂运营成本为目标建立的调度优化函数,表示为:
25、;
26、其中,是指调度优化目标函数,是指分布式能源生产成本,是指布式能源储能成本,是指市场交易成本。
27、进一步地,所述确定联邦学习参与方并初始化参与方的环境,是指由虚拟电厂中央服务器确定虚拟电厂中参与联邦学习的各分布式电厂边缘计算服务器并进一步初始化各分布式电厂边缘计算服务器训练环境;
28、所述参与方是指分布式电厂边缘计算服务器;
29、所述初始化各分布式电厂边缘计算服务器训练环境,是指对各分布式电厂进行马尔可夫决策过程建模,包括建立分布式电厂状态空间、分布式电厂调度动作空间、分布式电厂奖励函数;
30、所述分布式电厂状态空间,包括储能单元电荷状态、发电设备出力、负荷量,分布式电厂状态空间表示为:
31、;
32、;
33、其中,是指分布式电厂状态空间,是指分布式电厂时刻状态,是指发电设备发电量,是指负荷设备的消耗电量,是指储能单元电荷状态,是指分布式电厂状态空间所包含状态数量;
34、所述分布式电厂调度动作空间,是指对分布式电厂发电量与储能电量进行调控,表示为:
35、;
36、;
37、其中,是指分布式电厂调度动作空间,是指分布式电厂时刻调度动作,是指发电设备发电量,是指储能单元充放电量,是指分布式电厂调度动作空间所包含动作数量;
38、所述分布式电厂奖励函数,是指根据虚拟电厂运营成本进行设定,表示为:
39、<msub><mi>r</mi><mi>t</mi></msub><mi>=-</mi><msub><mi>ρ</mi><mn>1</mn></msub><mi>[</mi><msub><mi>f</mi><mi>cost</mi></msub><mo>+</mo><msub><mi>f</mi><mi>ess</mi></msub><mo>+</mo><msub><mi>f</mi><mi>ma</mi></msub><mi>]-</mi><msub><mi>ρ</mi><mn>2</mn></msub><mi>∆p</mi>;
40、其中,是指分布式电厂时刻获得奖励,是指分布式能源生产成本,是指布式能源储能成本,是指市场交易成本,是指奖励系数,是指分布式电厂发电量不平衡量。
41、进一步地,所述联邦学习全局模型,是指通过小幅随机初始化一个大小为分布式电厂状态空间乘以分布式电厂调度动作空间的q价值表,表示为:
42、;
43、其中,是指初始化的联邦学习全局模型,是指分布式电厂时刻状态,是指分布式电厂时刻调度动作。
44、进一步地,所述采用q-learning算法训练所述联邦学习全局模型,是指各参与方在接收到虚拟电厂中央服务器所发送的联邦学习全局模型后根据q-learning更新规则更新联邦学习全局模型,得到各参与方个性化局部模型;
45、所述q-learning更新规则,表示为:
46、<mi>q</mi><mi>(</mi><msub><mi>s</mi><mi>t</mi></msub><mi>,</mi><msub><mi>a</mi><mi>t</mi></msub><mi>)=</mi><mi>q</mi><mi>(</mi><msub><mi>s</mi><mi>t</mi></msub><mi>,</mi><msub><mi>a</mi><mi>t</mi></msub><mi>)+λ[</mi><msub><mi>r</mi><mi>t</mi></msub><mi>+γmaxq(</mi><msub><mi>s</mi><mi>t+1</mi></msub><mi>,</mi><msub><mi>a</mi><mrow><mi>t</mi><mi>+1</mi></mrow></msub><mi>)-q(</mi><msub><mi>s</mi><mi>t</mi></msub><mi>,</mi><msub><mi>a</mi><mi>t</mi></msub><mi>)]</mi>;
47、其中,是指时刻在状态下分布式电厂执行调度动作所对应的q价值表,是指学习速率,是指分布式电厂时刻获得奖励,是指折扣因子,是指分布式电厂时刻状态,是指分布式电厂时刻调度动作,是指时刻的分布式电厂状态,是指时刻的分布式电厂调度动作,是指时刻在状态下分布式电厂执行调度动作所对应的最大q价值表。
48、进一步地,所述所述s700,包括:
49、s710:将各参与方发送至虚拟电厂中央服务器的个性化局部模型通过联邦平均算法进行聚合,得到聚合后的联邦学习全局模型;
50、s720:判断是否达到最大训练轮数,如果达到,则将所述聚合后的联邦学习全局模型作为虚拟电厂调度模型,如果未达到,则转s730;
51、s730:将所述聚合后的联邦学习全局模型发送至各参与方,迭代训练个性化局部模型;
52、s740:将所述虚拟电厂调度模型发送至各参与方,各参与方根据虚拟电厂调度模型对各分布式电厂终端设备进行调度;
53、所述联邦平均算法,表示为:
54、;
55、其中,是指聚合后的联邦学习全局模型,是指参与方数量,是指第个参与方的个性化局部模型;
56、所述各参与方根据虚拟电厂调度模型对各分布式电厂终端设备进行调度,是指利用虚拟电厂调度模型在每个分布式电厂状态中以运营成本最小为目标选择最优调度动作,对分布式电厂终端设备进行调度。
57、综上所述,由于采用了上述技术方案,本发明的有益效果是:
58、1、本发明提供的一种基于联邦学习的虚拟电厂资源调度方法,通过构建联邦学习模型将数据保留在各参与方的本地边缘服务器上进行训练,有效地保护了各分布式电厂的运行数据和电力市场交易数据的隐私,避免了数据泄露的风险。
59、2、本发明提供的一种基于联邦学习的虚拟电厂资源调度方法,通过动态调整各参与方的局部模型并进行全局聚合,能够及时反映电力市场和分布式电厂运行状态的变化,确保调度策略的灵活性和适应性。
60、3、本发明提供的一种基于联邦学习的虚拟电厂资源调度方法,通过采用q-learning强化学习算法对各分布式电厂资源调度进行个性化学习,生成适应性强的局部模型,能够实现发电设备和市场资源的利用效率最大化。
1.一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,包括:
2.如权利要求1所述的一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,所述分布式能源生产成本,是指由热燃机发电机组生产成本、风力发电机组生产成本及光伏发电机组生产成本进行计算,计算公式为:
3.如权利要求1所述的一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,所述调度优化目标函数,是指以最小化虚拟电厂运营成本为目标建立的调度优化函数,表示为:
4.如权利要求1所述的一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,所述确定联邦学习参与方并初始化参与方的环境,是指由虚拟电厂中央服务器确定虚拟电厂中参与联邦学习的各分布式电厂边缘计算服务器并进一步初始化各分布式电厂边缘计算服务器训练环境;
5.如权利要求1所述的一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,所述联邦学习全局模型,是指通过小幅随机初始化一个大小为分布式电厂状态空间乘以分布式电厂调度动作空间的q价值表,表示为:
6.如权利要求1所述的一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,所述采用q-learning算法训练所述联邦学习全局模型,是指各参与方在接收到虚拟电厂中央服务器所发送的联邦学习全局模型后根据q-learning更新规则更新联邦学习全局模型,得到各参与方个性化局部模型;
7.如权利要求1所述的一种基于联邦学习的虚拟电厂资源调度方法,其特征在于,所述s700,包括: