一种自适应动态组合的负荷概率预测方法及装置

xiaoxiao4月前 57

本发明涉及一种自适应动态组合的负荷概率预测方法及装置，属于电力系统负荷预测。

背景技术：

1、随着新型电力系统中不确定性的增加，电力负荷数据表现出显著的非平稳性，复杂环境变化导致样本数据分布随时间发生变化，产生数据漂移现象，尽管当前构建的深度学习预测模型足够复杂，但是参数一经训练便固定不变，固定参数的模型无法灵活地适应新的数据分布，从而导致模型在预测过程中误差随时间逐渐增加，无法准确反映复杂环境的变化。

2、同时，由于数据准确性、模型局限性的限制，确定性预测必然存在预测误差，复杂环境变化导致误差分布的相依规律难以挖掘，预测不确定性度量困难。基于深度学习的非参数概率预测方法逐渐成为当前主流的概率预测方法，尽管深度学习在特征挖掘上具有显著优势，但是任何一种的概率分布模型都难以完全描述复杂变量之间的耦合规律，由于模型内部特性的不同，通常不同模型在不同条件下的优势是各不相同的。为此，融合各个模型的预测优势、同时实现模型在不同条件下的动态组合、在线更新相关参数，既可避免单一预测模型的局限性又可突破固定参数模型难以在线跟踪环境变化的缺陷。

技术实现思路

1、针对上述问题，本发明提供了一种自适应动态组合的负荷概率预测方法及装置，首先，基于贝叶斯平均原理，融合分位数回归、稀疏贝叶斯学习、随机森林回归等不同分布类型、不同估计原理的概率预测模型优势，建立多类型概率分布的组合预测模型，克服单一预测模型在某些条件下表现不佳的问题；然后，构建基于深度确定性策略梯度(deepdeterministic policy gradient，ddpg)的深度强化学习框架，建立环境-概率预测评价指标的反馈机制，实现环境与组合权重之间的动态映射，在线感知外界环境变化、自适应更新组合权重，从而增强模型的适应性，有效提升概率预测结果的稳定性和概率预测精度。

2、本发明的技术方案如下：

3、一种自适应动态组合的负荷概率预测方法，包括如下步骤：

4、(1)选择多种概率预测模型作为组合子模型，优化训练各子模型，提升各子模型概率预测精度，用于对电荷概率进行分别预测；

5、(2)针对每一子模型进行贝叶斯模型平均，得到组合后的整体预测结果；

6、(3)对步骤(2)的预测结果进行评价；

7、(4)构建基于深度确定性策略梯度(deep deterministic policy gradient，ddpg)算法，建立环境-概率预测评价指标的反馈机制，实现对负荷组合概率的组合权重动态即时更新，实现环境与组合权重之间的动态映射；

8、(5)构建基于深度确定性策略梯度算法的短期负荷预测模型，用于得到自适应动态预测结果。

9、优选的，步骤(1)中，选择分位数回归模型、稀疏贝叶斯学习模型和随机森林回归模型作为组合子模型，其中，分位数回归模型通过更全面地描述目标变量与解释变量之间的关系，以分位数的形式近似随机变量的条件概率分布，定义随机目标变量y是预测对象，f为随机目标变量y关于随机解释向量x的概率分布函数，对于任意某时刻的随机目标变量y其分位数qτ被定义为：

10、qτ＝min{y|f(y)≥τ} (1)

11、其中τ∈[0,1]；

12、分位数回归模型为一种线性模型：

13、qτ＝α(τ)t·x (2)

14、其中，α(τ)＝[α1,α2,…,αm]t是qτ分位数条件下的回归系数向量，m为随机变量的个数；

15、分位数qτ可以通过最小化误差函数计算获得，如式(3)所示：

16、mine{ρτ(y,qτ)} (3)

17、其中ρτ为分位数回归算法中的检验函数，当其取最小值时，α(τ)即为最优估计值；

18、对于任意τ∈(0,1)：

19、

20、经式(4)计算获得最优估计值，计算任意时刻分位数条件下目标变量的估计值，然后通过高斯核函数进行统计得到目标变量的概率密度函数。

21、优选的，稀疏贝叶斯学习模型首先基于后验概率来进行参数估计，之后引入稀疏性先验，设目标变量y与解释变量x为一组离散的时间历史序列，对应关系表示为

22、yi＝f(xi；w)+εi (5)

23、其中，w表示权重向量；误差向量εi为均值为0、方差为σ2的正态分布，表示为n(0,σ2)；第i组目标变量yi服从均值为f(xi；ω)、方差为σ2的分布正态，基于核方法，将基函数k(x,xi)应用于预测任务中，则

24、

25、其中，φ(x)为核函数k(xi,x)构造的向量；n为核函数的个数；w0为偏置；

26、目标变量y的概率表示为

27、

28、其中，φ表示为[φ(x1),φ(x2),…,φ(xn)]t，φ(xi)为[1,k(xi,x1),…,k(xi,xn)]t，n为样本数量；

29、将wi当作分别服从均值为0，方差为的正态分布随机变量，将参数σ2服从形状参数以及尺度参数均为0的伽马分布，基于贝叶斯公式得到：

30、

31、p(w,α,σ2|y)表示参数w、α、σ2的后验分布，p(α,σ2|y)表示参数α、σ2的后验分布，p(w,|y,α,σ2)表示参数w在超参数α、σ2、y情况下的后验概率分布；

32、此时，原问题可以转化为求解参数α、σ2的后验分布，进而求解参数w在超参数α、σ2、y情况下的后验概率分布；假定α、σ2的后验分布服从狄拉克分布其中αm、分别为参数α的σ2的极大似然估计，因此基于贝叶斯原理，权重w的均值以及方差分别为

33、

34、其中，nh表示参数的维度；

35、对于新的解释变量x*，目标变量y*服从均值为μ*＝μtφ(x*)，方差为的正态分布，对目标变量y采用稀疏贝叶斯学习模型进行表征，其得到的概率密度函数f(y)表示为：

36、

37、优选的，随机森林回归模型中，定义目标变量y与解释变量x的随机森林回归树预测模型为{h(x,ξk),k＝1,2,…,k}，利用决策树将数值型变量转换为预测因子，从而实现随机变量模型的构建；将k棵决策树h(x,ξk)的值利用简单平均法取得最终的预测值，具体的：

38、从样本集中随机抽取部分数据作为训练集，其余预测变量h(x)的均方泛化误差为ex,y(y-h(x))，当随机森林中树的数量无穷大时，均方泛化误差会趋于稳定，并不会继续显著减小，此时均方泛化误差具体为：

39、ex,y(y-avkh(x,ξk))2→ex,y(y-eξh(x,ξ))2 (12)

40、其中，avkh(x,ξk)为决策树输出的平均值；在实际回归模型计算中，k值取足够大，随机森林回归模型的计算式为eξh(x,ξ)，利用y＝avkh(x,ξk)近似代替回归函数，对树的误差进行具体分析，则：

41、pe＝eξex,y(y-eξh(x,ξ))2 (13)

42、其中，pe为随机森林回归模型预测的平均泛化误差值；

43、通过对每棵树的平均泛化误差进行计算，深入评估单个回归树的预测性能，最后基于随机森林回归得到的期望和方差以高斯分布进行统计，得到预测的概率密度函数。

44、优选的，步骤(2)中，贝叶斯模型平均通过考虑每个模型的后验概率，根据给定数据情况下每个模型的表现进行加权求和，以此得到整体的预测结果；

45、定义特征变量x对应目标变量为y，则贝叶斯模型平均表达为

46、

47、其中，mi为第i个子模型，i＝1,2,3,…,k，p(y|mi,x)是由mi模型单独预测得到的目标变量y的概率，p(mi|x)为模型mi的后验模型概率，为

48、

49、其中

50、p(x|mi)＝∫p(x|θi,mi)p(θi|mi)dθi (16)

51、θi为模型mi的参数；p(mi)为模型mi的先验概率分布；p(x|θi,mi)为变量x在参数为θi的模型mi下的后验概率分布，p(θi|mi)为模型mi的后验概率分布；

52、由此可见，将各个子模型下得到的变量y后验分布进行加权平均，可以得到目标变量y的组合模型后验概率分布，由此，可将贝叶斯模型平均表达为

53、

54、其中，wi为各子模型的贡献率。

55、优选的，步骤(3)中，通过可靠性、敏锐性和综合评价指标对预测结果进行评价，假设数据集包含n个样本数据，通过预测得到在1-α的置信水平下的置信区间为[l1α,l2α]，则该预测模型可靠性通过预测区间覆盖率picp(prediction interval coverageprobability)进行评估，picp的计算方法如下：

56、

57、其中，如果样本i的观测值pi*落在预测区间内，则函数1(pi*∈[l1iα,l2iα])取值为1，否则取0；race为可靠性偏差，可靠性偏差越小，可靠性越高；

58、敏锐性反映了模型获得准确预测信息的能力，该指标量化了概率预测区间的非精确程度，由预测区间带宽pinaw(prediction interval normalized average width)指标来评估，pinaw表示为

59、

60、其中，n为样本个数，与分别表示预测置信区间的下界以及上界；pinaw的值越小，表示模型的敏感性越高；

61、综合评价指标为连续排名概率得分crps(continuous ranked probabilityscore)，crps值越小表示模型的概率预测性能越好，crps表达式如式：

62、

63、其中，n为测试样本的个数，fi(y)为第i个样本的累积分布函数预测结果，p*i和pi分别是第i个样本的负荷观测值和预测值，当预测值大于等于观测值时示性函数1(pi*≤pi)取1，反之取0。

64、优选的，步骤(4)中，深度确定性策略梯度算法的网络结构包括actor在线网络、actor目标网络、critic在线网络、critic目标网络以及经验回放池，actor在线网络、actor目标网络具有相同的结构，critic在线网络、critic目标网络也具有相同的结构，actor网络负责接收状态并生成动作，而critic网络则评估状态-动作对的q值，经验回放池用于存储智能体与环境交互产生的经验元组，以便于离线学习和提高数据效率；

65、利用经验回放机制，智能体与环境交互得到的样本被存储在经验回放池中，并以随机抽样的方式用于神经网络的训练；

66、在深度强化学习中引入目标网络，目标网络参数采用软更新的方式，在每一次迭代中都会按照式(21)和式(22)进行更新，即

67、

68、其中，θt为当前时刻actor在线网络的参数，θ′t为当前时刻actor目标网络的参数，ωt为当前时刻critic在线网络的参数，ω′t为当前时刻critic目标网络的参数，τ被称为软更新系数，其值远小于1；

69、在学习过程中，基于从经验回放池中随机抽取的n个样本(sj,aj,rj,sj+1),j＝1,…,n，critic在线网络首先更新，其损失函数表示如下所示：

70、

71、其中，sj为第j步学习的状态；aj为第j步学习的动作；rj为第j步学习的奖励；q(sj,aj|w)为第j步的奖励值函数；

72、yj＝rj+γq′(sj+1,π′(sj+1|θ′)|ω′) (24)

73、γ为折扣因子；q’(sj+1,π’(sj+1|θ’)|w)为第j+1步条件下的价值函数；

74、然后，critic在线网络参数ω按照下式所示的方式更新：

75、

76、其中，αω是critic在线网络的学习率，是损失函数关于网络参数ω的梯度(其中ωt为t时刻critic在线网络的参数，此处采样ω为泛指)；

77、接着，actor在线网络按照式(26)所示的链式法则更新，其关于网络参数θ(其中θt为t时刻actor在线网络的参数，此处采样θ为泛指)的损失梯度如下所示

78、

79、θ按照下述方式更新：

80、

81、其中，αθ表示actor在线网络的学习率。

82、优选的，步骤(5)中，定义环境为各个子预测模型的组合机制，智能体的功能是从外界环境中感知状态并输出组合模型的组合权重到环境中，并从环境中获得相应的奖励；

83、在负荷预测应用中，组合预测需要用到的信息包括数值天气预报气象要素、实测负荷、子模型的预测值，因此将状态集定义为

84、

85、其中，s1为预报气象要素，如温度、短波辐射、相对湿度等，s2为实测负荷要素，被定义为子模型的组合权重、以及组合预测误差crps，子模型包括分位数回归模型、稀疏贝叶斯学习模型和随机森林回归模型；

86、将智能体的动作a定义为子模型的组合权重，即

87、a＝{w1,w2,w3} (29)

88、对奖励r设置为关于组合模型和子模型概率评价指标crps的函数，即

89、

90、其中e1,e2,e3分别为组合模型、各子模型预测结果的概率评价指标crps，该奖励函数要求组合模型的概率预测误差需比三个子模型中最小概率误差还要小；

91、actor在线网络与环境交互生成组合模型的权值，然后组合模型根据权值和子模型结果获得负荷概率预测结果，同时，随着新数据样本的到来，根据(30)返回一个奖励，表示权重的质量，并将即将到来的气象数据、负荷数据、组合权重、以及组合模型评价指标cprs转移到新的状态；在这个循环之后，新的四元组(st,at,rt,st+1)被推入经验回放池，如果经验回放池满了，最旧的样本将被丢弃；

92、初始状态时，四元组的参数均为默认参数，且目标网络完全复制在线网络的参数，首先，actor在线网络接受当前状态si生成的当前策略πi(si|θ)提供给critic在线网络，同时actor目标网络取下一个状态si+1生成策略πi+1(si+1|θ′)提供给critic目标网络；critic目标网络根据si+1和πi+1(si+1|θ′)结合式(24)得到yi；同时critic在线网络根据当前状态si和当前策略πi(si|θ)计算出当前q(si,ai|w)，然后根据目标值yi和q值，critic在线网络通过最小化式(23)的损失函数对参数ω进行更新；之后，actor在线网络进行相应参数更新，计算acotr在线网络的两个梯度和然后结合两个梯度，按照式(26)将策略梯度并更新参数θ；最后，actor目标网络和critic目标网络分别从actor在线网络和critic在线网络中以软更新方式复制参数。

93、一种自适应动态组合的负荷概率预测装置，包括组合子模型模块、贝叶斯模型平均模块、评价模块及基于深度确定性策略梯度算法的短期负荷预测模块，用于实现上述的自适应动态组合的负荷概率预测方法。

94、本发明未详尽之处，均可参见现有技术。

95、本发明的有益效果为：

96、本发明基于贝叶斯平均原理，融合分位数回归、稀疏贝叶斯学习、随机森林回归等不同分布类型、不同估计原理的概率预测模型优势，建立多类型概率分布的组合预测模型，克服单一预测模型在某些条件下表现不佳的问题；

97、本发明构建基于深度确定性策略梯度的深度强化学习框架，建立环境-概率预测评价指标的反馈机制，实现环境与组合权重之间的动态映射，在线感知外界环境变化、自适应更新组合权重，从而增强模型的适应性，有效提升概率预测结果的稳定性和概率预测精度。

技术特征：

1.一种自适应动态组合的负荷概率预测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的自适应动态组合的负荷概率预测方法，其特征在于，步骤(1)中，选择分位数回归模型、稀疏贝叶斯学习模型和随机森林回归模型作为组合子模型。

3.根据权利要求2所述的自适应动态组合的负荷概率预测方法，其特征在于，分位数回归模型通过描述目标变量与解释变量之间的关系，以分位数的形式近似随机变量的条件概率分布，定义随机目标变量y是预测对象，f为随机目标变量y关于随机解释向量x的概率分布函数，对于任意某时刻的随机目标变量y其分位数qτ被定义为：

4.根据权利要求3所述的自适应动态组合的负荷概率预测方法，其特征在于，稀疏贝叶斯学习模型首先基于后验概率来进行参数估计，之后引入稀疏性先验，设目标变量y与解释变量x为一组离散的时间历史序列，对应关系表示为

5.根据权利要求4所述的自适应动态组合的负荷概率预测方法，其特征在于，随机森林回归模型中，定义目标变量y与解释变量x的随机森林回归树预测模型为{h(x,ξk),k＝1,2,…,k…，k}}，利用决策树将数值型变量转换为预测因子，从而实现随机变量模型的构建；将k棵决策树h(x,ξk)的值利用简单平均法取得最终的预测值，具体的：

6.根据权利要求1所述的自适应动态组合的负荷概率预测方法，其特征在于，步骤(2)中，贝叶斯模型平均通过考虑每个模型的后验概率，根据给定数据情况下每个模型的表现进行加权求和，以此得到整体的预测结果；

7.根据权利要求6所述的自适应动态组合的负荷概率预测方法，其特征在于，步骤(3)中，通过可靠性、敏锐性和综合评价指标对预测结果进行评价，假设数据集包含n个样本数据，通过预测得到在1-α的置信水平下的置信区间为[l1α,l2α]，则该预测模型可靠性通过预测区间覆盖率picp进行评估，picp的计算方法如下：

8.根据权利要求7所述的自适应动态组合的负荷概率预测方法，其特征在于，步骤(4)中，深度确定性策略梯度算法的网络结构包括actor在线网络、actor目标网络、critic在线网络、critic目标网络以及经验回放池，actor在线网络、actor目标网络具有相同的结构，critic在线网络、critic目标网络也具有相同的结构，actor网络负责接收状态并生成动作，而critic网络则评估状态-动作对的q值，经验回放池用于存储智能体与环境交互产生的经验元组，以便于离线学习和提高数据效率；

9.根据权利要求8所述的自适应动态组合的负荷概率预测方法，其特征在于，步骤(5)中，定义环境为各个子预测模型的组合机制，智能体的功能是从外界环境中感知状态并输出组合模型的组合权重到环境中，并从环境中获得相应的奖励；

10.一种自适应动态组合的负荷概率预测装置，其特征在于，包括组合子模型模块、贝叶斯模型平均模块、评价模块及基于深度确定性策略梯度算法的短期负荷预测模块，用于实现权利要求1～9任一所述的自适应动态组合的负荷概率预测方法。

技术总结
本发明涉及一种自适应动态组合的负荷概率预测方法及装置，属于电力系统负荷预测技术领域，包括：选择多种概率预测模型作为组合子模型，优化训练各子模型，提升各子模型概率预测精度，用于对电荷概率进行分别预测；针对每一子模型进行贝叶斯模型平均，得到组合后的整体预测结果；对预测结果进行评价；构建基于深度确定性策略梯度算法；构建基于深度确定性策略梯度算法的短期负荷预测模型，用于得到自适应动态预测结果。本发明克服单一预测模型在某些条件下表现不佳的问题，且实现环境与组合权重之间的动态映射，在线感知外界环境变化、自适应更新组合权重，从而增强模型的适应性，有效提升概率预测结果的稳定性和概率预测精度。

技术研发人员：杨明,于一潇,李梦林,李鹏,张玉敏,刘昊,王传琦,管西洋
受保护的技术使用者：山东大学
技术研发日：
技术公布日：2024/9/23

专利

最新回复(0)