本发明涉及电力系统负荷预测领域,特别涉及一种基于多算法融合的规划目标年典型日负荷曲线确定方法。
背景技术:
1、随着全球能源结构转型和可再生能源的迅速发展,电力系统的负荷预测变得尤为重要。传统的负荷预测方法主要依赖于历史数据的简单趋势外推,难以应对现代电力系统中负荷的高波动性和复杂性。近年来,机器学习和深度学习方法在负荷预测中的应用逐渐增多,例如短期负荷预测和中长期负荷预测。然而,这些方法在处理长期预测时,面临数据量大、计算复杂度高、模型易过拟合等问题。此外,负荷数据中存在的缺失值和异常值也会显著影响预测精度。现有的预测方法,如自回归积分滑动平均模型,适用于处理时间序列数据中的趋势和季节性变化,但对负荷数据中的非线性关系处理效果较差。随机森林算法在处理非线性和高维数据方面具有优势,但在捕捉时间序列的长期趋势和周期性变化方面存在不足。因此,单一算法难以同时满足负荷曲线预测的精度和稳定性要求。
技术实现思路
1、为了克服上述挑战,本发明提出了一种基于多算法融合的方法,将自回归积分滑动平均模型和随机森林算法相结合,利用各自的优势提高负荷预测的准确性和可靠性。通过改进的k均值聚类算法,优化典型日负荷曲线的确定方法,使其更适应现代电力系统规划的需求。
2、本发明提出了一种基于多算法融合的电力系统规划目标年典型日负荷曲线确定方法,所述方法包括:
3、s1:获取历史电力负荷数据,进行数据清洗;
4、s2:通过自回归积分滑动平均模型,基于清洗后的负荷数据预测目标年每日最大负荷;
5、s3:清洗后的负荷数据进行归一化;采用随机森林模型,基于归一化后的负荷数据预测目标年每日归一化负荷曲线;
6、s4:结合预测的目标年每日最大负荷与目标年每日归一化负荷曲线,获得目标年日负荷预测曲线;
7、s5:利用改进k均值聚类方法,对目标年日负荷预测曲线按月度进行聚类分析,选取最大簇的均值作为目标年的月度典型日负荷曲线。
8、进一步地,步骤s1中,所述的数据清洗包括缺失值处理和异常值处理:
9、所述缺失值处理包括:将历史电力负荷数据中的缺失值填充为该缺失值前后两个或多个数据点的均值;
10、所述异常值处理包括:采用局部异常因子算法识别历史电力负荷数据中的异常数据点,并替换为该异常数据点前后两个数据点的均值。
11、进一步地,所述归一化具体包括:所述清洗后的负荷数据分为多组日负荷数据,所述日负荷数据包括当日各时间点的负荷数据,对于每组日负荷数据,求当日最大负荷,并将当日各时间点的负荷数据除以当日最大负荷,作为归一化后的负荷数据。
12、进一步地,步骤s3中,所述基于归一化后的负荷数据预测目标年每日归一化负荷曲线,具体包括:所述随机森林模型包括多棵决策树,决策树基于归一化后的负荷数据对目标年的负荷数据进行预测,目标年负荷数据的最终预测值为所有决策树预测值的平均值,目标年每日各时间点的负荷数据最终预测值构成目标年每日归一化负荷曲线。
13、进一步地,所述步骤s4包括:将预测的目标年每日最大负荷与目标年每日归一化负荷曲线相乘,即得到目标年日负荷预测曲线。
14、进一步地,所述步骤s5具体包括:对于目标年每月度的日负荷预测曲线通过局部搜索算法选取k条肯德尔相关系数之和最小的日负荷曲线,以选取的k条日负荷曲线为聚类中心通过k均值算法进行聚类;计算不同k值下聚类的轮廓系数,以轮廓系数最大对应的k值为最终确定的聚类数,对于最终确定聚类数对应的聚类结果,其中最大簇的平均值为目标年的月度典型日负荷曲线。
15、与现有技术相比,本发明具有以下有益效果:
16、通过局部异常因子(lof)算法对历史数据进行清洗和异常值检测,能有效识别并替换异常数据,减少了数据噪音,提高了负荷预测的准确性。利用自回归积分滑动平均模型与随机森林算法结合,通过贝叶斯优化方法提高模型参数选择效率和预测精度,实现了对未来每日最大负荷和归一化负荷曲线的高精度预测。本发明综合利用自回归积分滑动平均模型处理时间序列的趋势和季节性变化,结合随机森林算法处理数据的非线性和高维特性,在长短期负荷预测中都表现出色。通过改进的k均值聚类算法,对预测出的目标年每日负荷曲线进行聚类分析,选择最大聚类簇的均值作为逐月典型日负荷曲线,更准确地反映了负荷曲线的季节性变化和趋势。该方法适用于具有高波动性和复杂性负荷特征的现代电力系统,能够应对多变的负荷数据,为电力系统规划提供更可靠的数据支持。综上所述,本发明在数据清洗、模型优化、多算法融合及负荷曲线确定等方面均取得了显著进步,显著提升了电力系统负荷预测的精度和可靠性。
1.一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,步骤s1中,所述的数据清洗包括缺失值处理和异常值处理:
3.根据权利要求2所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,所述采用局部异常因子算法识别历史电力负荷数据中的异常数据点具体包括:计算历史电力负荷数据中每个数据点的局部离群因子,若局部离群因子大于预设阈值时,该数据点被认为是异常数据点。
4.根据权利要求1所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,所述基于清洗后的负荷数据预测目标年每日最大负荷,具体包括:对于清洗后的负荷数据,查找历史每日的最大负荷数据,将每日的最大负荷数据输入预训练的自回归积分滑动平均模型,模型预测得到目标年的每日最大电力负荷数据。
5.根据权利要求4所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,所述自回归积分滑动平均模型通过贝叶斯优化确定最优参数,优化的目标函数为预测值和实际值的均方根误差。
6.根据权利要求1所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,步骤s3中,所述归一化具体包括:
7.根据权利要求1所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,步骤s3中,所述基于归一化后的负荷数据预测目标年每日归一化负荷曲线,具体包括:所述随机森林模型包括多棵决策树,决策树基于归一化后的负荷数据对目标年的负荷数据进行预测,目标年负荷数据的最终预测值为所有决策树预测值的平均值,目标年每日各时间点的负荷数据最终预测值构成目标年每日归一化负荷曲线。
8.根据权利要求7所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,所述随机森林模型通过贝叶斯优化确定最优参数,优化的目标函数为预测值和实际值的均方根误差。
9.根据权利要求1所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,所述步骤s4包括:将预测的目标年每日最大负荷与目标年每日归一化负荷曲线相乘,即得到目标年日负荷预测曲线。
10.根据权利要求1所述的一种基于多算法融合的规划目标年典型日负荷曲线确定方法,其特征在于,所述步骤s5具体包括:
