本发明涉及配电网控制,特别是一种基于配电网动态过程特征参数的数据聚类方法及系统。
背景技术:
1、在全球能源需求持续增长和环境挑战日益加剧的背景下,可再生能源的开发和应用成为了全球能源战略中的关键部分;随着新能源产业的蓬勃发展,新能源机组的装机容量不断攀升,新能源在配电网中的接入比例也日益增加,然而这种增长也带来了挑战,新能源的高渗透率极大地改变了配电网的动态特性,使得配电网结构日益复杂,分析和监测的难度也随之增加;研究人员通常依赖于详细的模型来研究配电网的动态特性,但建立这些模型需要准确的网络和新能源设备接入信息,而这些信息往往难以获得,此外详尽的动态模型还需要大量的计算资源,导致仿真时间过长;为了降低配电网动态仿真的计算负担,提出了建立动态等值模型的方法,然而现有的动态等值模型受到天气变化、系统随机行为以及负荷时变性的影响,其参数仅在特定运行条件下有效,无法精确模拟不同情况下的配电网动态。
2、此外,目前常见的解决方案存在诸多缺点,包括:当前大多数针对动态数据的聚类算法都集中于特定设备的动态特征参数,例如可以根据感应电动机的特征值距离和端口电压的动态相似性来对其进行聚类、以风力发电机的输入风力和输出功率作为聚类指标或依据光伏电站在受到干扰后出口电压的下降程度和电压波动的相似性来进行分组;然而在配电网中,由于设备数量和类型的具体数据难以获取,再加上大量新能源设备以分布式电源的形式接入用户侧,具体的安装数量和位置变得更加难以掌握,且这些数据与配电网负荷数据紧密相关。
技术实现思路
1、鉴于对配电网动态过程特征参数进行数据聚类时,现有技术中由于设备数量和类型的具体数据难以获取,大量新能源设备以分布式电源的形式接入用户侧,具体的安装数量和位置变得更加难以掌握,导致参数仅在特定运行条件下有效,无法精确模拟不同情况下的配电网动态等问题,提出了本发明。
2、因此,本发明所要解决的问题在于如何提供一种基于动态过程特征参数的数据聚类方法,重点关注配电网区域整体的动态过程,增强后续等值模型的鲁棒性和通用性,为配电网的有效管理和优化提供更为可靠的数据支持的方法。
3、为解决上述技术问题,本发明提供如下技术方案:
4、第一方面,本发明实施例提供了一种基于配电网动态过程特征参数的数据聚类方法,其包括采集并网点的动态响应数据并构建数据集,将所述数据集存储至数据库中;利用施加扰动前的并网点稳态数据的扰动前稳态值对所述数据集进行预处理,得到预处理后的数据集;基于动态响应数据和稳态数据利用k均值聚类算法k-means++对所述预处理后的数据集进行聚类。
5、作为本发明所述基于配电网动态过程特征参数的数据聚类方法的一种优选方案,其中:所述动态响应数据包括电压vi、有功功率pi和无功功率qi;所述采集并网点的动态响应数据通过在配电网等值区域并网点施加n次不同的扰动,收集并网点的动态响应数据;所述稳态数据包括电压v0,i、有功功率p0,i和无功功率q0,i;所述预处理通过利用施加扰动前的并网点稳态数据的扰动前稳态值对数据集中的动态响应数据进行归一化处理。
6、作为本发明所述基于配电网动态过程特征参数的数据聚类方法的一种优选方案,其中:对所述预处理后的数据集进行聚类包括以下步骤:将每个数据集的特征值组合为一维向量;根据构建的n个数据集和一维向量形成一组含n个基准值向量的向量;将含n个基准值向量的向量输入至k均值聚类算法k-means++中,并设定聚类簇数k;在含n个基准值向量的向量之间随机选择一个聚类中心;计算每个非中心点到现有聚类中心之间的距离dx;利用加权概率分布随机选取新的数据点作为新的聚类中心;判断是否取得k个聚类中心,若未取得k个聚类中心,则重新进行计算每个非中心点到现有聚类中心之间的距离dx步骤,若已取得k个聚类中心,则进行下一个步骤;计算每个向量xi到聚类中心的距离并分配到距离最近的聚类中;对每个聚类的中心进行更新,使聚类的中心成为对应聚类中所有点的均值;判断聚类中心是否变化,若聚类中心发生变化,则重新进行计算剩余数据点到聚类中心的距离并分配到最近的中心簇步骤,若聚类中心未发生变化,则进行下一个步骤;重复进行迭代,将每个聚类内的平方和最小化。
7、作为本发明所述基于配电网动态过程特征参数的数据聚类方法的一种优选方案,其中:所述一维向量的具体公式如下:
8、
9、其中,xi为每个数据集的特征值组合成的一维向量;v0,i为稳态数据中的电压;v+,i为扰动瞬间并网点电压跌落值;vs,i为扰动后电压新的稳态值;p0,i为稳态数据中的有功功率;p+,i为扰动瞬间的有功功率值;ps,i为有功功率新的稳态值;q0,i为稳态数据中的无功功率;q+,i为扰动瞬间的无功功率值;qs,i为无功功率新的稳态值;所述含n个基准值向量的向量的具体公式如下:
10、x={x1,x2,...,xn}
11、其中,x为含n个基准值向量的向量;xn为第n个数据集的特征值组合成的一维向量。
12、作为本发明所述基于配电网动态过程特征参数的数据聚类方法的一种优选方案,其中:所述分配到距离最近的聚类中的计算公式如下:
13、
14、其中,为在第t次迭代时分配给聚类中心μp的样本集合;μp为聚类中心;为第t次迭代时的聚类中心;j为第j个聚类;k为聚类中心总数。
15、作为本发明所述基于配电网动态过程特征参数的数据聚类方法的一种优选方案,其中:所述对每个聚类的中心进行更新的计算公式如下:
16、
17、其中,为第t+1次迭代时聚类中心p的位置;为当前分配给聚类中心p的样本集合;为当前分配给聚类中心p的样本集合中的样本数量;xi为样本集合中的数据样本。
18、作为本发明所述基于配电网动态过程特征参数的数据聚类方法的一种优选方案,其中:所述将每个聚类内的平方和最小化的计算公式如下:
19、
20、其中,cmin为最小化每个聚类中心内的平方和;k为聚类中心数量;sk为第k个聚类的样本集合;μk为第k个聚类中的样本的中心。
21、第二方面,本发明为进一步解决配电网数据聚类中存在的安全问题,实施例提供了一种基于配电网动态过程特征参数的数据聚类系统,其包括:数据采集模块,用于在配电网等值区域并网点施加不同的扰动,收集并网点的动态响应数据和施加扰动前的并网点的稳态数据;特征参数模块,用于根据动态响应数据和稳态数据构建含基准值向量的向量,确定作为数据聚类的特征参数;数据聚类模块,用于利用k均值聚类算法k-means++对特征参数进行聚类。
22、第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的一种基于配电网动态过程特征参数的数据聚类方法的任一步骤。
23、第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的一种基于配电网动态过程特征参数的数据聚类方法的任一步骤。
24、本发明有益效果为:本发明通过忽略配电网系统内部网络结构与设备组成,选取配电网并网点的数据作为特征参数,能够适应配电网结构和运行模式的变化,同时不需要系统内部大量详细数据的获取,增强了数据获取的便利性;基于特征参数对配电网动态过程中产生的大量数据进行聚类处理,可以减少数据处理的复杂度和计算量,提高对配电网动态特征进行分析和研究的效率。
1.一种基于配电网动态过程特征参数的数据聚类方法,其特征在于:包括:
2.如权利要求1所述的基于配电网动态过程特征参数的数据聚类方法,其特征在于:所述动态响应数据包括电压vi、有功功率pi和无功功率qi;
3.如权利要求2所述的基于配电网动态过程特征参数的数据聚类方法,其特征在于:对所述预处理后的数据集进行聚类包括以下步骤:
4.如权利要求3所述的基于配电网动态过程特征参数的数据聚类方法,其特征在于:所述一维向量的具体公式如下:
5.如权利要求4所述的基于配电网动态过程特征参数的数据聚类方法,其特征在于:所述分配到距离最近的聚类中的计算公式如下:
6.如权利要求5所述的基于配电网动态过程特征参数的数据聚类方法,其特征在于:所述对每个聚类的中心进行更新的计算公式如下:
7.如权利要求6所述的基于配电网动态过程特征参数的数据聚类方法,其特征在于:所述将每个聚类内的平方和最小化的计算公式如下:
8.一种基于配电网动态过程特征参数的数据聚类系统,基于权利要求1~7任一所述的一种基于配电网动态过程特征参数的数据聚类方法,其特征在于:包括,
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述的一种基于配电网动态过程特征参数的数据聚类方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述的一种基于配电网动态过程特征参数的数据聚类方法的步骤。
