基于融合大语言模型的告警研判方法及系统与流程

xiaoxiao8月前  64


本发明涉及大语言模型,具体地,涉及一种基于融合大语言模型的告警研判方法及系统。


背景技术:

1、大型企业的信息系统包含的子系统通常种类繁多、相互关联;一般情况下,这些不同的子系统由于其供应商或技术原因会具备各自独立的告警子系统。某个局部点的异常,往往会造成多个与之关联的告警子系统出现告警,而后由人工对来自各个子系统的信息进行汇总分析、找到根因。这一过程会耗费较多的人力和时间。

2、大语言模型(llm)可以回答输入的用户问题,但不同的llm各有侧重,如有些llm适合综合推理、有些擅长程序找错、有些具备更多的网络知识等,但对于来自多个子系统的复杂告警信息无法通过单一现有模型实现研判。

3、在公开号为cn115858226a的中国专利文献中,公开了一种基于人工智能的智能运维系统,涉及智能运维系统领域。该基于人工智能的智能运维系统包括数据采集管理模块、智能告警分析模块、智能指标分析模块、智能日志分析模块、智能运营决策模块和ai运维中台。但该专利文献中使用传统的统计机器学习类模型进行给类指标的解读、生成告警;而本发明主要基于大语言模型支撑下进行告警分析、推理,与该专利文献采用的技术方法具有本质性不同。

4、在公开号为cn111294217a的中国专利文献中,公开了一种告警分析方法、装置、系统及存储介质,应用于运维监控领域,其中,告警分析方法,包括:导入业务系统拓扑图;获取节点匹配规则;在接收到告警消息后,根据所述告警消息以及节点匹配规则确定告警消息对应的目标节点,将所述告警消息以可视化的形式呈现在所述目标节点所在的业务系统拓扑图上。但该专利文献是通过业务拓扑图和预设定的规则进行告警匹配、分析;而本发明是基于大语言模型支撑下进行告警分析、推理,与该专利文献采用的技术方法具有本质性不同。


技术实现思路

1、针对现有技术中的缺陷,本发明的目的是提供一种基于融合大语言模型的告警研判方法及系统。

2、根据本发明提供的一种基于融合大语言模型的告警研判方法,包括:

3、步骤s1:将各个告警子系统接入对应的装置,采集并处理相关信息;

4、所述装置包括告警子系统告警接入装置、告警解释模型和综合推理模型筛选装置、告警解释模型融合装置和告警研判装置;

5、步骤s2:筛选出满足预设条件的大语言模型后进行融合;

6、步骤s3:基于融合后的大语言模型,输出研判结果。

7、优选的,所述步骤s1包括输入子系统的原始告警信息,输出自然语言告警信息。

8、优选的,所述步骤s1包括以下子步骤:

9、步骤s1.1:告警信息描述模板库模块存储针对不同类型告警子系统告警信息的模板;所述告警信息描述模板库模块能够根据用户系统的操作定制模板;

10、步骤s1.2:原始告警文本生成模块输入各个告警子系统的原始告警信息,根据不同的告警子系统类型从模板库中挑选对应的描述模板,填充模板后生成告警的自然语言描述。

11、优选的,所述步骤s2包括以下子步骤:

12、步骤s2.1:基于不同告警子系统的自然语言告警信息和推理场景信息,筛选出各自满足预设条件的大语言模型;

13、步骤s2.2:输入满足预设条件的大语言模型,融合所有大语言模型对各个不同告警源的解释能力,输出一个融合的告警解释大语言模型。

14、优选的,所述步骤s2.1基于告警解释模型选择模块和告警综合推理的模型选择模块筛选满足预设条件的大语言模型;所述告警解释模型选择模块的输入包括告警信息的自然语言描述,输出包括用于解释每个告警类型的大语言模型名称;所述告警综合推理的模型选择模块的输入包括告警语言描述集合和alertselectedmodelset,输出包括告警综合推理的大语言模型名称。

15、优选的,所述步骤s2.1包括以下子步骤:

16、步骤s2.1.1:收集告警自然语言描述,构建告警语言描述集合;将告警自然语言描述文本添加命令提示,所述命令提示包括要求模型输出告警类型;构建告警分析指令集合;所述告警分析指令集合中的每个元素为分析指令;

17、步骤s2.1.2:对所有候选大语言模型逐一输入告警语言描述集合中的每个元素,计算对应的perplexity;基于模型输出内容,抽出其中的告警类型,告警类型和模型名对模型输出的perplexity进行聚合,并求取perplexity的均值,得到alertmodelperplexity集合;所述alertmodelperplexity集合中的每个元素为“告警类型、模型名、平均perlexity”构成的三元组;

18、步骤s2.1.3:对所有候选大语言模型逐一输入告警分析指令集合中的每个元素,所述元素包括分析指令,记录返回值,得到alertmodelresponse集合;所述alertmodelresponse集合中每个元素为“分析指令、模型名、告警解释描述”构成的三元组;

19、步骤s2.1.4:将alertmodelresponse中每个元素的指令与返回语句部分结合构成评分指令,使所有候选模型给出合理性评分及均值,得到alertmodelrespscore集合;所述alertmodelrespscore集合中每个元素为告警类型、模型名和合理性平均打分的三元组;

20、步骤s2.1.5:将alertmodelperplexity和alertmodelrespscore中具备相同的告警类型和模型名的记录计算“1 / 平均perplexity”和“合理性平均打分”的均值,该均值称为模型的“综合合理性打分”;对于某一告警类型,将“综合合理性打分”最高的记录所对应的模型称为该告警类型的优选模型,每个告警类型和其优选模型构成二元组,多个所述二元组构成告警类型优选模型集合,并记为alertselectedmodelset;

21、步骤s2.1.6:将告警语言描述集合中的每个告警输入最适合该告警的模型中并输出相应的描述,将描述组合后得到selectedmodelrespset集合;所述selectedmodelrespset集合中每个元素为告警时间和告警解释描述的二元组;

22、步骤s2.1.7:构建诊断描述集合,对selectedmodelrespset中的元素使用dbscan算法并以发生时间为特征进行聚类,将预设时间内发生的告警聚为一个簇,将同一个簇内的元素进行组合并加上任务描述,得到告警综合推理模型的推理指令;

23、步骤s2.1.8:将诊断描述集合中的每个元素逐一输入至所有候选大语言模型中,记录返回值,得到diagnosemodelresp集合;所述diagnosemodelresp集合中每个元素为推理指令、模型名和推理结论的三元组;

24、步骤s2.1.9:将diagnosemodelresp中每个元素的推理指令与推理结论部分结合构成推理评分指令,使所有候选模型给出合理性评分并给出均值,得到diagnosemodelrespscore集合;所述diagnosemodelrespscore集合中每个元素为推理指令、模型名和推理合理性打分的三元组;

25、步骤s2.1.10:将diagnosemodelrespscore中具备相同的模型名的记录计算推理合理性打分的均值,将具备最高均值的模型选择为告警综合推理模型。

26、优选的,所述步骤s2.2包括以下子步骤:

27、步骤s2.2.1:构建多个告警解释模型的统一词表;

28、步骤s2.2.2:构建并初始化未训练的融合模型;所述模型的架构符合transformer的decoder部分;排序vocubcommon中词语并从0开始编码,将得到的词语的有序序列作为所述模型的词表;

29、步骤s2.2.3:准备训练样本,根据alertselectedmodelset集合中告警类型与模型的关系,选择告警分析指令集合中每条告警指令最适合的模型,记为alertmodel_i,通过模型计算该条指令的权重向量,记为alertweightvec_i;所述权重向量alertweightvec_i的每一个维度对应alertmodel_i的词表中的一个值,按照vocubcommon的顺序调整alertweightvec_i中的数值顺序,向量缺失部分填充0,新的向量记为alertcommonweightvec_i,称为告警解释描述向量;生成告警分析指令集合中每条数据的向量,构建训练集合为trainset;所述训练集合中每个元素为分析指令和告警解释描述向量的二元组;

30、步骤s2.2.4:训练融合模型;所述训练包括将trainset中的每条样本的分析指令部分送入初始化未训练的融合模型中得到pred_vec,将pred_vec与样本的告警解释描述向量求交叉熵作为损失,基于adam算法更新初始化未训练的融合模型,得到训练后的模型alertcommonmodel。

31、优选的,所述步骤s3包括输入各告警子系统的告警信号,解释高新信号并综合推理告警原因,输出研判结果。

32、优选的,所述步骤s3包括以下子步骤:

33、步骤s3.1:将告警转化为告警解释描述;接收告警信息并输入融合模型,得到告警解释描述;所述融合模型为训练后的模型;

34、步骤s3.2:将预设时间窗口内的告警解释描述构建为推理指令;

35、步骤s3.3:将推理指令输入告警综合推理模型,将输出作为告警研判信息。

36、根据本发明提供的一种基于融合大语言模型的告警研判系统,包括:

37、模块m1:将各个告警子系统接入对应的装置,采集并处理相关信息;

38、所述装置包括告警子系统告警接入装置、告警解释模型和综合推理模型筛选装置、告警解释模型融合装置和告警研判装置;

39、模块m2:筛选出满足预设条件的大语言模型后进行融合;

40、模块m3:基于融合后的大语言模型,输出研判结果。

41、优选的,所述模块m1包括输入子系统的原始告警信息,输出自然语言告警信息。

42、优选的,所述模块m1包括以下子模块:

43、模块m1.1:告警信息描述模板库模块存储针对不同类型告警子系统告警信息的模板;所述告警信息描述模板库模块能够根据用户系统的操作定制模板;

44、模块m1.2:原始告警文本生成模块输入各个告警子系统的原始告警信息,根据不同的告警子系统类型从模板库中挑选对应的描述模板,填充模板后生成告警的自然语言描述。

45、优选的,所述模块m2包括以下子模块:

46、模块m2.1:基于不同告警子系统的自然语言告警信息和推理场景信息,筛选出各自满足预设条件的大语言模型;

47、模块m2.2:输入满足预设条件的大语言模型,融合所有大语言模型对各个不同告警源的解释能力,输出一个融合的告警解释大语言模型。

48、优选的,所述模块m2.1基于告警解释模型选择模块和告警综合推理的模型选择模块筛选满足预设条件的大语言模型;所述告警解释模型选择模块的输入包括告警信息的自然语言描述,输出包括用于解释每个告警类型的大语言模型名称;所述告警综合推理的模型选择模块的输入包括告警语言描述集合和alertselectedmodelset,输出包括告警综合推理的大语言模型名称。

49、优选的,所述模块m2.1包括以下子模块:

50、模块m2.1.1:收集告警自然语言描述,构建告警语言描述集合;将告警自然语言描述文本添加命令提示,所述命令提示包括要求模型输出告警类型;构建告警分析指令集合;所述告警分析指令集合中的每个元素为分析指令;

51、模块m2.1.2:对所有候选大语言模型逐一输入告警语言描述集合中的每个元素,计算对应的perplexity;基于模型输出内容,抽出其中的告警类型,告警类型和模型名对模型输出的perplexity进行聚合,并求取perplexity的均值,得到alertmodelperplexity集合;所述alertmodelperplexity集合中的每个元素为“告警类型、模型名、平均perlexity”构成的三元组;

52、模块m2.1.3:对所有候选大语言模型逐一输入告警分析指令集合中的每个元素,所述元素包括分析指令,记录返回值,得到alertmodelresponse集合;所述alertmodelresponse集合中每个元素为“分析指令、模型名、告警解释描述”构成的三元组;

53、模块m2.1.4:将alertmodelresponse中每个元素的指令与返回语句部分结合构成评分指令,使所有候选模型给出合理性评分及均值,得到alertmodelrespscore集合;所述alertmodelrespscore集合中每个元素为告警类型、模型名和合理性平均打分的三元组;

54、模块m2.1.5:将alertmodelperplexity和alertmodelrespscore中具备相同的告警类型和模型名的记录计算“1 / 平均perplexity”和“合理性平均打分”的均值,该均值称为模型的“综合合理性打分”;对于某一告警类型,将“综合合理性打分”最高的记录所对应的模型称为该告警类型的优选模型,每个告警类型和其优选模型构成二元组,多个所述二元组构成告警类型优选模型集合,并记为alertselectedmodelset;

55、模块m2.1.6:将告警语言描述集合中的每个告警输入最适合该告警的模型中并输出相应的描述,将描述组合后得到selectedmodelrespset集合;所述selectedmodelrespset集合中每个元素为告警时间和告警解释描述的二元组;

56、模块m2.1.7:构建诊断描述集合,对selectedmodelrespset中的元素使用dbscan算法并以发生时间为特征进行聚类,将预设时间内发生的告警聚为一个簇,将同一个簇内的元素进行组合并加上任务描述,得到告警综合推理模型的推理指令;

57、模块m2.1.8:将诊断描述集合中的每个元素逐一输入至所有候选大语言模型中,记录返回值,得到diagnosemodelresp集合;所述diagnosemodelresp集合中每个元素为推理指令、模型名和推理结论的三元组;

58、模块m2.1.9:将diagnosemodelresp中每个元素的推理指令与推理结论部分结合构成推理评分指令,使所有候选模型给出合理性评分并给出均值,得到diagnosemodelrespscore集合;所述diagnosemodelrespscore集合中每个元素为推理指令、模型名和推理合理性打分的三元组;

59、模块m2.1.10:将diagnosemodelrespscore中具备相同的模型名的记录计算推理合理性打分的均值,将具备最高均值的模型选择为告警综合推理模型。

60、优选的,所述模块m2.2包括以下子模块:

61、模块m2.2.1:构建多个告警解释模型的统一词表;

62、模块m2.2.2:构建并初始化未训练的融合模型;所述模型的架构符合transformer的decoder部分;排序vocubcommon中词语并从0开始编码,将得到的词语的有序序列作为所述模型的词表;

63、模块m2.2.3:准备训练样本,根据alertselectedmodelset集合中告警类型与模型的关系,选择告警分析指令集合中每条告警指令最适合的模型,记为alertmodel_i,通过模型计算该条指令的权重向量,记为alertweightvec_i;所述权重向量alertweightvec_i的每一个维度对应alertmodel_i的词表中的一个值,按照vocubcommon的顺序调整alertweightvec_i中的数值顺序,向量缺失部分填充0,新的向量记为alertcommonweightvec_i,称为告警解释描述向量;生成告警分析指令集合中每条数据的向量,构建训练集合为trainset;所述训练集合中每个元素为分析指令和告警解释描述向量的二元组;

64、模块m2.2.4:训练融合模型;所述训练包括将trainset中的每条样本的分析指令部分送入初始化未训练的融合模型中得到pred_vec,将pred_vec与样本的告警解释描述向量求交叉熵作为损失,基于adam算法更新初始化未训练的融合模型,得到训练后的模型alertcommonmodel。

65、优选的,所述模块m3包括输入各告警子系统的告警信号,解释高新信号并综合推理告警原因,输出研判结果。

66、优选的,所述模块m3包括以下子模块:

67、模块m3.1:将告警转化为告警解释描述;接收告警信息并输入融合模型,得到告警解释描述;所述融合模型为训练后的模型;

68、模块m3.2:将预设时间窗口内的告警解释描述构建为推理指令;

69、模块m3.3:将推理指令输入告警综合推理模型,将输出作为告警研判信息。

70、与现有技术相比,本发明具有如下的有益效果:

71、1、本发明通过大语言模型实现了告警指令到文字描述的转换、多个告警文字描述到根因的推理,实现了跨系统的告警信息协同,提高了跨系统告警分析、诊断的效率,达到了低成本的不同系统间的告警信息交互的效果。

72、2、本发明提出的装置能够根据每个告警子系统的告警内容选择各自合适的llm,而后通过蒸馏技术融合出一个专用的研判模型,最后经由融合大语言模型实现告警研判,具有较高的实用性。

73、3、本发明提高了对于复杂告警的研判速度,可用于为不同的信息系统自动生成融合模型,具备较低的实施成本及较好的实用性。

74、本发明的其他有益效果,将在具体实施方式中通过具体技术特征和技术方案的介绍来阐述,本领域技术人员通过这些技术特征和技术方案的介绍,应能理解所述技术特征和技术方案带来的有益技术效果。


技术特征:

1.一种基于融合大语言模型的告警研判方法,其特征在于,包括:

2.根据权利要求1所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s1包括输入子系统的原始告警信息,输出自然语言告警信息。

3.根据权利要求2所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s1包括以下子步骤:

4.根据权利要求1所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s2包括以下子步骤:

5.根据权利要求4所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s2.1基于告警解释模型选择模块和告警综合推理的模型选择模块筛选满足预设条件的大语言模型;所述告警解释模型选择模块的输入包括告警信息的自然语言描述,输出包括用于解释每个告警类型的大语言模型名称;所述告警综合推理的模型选择模块的输入包括告警语言描述集合和alertselectedmodelset,输出包括告警综合推理的大语言模型名称。

6.根据权利要求5所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s2.1包括以下子步骤:

7.根据权利要求4所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s2.2包括以下子步骤:

8.根据权利要求7所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s3包括输入各告警子系统的告警信号,解释高新信号并综合推理告警原因,输出研判结果。

9.根据权利要求8所述的一种基于融合大语言模型的告警研判方法,其特征在于,所述步骤s3包括以下子步骤:

10.一种基于融合大语言模型的告警研判系统,其特征在于,包括:


技术总结
本发明提供了一种基于融合大语言模型的告警研判方法及系统,包括步骤S1:将各个告警子系统接入对应的装置,采集并处理相关信息;所述装置包括告警子系统告警接入装置、告警解释模型和综合推理模型筛选装置、告警解释模型融合装置和告警研判装置;步骤S2:筛选出满足预设条件的大语言模型后进行融合;步骤S3:基于融合后的大语言模型,输出研判结果。本发明通过大语言模型实现了告警指令到文字描述的转换、多个告警文字描述到根因的推理,实现了跨系统的告警信息协同,提高了跨系统告警分析、诊断的效率,达到了低成本的不同系统间的告警信息交互的效果。

技术研发人员:申毅
受保护的技术使用者:上海天旦网络科技发展有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)