本发明属于信息处理,具体涉及一种基于大语言模型的可信内容生成方法、装置、设备、介质及产品。
背景技术:
1、随着人工智能技术的不断发展,大语言模型(large language model,llm,其是基于海量文本数据训练的深度学习模型,它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答和翻译等)在内容生成方面展现出了巨大的潜力,有希望大幅提升内容生产的效率。
2、然而,目前基于大语言模型生成的内容存在可信安全的问题,即现有基于大语言模型的内容生成方案通常缺乏对生成内容的可信度评估和保障机制,易导致生成内容可能存在事实错误和安全风险,严重制约了其在严肃媒体领域等实际内容生产场景中的应用(因在严肃媒体领域对内容可信及安全有强要求)。因此,如何提高基于大语言模型生成的内容的可信度,以便促成大语言模型生成能力在严肃媒体领域内容创作方向的落地应用,是本领域技术人员亟需研究的课题。
技术实现思路
1、本发明的目的是提供一种基于大语言模型的可信内容生成方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,用以解决现有基于大语言模型的内容生成方案因缺乏对生成内容的可信度评估和保障机制而易导致生成内容可能存在事实错误和安全风险的问题。
2、为了实现上述目的,本发明采用以下技术方案:
3、第一方面,提供了一种基于大语言模型的可信内容生成方法,包括:
4、获取正向价值对齐数据集;
5、基于所述正向价值对齐数据集,应用模型微调方式lora对已完成预训练的且用于内容生成的大语言模型进行指令微调处理,得到新的大语言模型;
6、根据创作指定主题,从预先构建的可信新闻库中选取与所述创作指定主题匹配的可信新闻作为创作素材;
7、以所述创作素材中的新闻标题为主题和以所述创作素材中的新闻内容为参考内容构建创作指令;
8、驱动所述新的大语言模型根据所述创作指令进行内容创作,得到创作内容;
9、对所述创作内容与所述创作素材进行一致性评估,得到一致性评估结果;
10、判断所述一致性评估结果是否达到预设条件;
11、若是,则将所述创作内容作为生成的可信内容予以输出。
12、基于上述
技术实现要素:
,提供了一种能够对生成内容进行可信度评估和保障机制的且基于大语言模型的内容生成新方案,即先基于正向价值对齐数据集,应用lora对用于内容生成的大语言模型进行指令微调处理以得到新的大语言模型,然后根据创作指定主题,从可信新闻库中选取创作素材,并基于创作素材构建创作指令,再然后驱动大语言模型根据创作指令进行内容创作以得到创作内容,并对创作内容与创作素材进行一致性评估以得到一致性评估结果,最后在判定一致性评估结果达到预设条件时,才将创作内容作为生成的可信内容予以输出,如此可提高大语言模型生成内容的可信度和安全性,降低生成内容存在事实错误的可能性和安全风险,进而可促成大语言模型生成能力在严肃媒体领域内容创作方向的落地应用,便于实际应用和推广。
13、在一个可能的设计中,在判断所述一致性评估结果是否达到预设条件之后,所述方法还包括:
14、若判定所述一致性评估结果未达到所述预设条件,则建立ai反馈强化学习rlaif机制且辅以模型训练方式rlhf微调所述新的大语言模型,得到最新的大语言模型;
15、驱动所述最新的大语言模型根据所述创作指令进行内容创作,得到新的创作内容;
16、对所述新的创作内容与所述创作素材进行一致性评估,得到新的一致性评估结果;
17、判断所述新的一致性评估结果是否达到所述预设条件;
18、若是,则将所述新的创作内容作为生成的可信内容予以输出。
19、在一个可能的设计中,所述可信新闻库的构建过程,包括:
20、获取可信源列表,其中,所述可信源列表记录有多个可信新闻网站;
21、针对在所述多个可信新闻网站中的各个可信新闻网站,从对应网站上爬取得到可信新闻数据;
22、对所述可信新闻数据进行分割处理,得到可信新闻的新闻标题和新闻内容;
23、对所述新闻内容进行重叠分段处理,得到无重叠的多个段落;
24、针对在所述多个段落中的各个段落,从对应段落中抽取出对应的关键词、实体、主题、事件和/或嵌入embedding向量;
25、根据所有所述段落的关键词、实体、主题、事件和/或嵌入embedding向量,建立针对所有所述可信新闻的倒排索引;
26、将所有所述可信新闻以及所述倒排索引存入elasticsearch数据库中,得到所述可信新闻库。
27、在一个可能的设计中,根据创作指定主题,从预先构建的可信新闻库中选取与所述创作指定主题匹配的可信新闻作为创作素材,包括:
28、从创作指定主题的主题内容中抽取出所述创作指定主题的关键词、实体、主题、事件和/或嵌入embedding向量;
29、利用所述倒排索引对所述创作指定主题的关键词、实体、主题、事件和/或嵌入embedding向量进行多粒度的相似检索,得到从所述可信新闻库中检索出的且从按照相似度从高至低顺序依次排列的可信新闻队列中抽取的前n条可信新闻,其中,n表示正整数;
30、将所述前n条可信新闻作为与所述创作指定主题匹配的可信新闻,并进一步作为创作素材。
31、在一个可能的设计中,对所述创作内容与所述创作素材进行一致性评估,得到一致性评估结果,包括:
32、对所述创作内容和所述创作素材分别进行语义结构化理解处理,得到所述创作内容的实体、主题和事件以及所述创作素材的实体、主题和事件;
33、将所述创作内容的实体、主题和事件以及所述创作素材的实体、主题和事件导入基于梯度提升决策树gbdt模型预训练得到的且用于融合实体对齐维度、主题分布相似匹配维度和事件对齐维度对两对象进行一致性评估的一致性评估模型,输出得到一致性评估结果。
34、在一个可能的设计中,在将所述创作内容作为生成的可信内容予以输出之后,所述方法还包括:
35、对所述创作内容和所述创作素材分别进行语义结构化理解处理,得到所述创作内容的实体和/或事件以及所述创作素材的实体和/或事件;
36、对所述创作内容的实体与所述创作素材的实体进行实体匹配对齐处理,得到对齐实体对的映射关系,和/或对所述创作内容的事件与所述创作素材的事件进行事件匹配对齐处理,得到对齐事件对的映射关系,其中,所述对齐实体对中的一个实体属于所述创作内容的实体,所述对齐实体对中的另一个实体属于所述创作素材的实体,所述对齐事件对中的一个事件属于所述创作内容的事件,所述对齐事件对中的另一个事件属于所述创作素材的事件;
37、将所述对齐实体对的映射关系和/或所述对齐事件对的映射关系与所述创作素材的链接信息/和所述一致性评估结果一起作为可信参考信息予以输出。
38、第二方面,提供了一种基于大语言模型的可信内容生成装置,包括有数据集获取单元、指令微调处理单元、创作素材选取单元、创作指令构建单元、内容创作驱动单元、一致性评估单元、评估结果判断单元和可信内容输出单元;
39、所述数据集获取单元,用于获取正向价值对齐数据集;
40、所述指令微调处理单元,通信连接所述数据集获取单元,用于基于所述正向价值对齐数据集,应用模型微调方式lora对已完成预训练的且用于内容生成的大语言模型进行指令微调处理,得到新的大语言模型;
41、所述创作素材选取单元,用于根据创作指定主题,从预先构建的可信新闻库中选取与所述创作指定主题匹配的可信新闻作为创作素材;
42、所述创作指令构建单元,通信连接所述创作素材选取单元,用于以所述创作素材中的新闻标题为主题和以所述创作素材中的新闻内容为参考内容构建创作指令;
43、所述内容创作驱动单元,分别通信连接所述创作指令构建单元和所述指令微调处理单元,用于驱动所述新的大语言模型根据所述创作指令进行内容创作,得到创作内容;
44、所述一致性评估单元,分别通信连接所述内容创作驱动单元和所述创作素材选取单元,用于对所述创作内容与所述创作素材进行一致性评估,得到一致性评估结果;
45、所述评估结果判断单元,通信连接所述一致性评估单元,用于判断所述一致性评估结果是否达到预设条件;
46、所述可信内容输出单元,通信连接所述评估结果判断单元,用于在判定所述一致性评估结果达到所述预设条件时,将所述创作内容作为生成的可信内容予以输出。
47、第三方面,本发明提供了一种计算机设备,包括有依次通信连接的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意可能设计所述的基于大语言模型的可信内容生成方法。
48、第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意可能设计所述的基于大语言模型的可信内容生成方法。
49、第五方面,本发明提供了一种计算机程序产品,包括计算机程序或指令,所述计算机程序或所述指令在被计算机执行时实现如第一方面或第一方面中任意可能设计所述的基于大语言模型的可信内容生成方法。
50、上述方案的有益效果:
51、(1)本发明创造性提供了一种能够对生成内容进行可信度评估和保障机制的且基于大语言模型的内容生成新方案,即先基于正向价值对齐数据集,应用lora对用于内容生成的大语言模型进行指令微调处理以得到新的大语言模型,然后根据创作指定主题,从可信新闻库中选取创作素材,并基于创作素材构建创作指令,再然后驱动大语言模型根据创作指令进行内容创作以得到创作内容,并对创作内容与创作素材进行一致性评估以得到一致性评估结果,最后在判定一致性评估结果达到预设条件时,才将创作内容作为生成的可信内容予以输出,如此可提高大语言模型生成内容的可信度和安全性,降低生成内容存在事实错误的可能性和安全风险,进而可促成大语言模型生成能力在严肃媒体领域内容创作方向的落地应用,便于实际应用和推广。
1.一种基于大语言模型的可信内容生成方法,其特征在于,包括:
2.根据权利要求1所述的可信内容生成方法,其特征在于,在判断所述一致性评估结果是否达到预设条件之后,所述方法还包括:
3.根据权利要求1所述的可信内容生成方法,其特征在于,所述可信新闻库的构建过程,包括:
4.根据权利要求3所述的可信内容生成方法,其特征在于,根据创作指定主题,从预先构建的可信新闻库中选取与所述创作指定主题匹配的可信新闻作为创作素材,包括:
5.根据权利要求1所述的可信内容生成方法,其特征在于,对所述创作内容与所述创作素材进行一致性评估,得到一致性评估结果,包括:
6.根据权利要求1所述的可信内容生成方法,其特征在于,在将所述创作内容作为生成的可信内容予以输出之后,所述方法还包括:
7.一种基于大语言模型的可信内容生成装置,其特征在于,包括有数据集获取单元、指令微调处理单元、创作素材选取单元、创作指令构建单元、内容创作驱动单元、一致性评估单元、评估结果判断单元和可信内容输出单元;
8.一种计算机设备,其特征在于,包括有依次通信连接的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~6中任意一项所述的可信内容生成方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~6中任意一项所述的可信内容生成方法。
10.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或所述指令在被计算机执行时实现如权利要求1~6中任意一项所述的可信内容生成方法。
