本发明属于自然语言处理(nlp)和人工智能(ai),特别是一种基于大型语言模型的实体关系抽取方法。
背景技术:
1、关系抽取旨在从文本中识别预定义的实体对之间的语义关系,是知识获取和自然语言理解的核心任务。早期的关系抽取系统主要采用基于模式匹配、启发式规则等方法,但难以应对语言表达的多样性和复杂性。近年来,随着深度学习技术的发展,一系列基于神经网络的关系抽取模型被相继提出,如cnn、rnn、transformer等,大幅提升了关系抽取的性能。然而,这些模型通常需要大量高质量的标注数据进行训练,在实际应用中受到标注成本和领域适应性的限制。
2、近年来,大型预训练语言模型(如bert、gpt等)在多项nlp任务上取得了显著成就。尤其是gpt-4等大规模生成式语言模型,展现出了惊人的上下文学习能力(in-contextlearning),即只需提供少量演示样本作为上下文,即能在新样本上进行关系抽取。然而,尽管gpt-4在许多nlp任务上取得了显著成就,但在关系抽取方面的表现仍显著落后于使用大量标注数据微调的模型(如bert)。这主要是当前基于大语言模型关系抽取任务提示构造缺乏相应背景信息以及推理路径指导。现有方法在利用大语言模型进行关系抽取时仍存在检索质量不高、推理能力弱等局限。
技术实现思路
1、本发明提出了一种基于大语言模型的实体关系抽取方法,主要通过标签关系定义、支持集样本及推理解释、背景知识等信息来构建更好的提示,从而提升大语言模型在关系抽取任务中的表现。
2、一种基于大语言模型的实体关系抽取方法,包括:
3、s1:获取待用数据,包含训练数据集dtrain和测试数据集dtest;
4、s2:对预定义的实体关系标签进行定义解释;
5、s3:对测试数据集dtest中的每个测试样本(contenti, esi, ri, eoi),通过在训练数据集dtrain中检索相似的k个示例,并利用大语言模型生成推理解释;其中,ri表示测试样本的真实关系标签,esi表示测试样本的主实体,eoi表示测试样本的客实体,contenti表示测试样本的原始文本,i=1,2,3,...,m,m为正整数;
6、s4:从知识库kb中检索测试样本中主实体esi和客实体eoi的背景知识,并拼接成上下文信息ci;
7、s5:将关系定义集合drel、支持集si及推理解释ei、上下文信息ci拼接成提示pi,输入至大语言模型;
8、s6:大语言模型根据提示pi,对测试样本(contenti,esi,ri,eoi)进行关系推理,输出预测的关系标签yi';
9、s7:将预测的关系标签yi'与真实关系标签ri进行比较,评估大语言模型的性能,当达到预设精度后,得到最终的大语言模型,利用最终的大语言模型可以实现对任一实体关系的抽取。
10、一种存储设备,所述存储设备存储指令及数据用于实现一种基于大语言模型的实体关系抽取方法。
11、一种基于大语言模型的实体关系抽取设备,包括:处理器及所述存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现一种基于大语言模型的实体关系抽取方法。
12、本发明提供的技术方案带来的有益效果是:本发明通过引入关系定义解释、支持集检索与推理解释、实体背景知识等丰富信息,构建了一种新颖的提示学习范式。该方法利用大语言模型强大的语言理解和生成能力,在只给定少量示例的情况下,即可实现对新样本的关系推理。与传统方法相比,本发明不依赖大规模人工标注数据,大大降低了数据标注成本;通过从多角度引入先验知识,增强了模型对实体关系的语义理解能力;采用更加自然的提示形式,使得模型能够根据具体语境进行推理决策,提高了方法的泛化性和鲁棒性。此外,本发明生成的自然语言推理解释也大大增强了模型预测的可解释性,有助于人们理解模型的判断依据。总之,本发明提供了一种数据高效、泛化性强、可解释性好的实体关系抽取新方法,有望在知识图谱构建、智能问答、语义搜索等领域得到广泛应用。该方法巧妙地将关系定义解释、支持集示例推理、实体背景知识等多源信息融入提示学习范式,充分利用了大语言模型的语言理解和生成能力,实现了高效关系抽取。
1.一种基于大语言模型的实体关系抽取方法,其特征在于:包括:
2.如权利要求1所述的一种基于大语言模型的实体关系抽取方法,其特征在于:
3.如权利要求1所述的一种基于大语言模型的实体关系抽取方法,其特征在于:步骤s2的实现过程为:
4.如权利要求1所述的一种基于大语言模型的实体关系抽取方法,其特征在于:步骤s3中的实现过程为:
5.如权利要求4所述的一种基于大语言模型的实体关系抽取方法,其特征在于:步骤s3.1的实现过程为:
6.如权利要求1所述的一种基于大语言模型的实体关系抽取方法,其特征在于:
7.如权利要求1所述的一种基于大语言模型的实体关系抽取方法,其特征在于:步骤s6的实现过程为:
8.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1~7任一项所述的基于大语言模型的实体关系抽取方法。
9.一种基于大语言模型的实体关系抽取设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1~7任一项所述的基于大语言模型的实体关系抽取方法。