本申请涉及计算机,尤其涉及事件论元抽取模型的训练方法、论元抽取方法和装置。
背景技术:
1、事件论元抽取是指从待抽取数据(例如文本、图像等模态数据)抽取事件的各个组成要素(时间、地点、参与者、事件适配的相关内容等),要素即为论元。
2、相关技术中,通常是采用每种模态数据对应的事件论元抽取模型来对对应模态数据进行事件论元抽取,这就需要为每种模态数据分别训练一个事件论元模型。然而,这种方式模型训练成本高,维护高,目前,尚缺乏相关技术手段来支持对文本和图像的统一处理。
技术实现思路
1、本申请提出一种事件论元抽取模型的训练方法、论元抽取方法和装置。
2、本申请一方面实施例提出了一种事件论元抽取模型的训练方法,所述方法包括:获取训练数据,其中,所述训练数据包括:样本图像以及对应的第一论元角色的第一论元标注结果、图像文本对以及对应的第二论元角色的第二论元标注结果、样本文本以及对应的第三论元角色的第三论元标注结果;将所述样本图像和所述第一论元角色输入到事件论元抽取模型中,以从所述样本图像中抽取出所述第一论元角色的第一论元抽取结果;将所述图像文本对和所述第二论元角色输入到所述事件论元抽取模型中,以从所述图像文本对中抽取出所述第二论元角色的第二论元抽取结果;将所述样本文本和所述第三论元角色输入到所述事件论元抽取模型,以从所述样本文本中抽取出所述第三论元角色的第三论元抽取结果;根据所述第一论元标注结果和所述第一论元抽取结果的差异、所述第二论元标注结果和所述第二论元抽取结果之间的差异以及所述第三论元标注结果和所述第三论元抽取结果之间的差异,对所述事件论元抽取模型进行训练。
3、本申请另一方面实施例提出了一种论元抽取方法,所述方法包括:获取待抽取数据,其中,所述待抽取数据为待抽取的文本、图像或者图像文本对;确定所述待抽取数据所对应的第四论元角色;将所述第四论元角色和所述待抽取数据输入到事件论元抽取模型中,以从所述待抽取数据中抽取出所述第四论元角色的论元抽取结果,其中,所述事件论元抽取模型是通过第一方面所公开的方法训练得到的。
4、本申请另一方面实施例提出了一种事件论元抽取模型的训练装置,所述装置包括:获取模块,用于获取训练数据,其中,所述训练数据包括:样本图像以及对应的第一论元标注结果和第一论元角色、图像文本对以及对应的第二论元标注结果和第二论元角色、样本文本以及对应的第三论元标注结果和第三论元角色;第一论元抽取模块,用于将所述样本图像和所述第一论元角色输入到事件论元抽取模型中,以从所述样本图像中抽取出所述第一论元角色的第一论元抽取结果;第二论元抽取模块,用于将所述图像文本对和所述第二论元角色输入到所述事件论元抽取模型中,以从所述图像文本对中抽取出所述第二论元角色的第二论元抽取结果;第三论元抽取模块,用于将所述样本文本和所述第三论元角色输入到所述事件论元抽取模型,以从所述样本文本中抽取出所述第三论元角色的第三论元抽取结果;训练模块,用于根据所述第一论元标注结果和所述第一论元抽取结果的差异、所述第二论元标注结果和所述第二论元抽取结果之间的差异以及所述第三论元标注结果和所述第三论元抽取结果之间的差异,对所述事件论元抽取模型进行训练。
5、本申请另一方面实施例提出了一种论元抽取装置,所述装置包括:获取模块,用于获取待抽取数据,其中,所述待抽取数据为待抽取的文本、图像或者图像文本对;确定模块,用于确定所述待抽取数据所对应的第四论元角色;论元抽取模块,用于将所述第四论元角色和所述待抽取数据输入到事件论元抽取模型中,以从所述待抽取数据中抽取出所述第四论元角色的论元抽取结果,其中,所述事件论元抽取模型是通过第一方面实施例公开的方法训练得到的。
6、本申请另一方面实施例提出了一种电子设备,包括:存储器,处理器;所述存储器中存储有计算机指令,当所述计算机指令被所述处理器执行时,实现本申请实施例中的事件论元抽取模型的训练方法、论元抽取方法。
7、本申请另一方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例公开的事件论元抽取模型的训练方法、论元抽取方法。
8、本申请另一方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例公开的事件论元抽取模型的训练方法、论元抽取方法。
9、本申请的实施例提供的技术方案至少带来以下有益效果:
10、结合样本图像、图像文本对以及样本文本对同一个事件论元抽取模型进行训练,由此,训练出了一个可对多种模态数据进行处理的事件论元抽取模型,降低了模型的训练成本和维护成本,使得同一个事件论元抽取模型即可以对文本进行处理,还可以对图像进行处理,实现了对文本和图像的统一处理。
11、上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
1.一种事件论元抽取模型的训练方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述第一论元标注结果和所述第一论元抽取结果的差异、所述第二论元标注结果和所述第二论元抽取结果之间的差异以及所述第三论元标注结果和所述第三论元抽取结果之间的差异,对所述事件论元抽取模型进行训练,包括:
3.如权利要求1所述的方法,其特征在于,所述第一论元角色为所述样本图像所描述的第一事件类型中所涉及到的论元角色,所述图像文本对的获得方式为:
4.如权利要求3所述的方法,其特征在于,所述样本文本的获得方式为:
5.如权利要求1所述的方法,其特征在于,所述事件论元抽取模型包括:图像表示层、图像文本编码层、图像文本解码层、图像论元确定层和文本论元确定层,所述将所述图像文本对和所述第二论元角色输入到所述事件论元抽取模型中,以从所述图像文本对中抽取出所述第二论元角色的第二论元抽取结果,包括:
6.如权利要求5所述的方法,其特征在于,所述将所述样本图像和所述第一论元角色输入到事件论元抽取模型中,以从所述样本图像中抽取出所述第一论元角色的第一论元抽取结果,包括:
7.如权利要求5所述的方法,其特征在于,所述将所述样本文本和所述第三论元角色输入到所述事件论元抽取模型,以从所述样本文本中抽取出所述第三论元角色的第三论元抽取结果,包括:
8.一种论元抽取方法,其特征在于,所述方法包括:
9.如权利要求8所述的方法,其特征在于,所述确定所述待抽取数据所对应的第四论元角色,包括:
10.一种事件论元抽取模型的训练装置,其特征在于,所述装置包括:
11.一种论元抽取装置,其特征在于,所述装置包括:
12.一种电子设备,其特征在于,包括:
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法,或者,权利要求8-9中任一项所述的方法。
14.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法,或者,权利要求8-9中任一项所述的方法。