意图识别方法及装置、存储介质及电子设备与流程

xiaoxiao6月前  64


本发明涉及人工智能,特别是涉及一种意图识别方法及装置、存储介质及电子设备。


背景技术:

1、随着人工智能技术的发展,在诸多领域中已广泛应用知识库提供用户咨询服务,即针对用户提出的问题,在知识库中查询相应的内容进行应答,以实现智能问答。

2、在基于知识库进行问答时,通常需对用户问题进行意图识别,以确定问答的方向,缩小知识库的数据查询范围。在实际的问答场景中,用户的问题可能会存在多个意图,故一般需对用户问题进行多意图识别。

3、目前,通常是将多意图识别问题转化为多个单标签问题,继而采用单标签的分类算法实现用户问题的意图识别。具体的,可针对所有意图进行排列组合,将每种意图组合作为一类标签,通过各个意图组合所对应的标签训练分类模型,将用户问题命中的标签对应的意图组合作为意图识别结果。

4、而随着实际业务的发展,用户咨询场景中涉及的意图类别越来越多,有可能的意图组合的数量亦随之增加。基于现有的意图识别方式,当用户咨询场景涉及大量的意图类别时,需部署众多的意图组合标签,致使分类问题的复杂度上升,易导致分类模型的整体性能较差,使得意图识别的准确性较低。


技术实现思路

1、有鉴于此,本发明实施例提供了一种意图识别方法,以解决现有的意图识别方式需部署大量的意图组合标签,分类复杂度较高,易使分类模型整体性能较差,导致意图识别的准确性较低的问题。

2、本发明实施例还提供了一种意图识别装置,用以保证上述方法实际中的实现及应用。

3、为实现上述目的,本发明实施例提供如下技术方案:

4、一种意图识别方法,包括:

5、当需要对用户问题进行意图识别时,将所述用户问题输入意图数目识别模型,经所述意图数目识别模型处理后,获得所述用户问题对应的目标意图数目;所述意图数目识别模型为基于第一训练数据集训练得到的模型,所述第一训练数据集包括多个训练样本及每个所述训练样本的意图数目;

6、将所述用户问题输入意图识别模型,并将所述目标意图数目作为所述意图识别模型的激活函数的目标类数目,经所述意图识别模型处理后,获得每个预设意图对应的可能性评估值;所述意图识别模型为基于第二训练数据集训练得到的模型,所述第二训练数据集包括每个所述训练样本及每个所述训练样本的各个意图;所述激活函数为经改进的归一化指数函数,所述激活函数用于处理存在多个目标类的分类任务;

7、基于各个所述预设意图对应的可能性评估值,确定目标意图集合;所述目标意图集合包括至少一个所述预设意图,且所述目标意图集合中预设意图的数目与所述目标意图数目相等;

8、将所述目标意图集合作为所述用户问题对应的意图识别结果。

9、上述的方法,可选的,所述意图识别模型中部署有条件随机场,所述条件随机场的特征矩阵为预先构建的标签共线矩阵;所述标签共线矩阵表征各个所述预设意图之间的依赖关系。

10、上述的方法,可选的,所述标签共线矩阵的构建过程,包括:

11、基于各个所述训练样本的各个意图,确定各个意图组合;

12、确定每个所述意图组合对应的训练样本数量;

13、对于每个所述预设意图,基于各个所述意图组合对应的训练样本数量,确定该预设意图对应的样本数量集合;该样本数量集合包括该预设意图关联的每种预设意图依赖关系所对应的样本数量;

14、依据各个所述预设意图对应的样本数量集合构建矩阵,将构建得到的矩阵作为所述标签共线矩阵。

15、上述的方法,可选的,所述意图数目识别模型的构建过程,包括:

16、确定第一初始模型;所述第一初始模型为基于预训练模型构建的分类模型;

17、通过所述第一训练数据集对所述第一初始模型进行模型训练,将完成训练的第一初始模型作为所述意图数目识别模型。

18、上述的方法,可选的,所述意图识别模型的构建过程,包括:

19、确定第二初始模型,所述第二初始模型为基于预训练模型构建的多分类模型;

20、确定每个所述训练样本对应的训练意图数目;

21、通过各个所述训练样本对应的训练意图数目和所述第二训练数据集对所述第二初始模型进行模型训练,将完成训练的第二初始模型作为所述意图识别模型。

22、上述的方法,可选的,所述第二初始模型的模型结构依次包括输入层、网络层、条件随机场层、激活函数层和输出层。

23、上述的方法,可选的,所述基于各个所述预设意图对应的可能性评估值,确定目标意图集合,包括:

24、按照各个所述预设意图对应的可能性评估值表征的可能性程度由高到低的顺序,对各个所述预设意图进行排序;

25、将所述目标意图数目作为需要选取的预设意图的数量,按照各个所述预设意图的排列顺序,依次选取预设意图,并由选取的所有预设意图组成所述目标意图集合。

26、一种意图识别装置,包括:

27、第一预测单元,用于当需要对用户问题进行意图识别时,将所述用户问题输入意图数目识别模型,经所述意图数目识别模型处理后,获得所述用户问题对应的目标意图数目;所述意图数目识别模型为基于第一训练数据集训练得到的模型,所述第一训练数据集包括多个训练样本及每个所述训练样本的意图数目;

28、第二预测单元,用于将所述用户问题输入意图识别模型,并将所述目标意图数目作为所述意图识别模型的激活函数的目标类数目,经所述意图识别模型处理后,获得每个预设意图对应的可能性评估值;所述意图识别模型为基于第二训练数据集训练得到的模型,所述第二训练数据集包括每个所述训练样本及每个所述训练样本的各个意图;所述激活函数为经改进的归一化指数函数,所述激活函数用于处理存在多个目标类的分类任务;

29、第一确定单元,用于基于各个所述预设意图对应的可能性评估值,确定目标意图集合;所述目标意图集合包括至少一个所述预设意图,且所述目标意图集合中预设意图的数目与所述目标意图数目相等;

30、第二确定单元,用于将所述目标意图集合作为所述用户问题对应的意图识别结果。

31、一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的意图识别方法。

32、一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如上述的意图识别方法。

33、基于上述本发明实施例提供的一种意图识别方法,当需要对用户问题进行意图识别时,将用户问题输入意图数目识别模型,经意图数目识别模型处理后,获得用户问题对应的目标意图数目;意图数目识别模型为基于第一训练数据集训练得到的模型,第一训练数据集包括多个训练样本及每个训练样本的意图数目;将用户问题输入意图识别模型,并将目标意图数目作为所述意图识别模型的激活函数的目标类数目,经意图识别模型处理后,获得每个预设意图对应的可能性评估值;意图识别模型为基于第二训练数据集训练得到的模型,第二训练数据集包括每个训练样本及每个训练样本的各个意图;该激活函数为经改进的归一化指数函数,用于处理存在多个目标类的分类任务;基于各个预设意图对应的可能性评估值,确定目标意图集合;目标意图集合包括至少一个所述预设意图,且目标意图集合中预设意图的数目与所述目标意图数目相等;将所述目标意图集合作为所述用户问题对应的意图识别结果。应用本发明实施例提供的方法,通过意图数目识别模型对用户问题可能存在的意图的数目进行预测,得到目标意图数目,以确定意图识别结果中包含的意图的数量。将目标意图数目作为意图识别模型中激活函数的目标类数目,也就是需要选取作为目标类的类别(即预设意图)的数目,然后通过意图识别模型分别对每个预设意图进行可能性预测,基于可能性评估值在各个预设意图中选取数量与目标意图数目相匹配的预设意图作为意图识别结果。意图识别模型分别对每类预设意图的可能性进行预测,即每类标签都是单个预设意图,标签的数量即为预设意图的类别数,无需对意图进行排列组合,配置每类意图组合所对应的标签,分类标签的数量较少,分类问题的复杂度较低,有利于提升意图识别模型的整体性能,提高意图识别的准确性。其次,通过预先预测的目标意图数目筛选用户问题命中的预设意图,以得到意图识别结果,而无需通过设定阈值的方式筛选命中的类别,可避免固定阈值在不同场景中的适配性差异造成的不良影响,有利于匹配各类场景,进一步提高意图识别的准确性。


技术特征:

1.一种意图识别方法,其特征在于,包括:

2.根据权利要求1所述的意图识别方法,其特征在于,所述意图识别模型中部署有条件随机场,所述条件随机场的特征矩阵为预先构建的标签共线矩阵;所述标签共线矩阵表征各个所述预设意图之间的依赖关系。

3.根据权利要求2所述的意图识别方法,其特征在于,所述标签共线矩阵的构建过程,包括:

4.根据权利要求1所述的意图识别方法,其特征在于,所述意图数目识别模型的构建过程,包括:

5.根据权利要求1所述的意图识别方法,其特征在于,所述意图识别模型的构建过程,包括:

6.根据权利要求5所述的意图识别方法,其特征在于,所述第二初始模型的模型结构依次包括输入层、网络层、条件随机场层、激活函数层和输出层。

7.根据权利要求1所述的意图识别方法,其特征在于,所述基于各个所述预设意图对应的可能性评估值,确定目标意图集合,包括:

8.一种意图识别装置,其特征在于,包括:

9.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1~7任意一项所述的意图识别方法。

10.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1~7任意一项所述的意图识别方法。


技术总结
本发明提供一种意图识别方法及装置、存储介质及电子设备,该方法包括:将用户问题输入意图数目识别模型,经模型处理后,获得用户问题对应的目标意图数目;将用户问题输入意图识别模型,并将目标意图数目作为意图识别模型的激活函数的目标类数目,经模型处理后,获得每个预设意图对应的可能性评估值;该激活函数为经改进的归一化指数函数,用于处理存在多个目标类的分类任务;基于各个可能性评估值,确定目标意图集合,该集合包含数量与目标意图数目相等的预设意图;将目标意图集合作为用户问题对应的意图识别结果。应用本发明的方法,意图识别模型的各个标签即为各个意图,分类复杂度较低,有利于改善模型整体性能,提高意图识别的准确性。

技术研发人员:尚亚飞,李重勋,张超,胡可云,陈联忠
受保护的技术使用者:北京嘉和海森健康科技有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)