对话信息分析方法、装置、设备及存储介质与流程

xiaoxiao9月前  42


本发明涉及人工智能,尤其涉及一种对话信息分析方法、装置、设备及存储介质。


背景技术:

1、传统对话信息分析技术在商务对话和客户服务的场景中主要依赖于关键词搜索和模式识别,这些技术能够识别基本的请求和反馈,但通常无法精确把握客户的潜在需求和购买意愿,特别是在对话涉及多轮交流和隐含意义时,其理解对话的上下文、情感和复杂语义的能力明显受限;而使用深度学习方法,进行对话分析时虽然能够更好地捕捉长期依赖和复杂语义结构,但需要大量标注数据和昂贵的计算资源,其又需要大量的时间去训练、调试以及执行具体的识别分析。

2、并且,在现有的技术中,现有的对话分析方案在特定的目标场景中,面对含有专业术语或行业特定表达时,其理解隐含信息、情感和意图的能力仍然有限;且对于特定的目标场景,现有的对话分析技术无法针对于不同对话角色的重要程度对分析方案进行适应性调整,导致分析效果不好。


技术实现思路

1、本发明的主要目的在于解决现有技术中针对特定的目标场景的对话音频进行分析时,无法根据对话的角色类型进行具体的内容分析,理解隐含信息、情感和意图的效果较差的技术问题。

2、本发明第一方面提供了一种对话信息分析方法,包括:

3、获取目标场景下的待分析对话音频;

4、对待分析对话音频进行语音文本识别,将待分析对话音频转化为对话文本,其中,所述对话文本中包含有说话人标注;

5、对所述对话文本进行文本语义识别得到语义识别结果,根据语义识别结果和目标场景的特征识别各说话人的角色类型;

6、根据对话文本对应的角色类型确定各角色类型的对话比例,基于各角色类型的对话比例调整对话分析模型中的模型参数;

7、获取分析维度,调用调整后的对话分析模型分析所述对话文本,得到所述分析维度对应的对话信息分析结果。

8、可选地,在本发明第一方面的第一种实现方式中,所述对话分析模型包括多个自注意力层,各注意力层之间通过残差块进行连接;

9、所述基于各角色类型的对话比例调整对话分析模型中的模型参数包括:

10、根据对话文本中的角色类型和各角色类型的对话比例计算调整权重,其中所述调整权重包括第一权重因子和第二权重因子;

11、根据所述第一权重因子调整所述对话分析模型中各所述自注意力层的权重参数;

12、根据所述第二权重因子,调整所述对话分析模型中各所述残差块的残差连接公式的权重参数。

13、可选地,在本发明第一方面的第二种实现方式中,所述语义识别结果包括第一文本语义和第二文本语义;

14、对所述对话文本进行文本语义识别得到语义识别结果包括:

15、对所述对话文本调用预置的正则文本匹配库进行匹配,得到匹配触发次数,根据预设的匹配阈值确定是否匹配成功;

16、若匹配成功,则得到所述对话文本对应的第一文本语义;

17、若未匹配成功,则调用大语言模型对所述对话文本进行语义识别,得到第二文本语义。

18、可选地,在本发明第一方面的第三种实现方式中,在所述调用大语言模型对所述对话文本进行语义识别,得到第二文本语义之前,还包括:

19、获取目标场景下的历史对话文本,并对所述对话文本进行语义标注,对标注各说话角色的类型进行标注,构建微调训练集;

20、基于所述微调训练集对经过预训练的大语言模型进行微调训练。

21、可选地,在本发明第一方面的第四种实现方式中,在所述获取目标场景下的待分析对话音频之后,还包括:

22、提取待分析对话音频中各说话人的身份信息,并根据所述身份信息确定说话人的角色类型。

23、可选地,在本发明第一方面的第五种实现方式中,所述提取待分析对话音频中各说话人的身份信息包括:

24、提取所述待分析对话音频中包含的声纹特征,根据待分析对话音频中包含的声纹特征在预置的声纹信息库中进行查找匹配,得到声纹特征对应的身份信息;

25、或者,提取所述对话文本中包含的身份信息文本,根据所述身份信息文本在预置的身份信息库中查找身份信息。

26、可选地,在本发明第一方面的第六种实现方式中,所述获取分析维度,调用调整后的对话分析模型分析所述对话文本,得到所述分析维度对应的对话信息分析结果包括:

27、调用调整后的对话分析模型分析所述对话文本,根据不同的分析维度给出不同的维度评分;

28、根据所述维度评分确定所述对话文本中的重点信息,根据所述重点信息生成待分析对话音频的对话信息报告。

29、本发明第二方面提供了一种对话信息分析装置,包括:

30、语音获取模块,用于获取目标场景下的待分析对话音频;

31、第一识别模块,用于对待分析对话音频进行语音文本识别,将待分析对话音频转化为对话文本,其中,所述对话文本中包含有说话人标注;

32、第二识别模块,用于对所述对话文本进行文本语义识别得到语义识别结果,根据语义识别结果和目标场景的特征识别各说话人的角色类型;

33、参数调整模块,用于根据对话文本对应的角色类型确定各角色类型的对话比例,基于各角色类型的对话比例调整对话分析模型中的模型参数;

34、信息分析模块,用于获取分析维度,调用调整后的对话分析模型分析所述对话文本,得到所述分析维度对应的对话信息分析结果。

35、本发明第三方面提供了一种对话信息分析设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述对话信息分析设备执行上述的对话信息分析方法的步骤。

36、本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的对话信息分析方法的步骤。

37、本发明提供的技术方案中,获取目标场景下的待分析对话音频;对待分析对话音频进行语音文本识别,将待分析对话音频转化为对话文本,其中,所述对话文本还包含有说话人标注;对所述对话文本进行文本语义识别得到语义识别结果,根据语义识别结果和目标场景的特征识别各说话人的角色类型;根据对话文本对应的角色类型确定各角色类型的对话比例,基于各角色类型的对话比例调整对话分析模型中的模型参数;获取分析维度,调用调整后的对话分析模型分析所述对话文本,得到所述分析维度对应的对话信息分析结果。该方法能够根据对话的角色类型对得到的对话信息进行具体的内容分析,能够提高对话信息分析方法在理解隐含信息、情感和意图的效果。



技术特征:

1.一种对话信息分析方法,其特征在于,包括:

2.根据权利要求1所述的对话信息分析方法,其特征在于,所述对话分析模型包括多个自注意力层,各注意力层之间通过残差块进行连接;

3.根据权利要求1或2所述的对话信息分析方法,其特征在于,所述语义识别结果包括第一文本语义和第二文本语义;

4.根据权利要求3所述的对话信息分析方法,其特征在于,在所述调用大语言模型对所述对话文本进行语义识别,得到第二文本语义之前,还包括:

5.根据权利要求4所述的对话信息分析方法,其特征在于,在所述获取目标场景下的待分析对话音频之后,还包括:

6.根据权利要求5所述的对话信息分析方法,其特征在于,所述提取待分析对话音频中各说话人的身份信息包括:

7.根据权利要求6所述的对话信息分析方法,其特征在于,所述获取分析维度,调用调整后的对话分析模型分析所述对话文本,得到所述分析维度对应的对话信息分析结果包括:

8.一种对话信息分析装置,其特征在于,所述对话信息分析装置包括:

9.一种对话信息分析设备,其特征在于,所述对话信息分析设备包括:存储器和至少一个处理器,所述存储器中存储有指令;

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述对话信息分析方法的步骤。


技术总结
本发明涉及人工智能技术领域,公开了一种对话信息分析方法、装置、设备及存储介质,用于解决现有技术中针对特定的目标场景的对话音频进行分析时,无法根据对话的角色类型进行具体的内容分析的技术问题。该方法包括:获取目标场景下的待分析对话音频;对待分析对话音频进行语音文本识别并转化为对话文本;对对话文本进行文本语义识别得到语义识别结果,根据语义识别结果和目标场景的特征识别各说话人的角色类型;根据对话文本对应的角色类型确定各角色类型的对话比例,基于各角色类型的对话比例调整对话分析模型中的模型参数;获取分析维度,调用调整后的对话分析模型分析对话文本,得到分析维度对应的对话信息分析结果。

技术研发人员:王林杰
受保护的技术使用者:上海数珩信息科技股份有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)