本申请涉及互联网,尤其涉及一种关键词检测方法、装置、设备、可读存储介质和产品。
背景技术:
1、近年来,随着互联网行业不断壮大,语音识别技术也得到广泛应用,语音识别是指让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,通过语音识别技术可以了解用户的说话意图。
2、在分析用户是否有说出关键词时,通常是通过自动语音识别转化为文本,然后对文本进行关键词识别。但该方式,由于存在外界环境的影响,采集到的语音音频中可能包含有各种噪音,在这些噪音的影响下,自动语音识别准确度低。
技术实现思路
1、本申请提供一种关键词检测方法、装置、设备、可读存储介质和产品,用于解决关键词语音识别准确度低的问题。
2、第一方面,本申请实施例提供一种关键词检测方法,包括:
3、获取客服与通话对象通话时在客服侧所采集的第一通话音频文件,以及所述第一通话音频文件中包含的关键词音频片段;
4、确定所述第一通话音频文件中是否存在第一说话对象的音频;
5、若确定存在所述第一说话对象的音频,且所述第一说话对象为所述客服所处环境中的说话对象,则基于所述第一通话音频文件中说话对象的音频,确定所述关键词音频片段是否为所述客服发出的;
6、若确定存在所述第一说话对象的音频,且所述第一说话对象不为所述客服所处环境中的说话对象,则基于所述通话对象侧所采集的第二通话音频文件和所述关键词音频片段,确定所述关键词音频片段是否为所述客服发出的。
7、第二方面,本申请实施例提供一种关键词检测装置,包括:
8、音频获取模块,用于获取客服与通话对象通话时在客服侧所采集的第一通话音频文件,以及所述第一通话音频文件中包含的关键词音频片段;
9、声音确定模块,用于确定所述第一通话音频文件中是否存在第一说话对象的音频;
10、第一检验模块,用于若确定存在所述第一说话对象的音频,且所述第一说话对象为所述客服所处环境中的说话对象,则基于所述第一通话音频文件中说话对象的音频,确定所述关键词音频片段是否为所述客服发出的;
11、第二检验模块,用于若确定存在所述第一说话对象的音频,且所述第一说话对象不为所述客服所处环境中的说话对象,则基于所述通话对象侧所采集的第二通话音频文件和所述关键词音频片段,确定所述关键词音频片段是否为所述客服发出的。
12、第三方面,本申请实施例提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如上述的方法。
13、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的方法。
14、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法。
15、可以看出,在本申请实施例中,通过采集客服与通话对象进行语音沟通时客服侧的第一通话音频文件,如果其中存在除客服之外的第一说话对象的音频,那么就继续判断第一说话对象是客服所处环境中的说话对象,还是通话对象侧的说话对象,再基于不同的情况分别进行关键词检测。这样可以避免客服侧的话外音或者通话对象侧的话术回传产生的干扰,真实的检测出关键词音频到底是客服自己产生的,还是话外音或者通话对象侧的话术回传产生的,避免产生误判,提高识别的准确性。
1.一种关键词检测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述第一通话音频文件中是否存在第一说话对象的音频,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于h个说话对象中每个说话对象的至少一个音频片段,确定所述第一通话音频文件中是否存在第一说话对象的音频,包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,所述基于所述第一通话音频文件中说话对象的音频,确定所述关键词音频片段是否为所述客服发出的,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述通话对象侧所采集的第二通话音频文件和所述关键词音频片段,确定所述关键词音频片段是否为所述客服发出的,包括:
7.根据权利要求2所述的方法,其特征在于,还包括:
8.一种关键词检测装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的方法。
11.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。