本申请涉及声音识别领域,尤其涉及一种咳嗽声音识别方法、装置、电子设备及存储介质。
背景技术:
1、日常生活中常见的咳嗽包括哮喘、肺炎等呼吸系统疾病的常见病症,咳嗽是医生临床诊断的重要依据。但目前智能咳嗽监测设备主要用于医学监护,多为医院等特殊应用场景,难以覆盖日常生活场景。
技术实现思路
1、本申请实施例提供一种咳嗽声音识别方法、装置、电子设备及存储介质,用于可以通过数字麦克风获取音频数据,再根据音频数据识别是否为咳嗽声音,实现了便携性好、低成本的咳嗽监测。
2、本申请第一方面提供一种咳嗽声音识别方法,可以包括:对通过数字麦克风采集的音频数据进行预处理,得到预处理后的音频数据;对所述预处理后的音频数据进行端点检测和噪声排除,得到包含咳嗽声音的音频片段;对所述包含咳嗽声音的音频片段进行特征提取;将提取的特征输入第一预设模型进行识别,得到第一识别结果,所述第一预设模型用于识别是否为咳嗽声音。
3、可选的,所述对所述预处理后的音频数据进行端点检测和噪声排除,得到包含咳嗽声音的音频片段,可以包括:对所述预处理后的音频数据进行端点检测,得到包含咳嗽声音的第一音频片段;对所述包含咳嗽声音的第一音频片段进行噪声排除,得到包含咳嗽声音的第二音频片段;
4、所述对所述包含咳嗽声音的音频片段进行特征提取,可以包括:对所述包含咳嗽声音的第二音频片段进行特征提取。
5、可选的,所述对所述预处理后的音频数据进行端点检测,得到包含咳嗽声音的第一音频片段,可以包括:对所述预处理后的音频数据进行预加重和分帧处理,计算每帧的短时能量和短时过零率;保留每帧中短时能量大于短时能量阈值,且短时过零率大于短时过零阈值的音频数据,得到包含咳嗽声音的第一音频片段。
6、可选的,所述短时能量阈值和所述短时过零阈值是根据背景噪声自适应的。
7、可选的,所述对所述包含咳嗽声音的第一音频片段进行噪声排除,得到包含咳嗽声音的第二音频片段,可以包括:根据声音能量和信噪比对所述包含咳嗽声音的第一音频片段进行噪声排除,得到包含咳嗽声音的第二音频片段。
8、可选的,所述根据声音能量和信噪比对所述包含咳嗽声音的第一音频片段进行噪声排除,得到包含咳嗽声音的第二音频片段,可以包括:在所述包含咳嗽声音的第一音频片段中,保留目标声音能量比例大于能量比例阈值,和/或,信噪比大于信噪比阈值的音频片段,得到包含咳嗽声音的第二音频片段,所述目标声音能量为大于能量阈值的能量。
9、可选的,所述提取的特征包括:静态特征和动态特征;
10、所述静态特征包括能量和梅尔倒谱系数特征;
11、所述动态特征包括一阶差分特征和二阶差分特征。
12、可选的,所述方法还可以包括:在所述第一识别结果为咳嗽声音的情况下,根据所述第一识别结果输出咳嗽次数、咳嗽时间、每次咳嗽平均声压级,及总咳嗽平均声压级中的至少一项。
13、可选的,所述方法还可以包括:在所述第一识别结果为咳嗽声音的情况下,将所述提取的特征输入第二预设模型,输出第二识别结果,所述第二预设模型用于识别是否为与咳嗽声音相似的其他声音;在所述第二识别结果不是与咳嗽声音相似的其他声音的情况下,确定本次识别结果为咳嗽声音;根据所述第一识别结果输出咳嗽次数、咳嗽时间、每次咳嗽平均声压级,及总咳嗽平均声压级中的至少一项。
14、本申请第二方面提供一种咳嗽声音识别装置,可以包括:
15、预处理模块,用于对通过数字麦克风采集的音频数据进行预处理,得到预处理后的音频数据;
16、得到模块,用于对所述预处理后的音频数据进行端点检测和噪声排除,得到包含咳嗽声音的音频片段;
17、特征提取模块,用于对所述包含咳嗽声音的音频片段进行特征提取;
18、识别模块,用于将提取的特征输入第一预设模型进行识别,得到第一识别结果,所述第一预设模型用于识别是否为咳嗽声音。
19、本申请第三方面提供一种咳嗽声音识别装置,可以包括:
20、存储有可执行程序代码的存储器;
21、与所述存储器耦合的处理器;
22、所述处理器用于执行如本申请第一方面所述的方法。
23、本申请第四方面提供一种电子设备,包括数字麦克风,以及如本申请第二方面或第三方面所述的咳嗽声音识别装置。
24、本申请第五方面提供一种计算机可读存储介质,包括指令,当其在处理器上运行时,使得处理器执行如本申请第一方面所述的方法。
25、本申请实施例又一方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请第一方面所述的方法。
26、本申请实施例又一方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请第一方面所述的方法。
27、从以上技术方案可以看出,本申请实施例具有以下优点:
28、在本申请实施例中,对通过数字麦克风采集的音频数据进行预处理,得到预处理后的音频数据;对所述预处理后的音频数据进行端点检测和噪声排除,得到包含咳嗽声音的音频片段;对所述包含咳嗽声音的音频片段进行特征提取;将提取的特征输入第一预设模型进行识别,得到第一识别结果,所述第一预设模型用于识别是否为咳嗽声音。用于可以通过数字麦克风获取音频数据,对音频数据进行预处理、端点检测和噪声排除后,再进行特征提取,输入预设模型识别是否为咳嗽声音,实现了便携性好、低成本的咳嗽监测。
1.一种咳嗽声音识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述预处理后的音频数据进行端点检测和噪声排除,得到包含咳嗽声音的音频片段,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述预处理后的音频数据进行端点检测,得到包含咳嗽声音的第一音频片段,包括:
4.根据权利要求3所述的方法,其特征在于,所述短时能量阈值和所述短时过零阈值是根据背景噪声自适应的。
5.根据权利要求2所述的方法,其特征在于,所述对所述包含咳嗽声音的第一音频片段进行噪声排除,得到包含咳嗽声音的第二音频片段,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据声音能量和信噪比对所述包含咳嗽声音的第一音频片段进行噪声排除,得到包含咳嗽声音的第二音频片段,包括:
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述提取的特征包括:静态特征和动态特征;
8.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
9.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
10.一种咳嗽声音识别装置,其特征在于,包括:
11.一种咳嗽声音识别装置,其特征在于,包括:
12.一种计算机可读存储介质,包括指令,当其在处理器上运行时,使得处理器执行如权利要求1-9中任一项所述的方法。
13.一种电子设备,其特征在于,包括数字麦克风,以及如权10或权11所述的咳嗽声音识别装置。