语音特征信息的提取方法及电子设备的制造方法

xiaoxiao2020-10-23  17

语音特征信息的提取方法及电子设备的制造方法
【技术领域】
[0001]本发明涉及语音技术领域,尤其涉及一种语音特征信息的提取方法及电子设备。
【背景技术】
[0002]随着语音技术的飞速发展,能够通过多种方法来提取语音信息的特征矢量,例如可以通过有线性预测系数(LPC),LPC倒谱系数(LPCC)和Mel频谱系统(Mel-scaleFrequency Cepstral Coefficients,简称MFCC))来提取语音特征矢量,具有较好的识别性能和抗噪能力。
[0003]但是,现有电子设备在提取语音特征信息时,是根据人耳对不同频率的声波有不同的听觉敏感度,从低频到高频这一段频带内按临界带宽的大小由密到疏安排三角带通滤波器的,然后再对输入信号进行滤波,使得三角带通滤波器组固定分布,且在低频时设置的三角带通滤波器的数量较大,以及在高频时设置的三角带通滤波器的数量较少,而在语音信息中的信息在高频时携带有更多的信息量时,而三角带通滤波器组固定分布,使得高频设置的三角带通滤波器的数量较少,如此,使得现有的电子设备在获取语音特征信息时,存在三角带通滤波器组固定分布,不能根据实际情况自动调整的技术问题。

【发明内容】

[0004]本申请实施例通过提供一种语音特征信息的提取方法及电子设备,用以解决现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题。
[0005]本申请实施例提供了一种语音特征信息的提取方法,应用于电子设备中,所述方法包括:
[0006]获取语音信息;
[0007]获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;
[0008]基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;
[0009]根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;
[0010]基于所述Mel频谱,获取Mel频率倒谱系数MFCC。
[0011]可选的,所述获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数,具体包括:对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息;基于所述频谱信息,确定所述信息分布参数。
[0012]可选的,所述基于所述频谱信息,确定所述信息分布参数,具体包括:对所述频谱信息进行功率分析,获取所述功率分布参数;基于所述功率分布参数,确定所述信息分布参数。
[0013]可选的,所述基于所述Mel频谱,获取Mel频率倒谱系数MFCC,具体包括:将所述Mel频谱取对数,获得对数能量谱;将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。
[0014]可选的,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括:基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。
[0015]可选的,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括:基于所述信息分布参数,将所述频率带宽划分为所述N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。
[0016]本申请一实施例还提供了一种电子设备,所述电子设备包括:
[0017]语音信息获取单元,用于获取语音信息;
[0018]信息参数获取单元,用于获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;
[0019]分布系数确定单元,用于基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;
[0020]Mel频谱获取单元,用于根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;
[0021]MFCC获取单元,用于基于所述Mel频谱,获取所述MFCC。
[0022]可选的,所述电子设备包括频谱信息获取单元,用于对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息;
[0023]所述信息参数获取单元,具体用于基于所述频谱信息,确定所述信息分布参数。
[0024]可选的,所述信息参数获取单元,具体用于对所述频谱信息进行功率分析,获取所述功率分布参数,再基于所述功率分布参数,确定所述信息分布参数。
[0025]可选的,所述基MFCC获取单元,具体用于将所述Mel频谱取对数,获得对数能量谱,再将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。
[0026]可选的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。
[0027]可选的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。
[0028]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0029]其一、由于本申请实施例是获取语音信息在与所述语音信息对应的频谱上的信息分布参数,再基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应,再根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱,以及再基于所述Mel频谱,获取MFCC,由于三角带通滤波器组是根据所述信息分布参数来所述频谱上进行分布的,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,从而解决了现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题,实现了电子设备能够根据实际情况自动调整三角带通滤波器组的分布的技术效果。
[0030]其二、由于本申请实施例是将所述频率带宽划分为N个频带,再基于所述信息分布参数,确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,而且所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,进而使得根据MFCC值提取的有效语音信息量增大,提高语音识别性能。
【附图说明】
[0031]图1为本申请实施例中语音特征信息的提取方法流程图;
[0032]图2为本申请实施例中电子设备的结构图。
【具体实施方式】
[0033]本申请实施例通过提供一种语音特征信 息的提取方法及电子设备,用以解决现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题。
[0034]本申请实施例的技术方案为解决上述技术的问题,总体思路如下:
[0035]由于本申请实施例是获取语音信息在与所述语音信息对应的频谱上的信息分布参数,再基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应,再根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱,以及再基于所述Mel频谱,获取MFCC,由于三角带通滤波器组是根据所述信息分布参数来所述频谱上进行分布的,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,从而解决了现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题,实现了电子设备能够根据实际情况自动调整三角带通滤波器组的分布的技术效果。
[0036]为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0037]本申请一实施例提供了一种语音特征信息的提取方法,应用于电子设备中,所述电子设备例如是平板电脑、智能手机、笔记本电脑等电子设备。
[0038]参见图1,该方法的步骤具体如下:
[0039]步骤101:获取语首彳目息;
[0040]步骤102:获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;
[0041]步骤103:基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;
[0042]步骤104:根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;
[0043]步骤105:基于所述Mel频谱,获取Mel频率倒谱系数MFCC。
[0044]其中,在步骤101中,获取语音信息。在具体实施过程中,所述电子设备可以从其它电子设备接收所述语音信息,也可以通过所述电子设备中的采集单元采集所述语音信息,其中,所述语音信息例如是是一段连续的语音信号等。
[0045]具体来讲,所述语音信号例如可以是200Hz到5000Hz的语音信号,所述电子设备可以通过所述采集单元采集频率在200Hz到5000Hz的一段连续的语音信号。
[0046]例如,以智能手机为例,智能手机A可以通过设置在智能手机A上的麦克风采集到用户在10:15:12秒至10:15:25秒内的语音信号,将采集到的所述10:15:12秒至10:15:25秒内的语音信号作为所述语音信息。
[0047]接下来执行步骤102,在该步骤中,获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数。
[0048]在具体实施过程中,对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换(Fast Fourier Transformat1n,简称FFT)处理,获取与所述语音信息对应的频谱信息;基于所述频谱信息,确定所述信息分布参数。
[0049]具体来讲,首先对所述语音信息进行预加重处理,所述预加重处理是将所述语音信息通过一个高通滤波器,以提升所述语音信息中的高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱;同时,也是为了消除发生过程中声带和嘴唇的效应,来补偿语音信号受到发音系统所抑制的高频部分,也为了突出高频的共振峰。
[0050]进一步的,在对所述语音信息进行所述预加重处理之后,接着进行分帧处理,将所述预加重处理之后的所述语音信息中的N个采样点集合成一个观测单位,称为帧,从而将所述语音信息划分成M帧语音信号,其中,N和M均为不小于I的整数,而且通常情况下N的值为256或512,涵盖的时间约为20?30ms左右。为了避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域,此重叠区域包含了 M个取样点,通常M的值约为N的1/2或1/3,通常语音识别所采用语音信号的采样频率为8KHz或16KHz,以8KHz来说,若帧长度为256个采样点,则对应的时间长度是256/8000X 1000=32ms ;
[0051]进一步的,在对所述语音信息进行所述分帧处理之后,接着进行加窗处理,将所述M帧语音信号中每一帧乘以汉明窗,以增加每帧语音信号的左端和右端的连续性。
[0052]进一步的,在对所述语音信息进行所述加窗处理之后,接着进行FFT处理,每帧语音信号在乘上汉明窗后,还必须再经过快速傅里叶变换以得到所述语音信息在与所述语音信息的频谱上的能量分布,使得对分帧加窗后的每帧语音信号进行所述FFT处理而得到每帧语音信号的频谱,从而获得与所述语音信息对应的频谱信息。
[0053]在具体实施过程中,所述基于所述频谱信息,确定所述信息分布参数,具体包括:对所述频谱信息进行功率分析,获取所述功率分布参数;基于所述功率分布参数,确定所述信息分布参数。
[0054]具体来讲,对所述频谱信息进行功率分析,获取所述频率带宽中的每个频率上的功率信息,基于每个频率上的功率信息,获取所述功率分布参数,由于一个频率上的功率信息越高,使得该频率上的信息量也越多,进而可以基于所述功率分布参数,来确定所述信息分布参数,所述信息分布参数可以是所述语音信息在所述频率带宽中的每个频率上的信息量,也可以是所述语音信息在N个频带中的每个频带上的信息量,其中,所述频率带宽对应所述N个频带,即可以将所述频率带宽划分为所述N个频带,为了降低计算量,通常是获取所述语音信息在每个频带上的信息量,下面具体以每个频带上的信息量为例.
[0055]具体的,由于所述频谱信息用于表征所述语音信号的频率结构及频率与该频率信号幅度的关系,从而可以确定所述频率带宽,所述频率带宽例如可以是200Hz到5000Hz的频率,或10Hz到10000Hz的频率,以所述频率带宽为200Hz到5000Hz的频率为例,若所述N=4,则可以将所述频率带宽划分为4个频带,其中,所述4个频带中的第一个频带为200Hz到1500Hz的频率,第二频带为1500Hz到2500Hz的频率,第三个频带为2500Hz到3500Hz的频率,以及第四个频带为3500Hz到5000Hz的频率,获取然后所述语音信息在所述4个频带中的每个频带上的信息量。
[0056]接下来执行步骤103,在该步骤中,基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应。
[0057]在具体实施过程中,在对所述语音信息进行所述FFT处理之后,就能够获取与所述语音信息对应的频谱,如此,使得可以基于所述信息分布参数,确定所述分布系数。
[0058]具体来讲,基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。
[0059]具体的,根据所述信息分布参数,从所述频率带宽中确定信息分布集中的频段和信息分布离散的频段,并根据所述信息分布集中的频段和所述信息分布离散的频段,将所述频率带宽划分为所述N个频带。
[0060]具体来讲,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括:基于所述信息分布参数,将所述频率带宽划分为所述N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述 N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。
[0061]具体的,携带信息量大的频带上分布的三角带通滤波器组的数量大于携带信息量小的频带上分布的三角带通滤波器组的数量,如此,使得三角带通滤波器组在信息量大的频带上分布的密度更高,在信息量小的频带上分布的密度低。
[0062]例如,以智能手机为例,智能手机A接收到用户B的语音信息,确定所述语音信息的频率带宽为200Hz到5000Hz的频率,若根据所述信息分布参数,从所述频率带宽中确定200Hz到2000Hz的频率中信息分布离散,2000Hz到3000Hz的频率中信息分布集中,3000Hz到4000Hz的频率中信息分布离散,以及4000Hz到5000Hz的频率中信息分布集中,从而可以将所述频率带宽划分为频率为200Hz到2000Hz的第一频带,且携带的信息量为a ;频率为2000Hz到3000Hz的第二频带,且携带的信息量为b ;频率为3000Hz到4000Hz的第三频带,且携带的信息量为C ;频率为4000Hz到5000Hz的第四频带,且携带的信息量为d,且分布在所述第一频带上的三角带通滤波器组的数量为al,分布在所述第二频带上的三角带通滤波器组的数量为bl,分布在所述第三频带上的三角带通滤波器组的数量为Cl,分布在所述第四频带上的三角带通滤波器组的数量为dl,若b>d>a>c,则bl>dl>al>cl。
[0063]接下来执行步骤104,在该步骤中,根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱。
[0064]在具体实施过程中,按照所述分布系数将三角带通滤波器组分布在所述频谱上,用于将所述频谱进行平滑化,并消除谐波,突显所述语音信息的共振峰,从而获得所述Mel频谱。
[0065]例如,参见图2,以智能手机为例,智能手机A接收到用户B的语音信息,确定所述语音信息的频率带宽为200Hz到5000Hz的频率,将所述频率带宽划分为4个频带,其中,所述4个频带中的第一个频带为200Hz到1500Hz的频率,且携带的信息量为a ;第二频带为1500Hz到2500Hz的频率,且携带的信息量为b,第三个频带为2500Hz到3500Hz的频率,且携带的信息量为c ;以及第四个频带为3500Hz到5000Hz的频率,且携带的信息量为d,且分布在所述第一频带上的三角带通滤波器组的数量为al,分布在所述第二频带上的三角带通滤波器组的数量为bl,分布在所述第三频带上的三角带通滤波器组的数量为Cl,分布在所述第四频带上的三角带通滤波器组的数量为dl,若c>b>a>d,则cl>bl>al>dl,将al、bl、cl和dl分布在所述频谱上进行滤波,获得所述Mel频谱。
[0066]接下来执行步骤105,在该步骤中,基于所述Mel频谱,获取Mel频率倒谱系数MFCC。
[0067]在具体实施过程中,将所述Mel频谱取对数,获得对数能量谱;将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。
[0068]具体来讲,将所述Mel频谱取对数,将获取的对数能量进行DCT,求出所述MFCC。
[0069]例如,以智能手机为例,智能手机A接收到用户B的语音信息,确定所述语音信息的频率带宽为200Hz到5000Hz的频率,将所述频率带宽划分为4个频带,其中,所述4个频带中的第一个频带为200Hz到1500Hz的频率,且携带的信息量为a ;第二频带为1500Hz到2500Hz的频率,且携带的信息量为b,第三个频带为2500Hz到3500Hz的频率,且携带的信息量为c ;以及第四个频带为3500Hz到5000Hz的频率,且携带的信息量为d,且分布在所述第一频带上的三角带通滤波器组的数量为al,分布在所述第二频带上的三角带通滤波器组的数量为bl,分布在所述第三频带上的三角带通滤波器组的数量为Cl,分布在所述第四频带上的三角带通滤波器组的数量为dl,若c>b>a>d,贝丨J cl>bl>al>dl,将al、bl、cl和dl分布在所述频谱上进行滤波,获得所述Mel频谱,将所述Mel频谱取对数,将获取的对数能量进行DCT,求出所述MFCC。
[0070]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0071]其一、由于本申请实施例是获取语音信息在与所述语音信息对应的频谱上的信息分布参数,再基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应,再根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱,以及再基于所述Mel频谱,获取MFCC,由于三角带通滤波器组是根据所述信息分布参数来所述频谱上进行分布的,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,从而解决了现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题,实现了电子设备能够根据实际情况自动调整三角带通滤波器组的分布的技术效果。
[0072]其二、由于本申请实施例是将所述频率带宽划分为N个频带,再基于所述信息分布参数,确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,而且所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,进而使得根据MFCC值提取的有效语音信息量增大,提高语音识别性能。
[0073]基于与上述方法相同的技术构思,本申请一实施例提供了一种电子设备,所述电子设备例如是平板电脑、智能手机、笔记本电脑等电子设备。
[0074]参见图2,所述电子设备包括:语音信息获取单元201,用于获取语音信息;信息参数获取单元202,用于获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;分布系数确定单元203,用于基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;Mel频谱获取单元204,用于根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;MFCC获取单元205,用于基于所述Mel频谱,获取MFCC。
[0075]较佳的,所述电子设备包括频谱信息获取单元,用于对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息;
[0076]所述信息参数获取单元,具体用于基于所述频谱信息,确定所述信息分布参数。
[0077]较佳的,所述信息参数获取单元,具体用于对所述频谱信息进行功率分析,获取所述功率分布参数,再基于所述功率分布参数,确定所述信息分布参数。
[0078]较佳的,所述基MFCC获取单元,具体用于将所述Mel频谱取对数,获得对数能量谱,再将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。
[0079]较佳的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带, 并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。
[0080]较佳的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。
[0081]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0082]其一、由于本申请实施例是获取语音信息在与所述语音信息对应的频谱上的信息分布参数,再基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应,再根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱,以及再基于所述Mel频谱,获取MFCC,由于三角带通滤波器组是根据所述信息分布参数来所述频谱上进行分布的,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,从而解决了现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题,实现了电子设备能够根据实际情况自动调整三角带通滤波器组的分布的技术效果。
[0083]其二、由于本申请实施例是将所述频率带宽划分为N个频带,再基于所述信息分布参数,确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,而且所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,进而使得根据MFCC值提取的有效语音信息量增大,提高语音识别性能。
[0084]尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0085]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种语音特征信息的提取方法,应用于电子设备中,所述方法包括: 获取语首?目息; 获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数; 基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应; 根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱; 基于所述Mel频谱,获取Mel频率倒谱系数MFCC。2.如权利要求1所述的方法,其特征在于,所述获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数,具体包括: 对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息; 基于所述频谱信息,确定所述信息分布参数。3.如权利要求2所述的方法,其特征在于,所述基于所述频谱信息,确定所述信息分布参数,具体包括: 对所述频谱信息进行功率分析,获取所述功率分布参数; 基于所述功率分布参数,确定所述信息分布参数。4.如权利要求1所述的方法,其特征在于,所述基于所述Mel频谱,获取Mel频率倒谱系数MFCC,具体包括: 将所述Mel频谱取对数,获得对数能量谱; 将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。5.如权利要求1-4任一项所述的方法,其特征在于,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括: 基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。6.如权利要求5所述的方法,其特征在于,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括: 基于所述信息分布参数,将所述频率带宽划分为所述N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。7.一种电子设备,所述电子设备包括: 语音信息获取单元,用于获取语音信息; 信息参数获取单元,用于获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数; 分布系数确定单元,用于基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应; Mel频谱获取单元,用于根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱; MFCC获取单元,用于基于所述Mel频谱,获取Mel频率倒谱系数MFCC。8.如权利要求7所述的电子设备,其特征在于,所述电子设备包括频谱信息获取单元,用于对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息; 所述信息参数获取单元,具体用于基于所述频谱信息,确定所述信息分布参数。9.如权利要求8所述的电子设备,其特征在于,所述信息参数获取单元,具体用于对所述频谱信息进行功率分析,获取所述功率分布参数,再基于所述功率分布参数,确定所述信息分布参数。10.如权利要求7所述的电子设备,其特征在于,所述基MFCC获取单元,具体用于将所述Mel频谱取对数,获得对数能量谱,再将所述对数能量谱进行离散余弦变换DCT,获得所述 MFCC。11.如权利要求7-9任一项所述的电子设备,其特征在于,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。12.如权利要求11所述的电子设备,其特征在于,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。
【专利摘要】本发明公开了一种语音特征信息的提取方法及电子设备,获取语音信息;获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;基于所述Mel频谱,获取Mel频率倒谱系数MFCC。
【IPC分类】G10L15/02, G10L19/26
【公开号】CN104900227
【申请号】CN201410074866
【发明人】廖安华, 彭刚
【申请人】联想(北京)有限公司
【公开日】2015年9月9日
【申请日】2014年3月3日

最新回复(0)