一种语音信号混合特征参数的提取方法

xiaoxiao2020-10-23  18

一种语音信号混合特征参数的提取方法
【技术领域】
[0001] 本发明涉及语音信号处理领域,具体为一种语音信号混合特征参数的提取方法
【背景技术】
[0002] 语音信号是一种十分复杂的非平稳信号,它包含着丰富的个人和语音本身的特征 信息,其特征参数的提取对语音识别效果至关重要。特征参数提取是指对不同的语音段寻 找其内在特征参数,通常特征参数大致可以分为三类:第一类是时域参数,例如短时平均 能量,共振峰,短时平均幅度,短时平均过零率,短时自相关函数,高阶统计量以及基音周期 等;第二类是频域参数,例如线性预测系数(LPC)、线性预测倒谱系数(LPCC)、梅尔倒谱系 数(MFCC)、线谱对(LSP)、口音敏感参数(ASCC)、感觉加权的线性预测(PLP)特征、动态差分 参数、以及基于Gammatone滤波器组的听觉特征(GFCC)等;第三类是基于小波变换或经验 模态分解(EMD)的系数。目前,特征参数提取都是将单一的参数提出,例如提取LPCC,MFCC, GFCC等,这些参数要么是基于发声机理的,如LPCC,要么是基于听觉特性的,如MFCC,二者 并没有进行混合提取更加全面、完整、高效的混合特征参数。而根据现在语音识别系统对实 时性和鲁棒性要求,单一特征参数已经不足以表征整个说话人或者语音本身的信息,导致 识别率下降,运行时间加长,其他特征参数提取也存在以上问题,不能很好的提高识别率。

【发明内容】

[0003] 本发明旨在解决现有技术中存在的识别率低鲁棒性差的问题。
[0004] 本发明正是分析发声机理和听觉特性的基础上,关于LPCC与MFCC以及二者差分 参数的混合特征参数提取方法,具体为一种语音信号混合特征参数的提取方法。
[0005] 为了解决语音特征参数单一,表征能力不足,鲁棒性差等问题,本发明提出一种语 音信号混合特征参数的提取方法,本方法是将根据发声机理的LPCC特征和根据听觉特性 的MFCC特征混合后提取,能够在不增加计算量的情况下提高识别率,而且提高系统鲁棒性 和稳健性。
[0006] 一种语音信号混合特征参数的提取方法,包括对语音信号X(n)预处理过程、特征 提取过程、特征混合过程,其中所述语音信号x(n)预处理过程包括对语音信号x(n)进行预 加重、分帧、加窗和端点检测处理过程;所述语音信号x(n)特征提取过程包括LPCC参数提 取过程和MFCC参数提取过程以及LPCC差分参数和MFCC差分数提取过程;所述特征混合 过程包括采用Fisher准则和K-means算法对LPCC参数和MFCC参数以及LPCC差分参数和 MFCC差分数进行聚类的过程。
[0007] 本方法中将LPCC参数和MFCC参数进行差分参数提取的过程及采用Fisher准则 进行线性判别过程从而实现将据发声机理的LPCC特征和根据听觉特性的MFCC特征混合后 提取,所提取的混合特征参数更加全面完整,更加容易识别,能够更加真实的表征整语音本 身的信息,利用k-means聚类降低帧数,能够实现在不增加计算量的情况下提高识别率,且 提高系统鲁棒性和稳健性。
[0008] 进一步的,所述加窗处理过程即是得到加窗后语音sw(n)的过程,其中sw(n)= x(n) ?w(n),式中0彡n彡(N-1),式中w(n)为加窗函数,且满足函数式
[0010] 进一步的,所述LPCC参数提取过程包括求取线性预测LPC过程、计算LPCC过程, 其中求取线性预测LPC过程是按照声道全极点模型
进行求取,式 中G表示模型的增益常数,p表示预测LPC的阶数,ak表示线性预测系数(k= 1,2,…,p); [0011] 计算LPCC时,首先语音信号x(n)的倒谱是对它进行Z变换,然后取对数后,再进 行反Z变换,具体变换是首先按照式
[0012]
,把X(Z)的相位信息jargX(z)忽略不计,从 而得到能得到语音信号x (n)的倒谱(n)=(log | X (z)|),再通过LPC系数an得到LPCC 参数,具体按照递推公式
可以得到LPCC 参数。
[0013] LPCC参数是通过声道模型来建立的一种特征参数,能够反映声道的响应,而且 PLCC参数能很好地将语音信号的共振特性表征出来。LPCC参数的是根据语音样本点与前 后的样本点有很大的相关性,因此就可以利用过去的样本点值来预测现在的或者未来的一 个样本点,也就是说语音信号的抽样值完全可以通过过去的一些语音采样点的进行组合来 逼近而得到,当预测的语音信号和实际抽样语音信号间的误差值达到最小值(在某个逼近 准则下)时,那么这时对应的唯一一组预测系数就作为语音信号的特征参数。
[0014] 进一步的,所述MFCC参数提取过程包括如下步骤
[0015] S41 :把经过预处理后的语音信号进行FFT变换得到其频谱X[k],变换公式为:
[0017] S42 :求频谱的平方得到短时能量谱S(k),具体计算公式为
>
[0019] S43 :用Mel滤波器把幅度谱转化为Mel频率谱,具体计算公式为
[0021] S44 :对所述Mel频率谱进行对数变换,变换公式为
[0023] S45 :将对数变换后的Mel频率谱进行离散余弦变换(DCT)即得到MFCC,变换公式 为
[0025] 进一步的,所述对LPCC参数和MFCC参数进行差分参数dk提取的过程 包括一阶差分参数提取和二阶差分参数提取,其中差分参数dk提取满足公式:
式中dk表示第k个一阶差分参数,t为一阶导数时间差,通常取1 ? 或2,ck表示第k个倒谱系数,其中取k= 2,d为差分参数,c为四个语音参数,用dk公式将 迭代两次,即可得到MFCC的二阶差分参数。
[0026] 进一步的,所述Fisher准则为利用评价函数对特征参数进行选择,假设n维 特征X在一条直线上投影,则寻找一条投影直线,使得类间距离最大,具体为:首先对于 两个类《〇和wi,假设各类的特征是二维分布,将它们在直线1和Y2上投影,特征向量X 的线性组合y表示为y=YTX,属于r的特征向量X的平均值ui表示为
其中^表示属于^类特征向量X的个数,那么特征向量X的线性组合y的平均值 表示为
,特征向量X的线性组合y的类内方差〇 /表示为
;然后用Fisher评价函数
来描述区分度,具体计 算采用公式 ^Fisher〇between, 〇within' 式中FFishe;r称为特征参里的Fisher比,〇 within疋 特征参量对应各个类的类内散度(方差)之和,〇1^¥_是特征参量的类间散度,其中
?其式中mk表示ck对所有样本的 均值。
[0027] 进一步的,所述采用K-means算法对LPCC参数和MFCC参数进行混合的过程具体 为首先假设X包含k个聚类子集XpX2,…,Xk,各个聚类子集中的样本数分别为ni,n2,…,nk, 各个聚类子集的聚类中心分别为叫,m2,…,mk,误差平方和准则函数为
则K-means算法按以下步骤:
[0028] S71 :为每一个聚类确定一个初始聚类中心,这样就有k个初试聚类中心;
[0029] S72 :将样本几种的样本按照最小距离原则分配到最邻近聚类;
[0030]S73 :使用每一个聚类中的样本均值作为新的聚类中心;
[0031] S74 :重复步骤S72和S73,直到聚类中心不再变化并得到k个聚类。
[0032] 进一步,所述的语音信号混合特征参数的提取方法采用交叠分段法来分帧,其中 语音帧长为30ms,帧移为10ms。
[0033] 通过本发明中提出的语音信号混合特征提取方法,采取先是用Fisher准则选择 LPCC和MFCC以及二者差分参数中的有效成分,然后利用k-means聚类降低帧数,能够实现 在不增加计算量的情况下提高识别率,且提高系统鲁棒性和稳健性。
【附图说明】
[0034] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变 得明显和容易理解,其中:
[0035] 图1为本发明中语音信号混合特征提取方法流程示意图;
[0036] 图2为本发明中"对子女恩情似海"测试语音图;
[0037] 图3为本发明中LPCC与一阶差分LPCC参数效果图;
[0038] 图4为本发明中Mel频率fmel与实际频率f?的对应图;
[0039] 图5为本发明中MFCC提取流程示意图;
[0040] 图6为本发明中Mel滤波器组频率效果图;
[0041] 图7为本发明中MFCC与一阶差分MFCC参数效果图
[0042] 图8为本发明中二类聚类情况示意图。
[0043] 图9为本发明中LPCC和MFCC参数Fisher比效果图;
[0044] 图10为本发明中k-means聚类结果图。
【具体实施方式】
[0045] 为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实 施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施 例及实施例中的特征可以相互组合。
[0046] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可 以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具 体实施例的限制。
[0047] 下面参照图1-10对本发明实施例的语音信号混合特征的参数提取方法做进一步 的描述。
[0048] 如图1所示,一种语音信号混合特征的参数提取方法,包括对语音信号x(n)预处 理过程、特征提取过程、特征混合过程,其中所述语音信号x(n)预处理过程包括对语音信 号x(n)进行预加重、分帧、加窗和端点检测处理过程;所述语音信号x(n)特征提取过程包 括LPCC参数提取过程和MFCC参数提取过程以及LPCC差分参数和MFCC差分数提取过程;所 述特征混合过程包括采用Fisher准则和K-means算法对LPCC参数和MFCC参数以及LPCC 差分参数和MFCC差分数进行聚类的过程。
[0049] 如图2所示测试语音的信号x(n),由于语音信号易受声门激励和口鼻辐射的影 响,在800Hz以上的频率成份会出现6dB/倍频程的衰减,因此需要通过预加重的方法来提 升高频部分能量,借机弥补高频损失,本实施例采用一阶高通滤波器1-0. 9375Z4来实现预 加重;语音信号本身是一种实时的、随时间和周边环境不断变化的非平稳信号,但人在发音 时发声器官的运动具有一定的惯性,可以认为短时间内发声器官的状态是不变的,即语音 信号具有短时平稳特征,因此大部分语音信号处理都是在基于短时平稳特性基础上对语音 信号进行分帧,每帧的长度相同且在l〇ms至30ms之间,另外为了保证特征信息不丢失,本 实施例在MATLAB实验中选取语音帧长为256点,帧移为128点。
[0050] 关于加窗处理,一般采用有限长度的窗函数来截取语音信号形成分帧,窗函数 w(n)将需要处理的区域之外的样本点全部置零即可获得当前语音帧,设帧长为N,对已获 得的一帧信号进行加窗处理,即用确定的窗函数w(n)来乘以语音信号x(n),如公式(1)得 到加窗后的语音sw(n),
[0051] sw (n) =x(n) ?w(n), 0 ^n^ (N-l) (1)
[0052] 其中窗函数(汉明窗)的满足函数公式(2),
[0054] 端点检测是指用信号处理技术把需要的语音信号从静音和噪声中区分出来,准确 的找出有效语音信号的起点和终点,从而只存储和处理有效语音信号。本实施例采用基于 短时能量和短时过零率相结合的双门限检测方法,双门限端点检测是由短时能量检测和短 时平均过零率检测组成的两级检测,根据检测过程可知,在检测前要对短时能量和短时过 零率分别设置高低两个门限,g卩:和ZHigh、Zta,通常每一句完整的语音都包括:静音 段、过度段、语音段、结束段,对多次实验结果分析后,本实施例所用的 取值分别调整为如式(3)所示:
[0055] EHigh=max([min(amp) *10,mean(amp) *0? 2,max(amp) *0? 1]);
[0056] ZHigh=max([round(max(zcr) *0. 1,5)]) ; (3)。
[0057] ELow=min([min(amp) *10,mean(amp) *0? 2,mean(amp) *0? 1]);
[0058] ZLow=max([round(mean(zcr) *0. 1), 3]);
[0059] LPCC能够很好的反映发声机理,它是根据语音前后样本点的相关性,通过过去的 样本点值来预测现在或者未来的样本点的参数,也就是说语音信号的抽样值完全可以通过 过去的一些语音采样点值进行逼近而得到。当预测的语音信号和实际抽样语音信号间的误 差值达到最小值(在某个逼近准则下)时,那么这时对应的唯一一组预测系数就作为语音 信号的特征参数。LPCC参数提取包括求取线性预测LPC过程、计算LPCC过程,详细过程如 下:
[0060] 求取线性预测LPC时,按照声道全极点模型表示如公式(4):
[0062] 式中G表示模型的增益常数,p表示预测LPC的阶数,ak表示线性预测系数(k= 1,2,…,p),求取ak的方法有很多,可以使用协方差法和自相关法等方法;
[0063] 计算计算LPCC时,首先语音信号x(n)的倒谱是对它进行Z变换,然后取对数后, 再进行反Z变换,由式(5)表示
[0065] 把X(z)的相位信息忽略不计,即忽略掉上式后面的一项,从而能得到如公式(6) 所示的语音信号x(n)的倒谱:
[0066] c(n) =Z-1(log|X(z) |) (6)
[0067] 通过LPC系数an便可以得到LPCC参数,具体按照递推公式(7)就可以得到LPCC 参数:
[0069] MFCC参数充分模拟了人耳的听觉特性,实验表明,在相同噪声的环境下,MFCC特 征参数比LPCC特征参数具有更强的鲁棒性,且在提升语音识别系统的识别率方面比LPCC参数更有优势。在Mel滤波器组中,梅尔频率以及线性频率的存在着对应关系,如图4所示, 其对应关系的表达式如公式(8)
[0071] 梅尔频率倒谱系数是语音能量在Mel刻度上的表示。
[0072] MFCC参数提取过程如图5所示,具体包括如下步骤
[0073] S41 :把经过预处理后的语音信号进行FFT变换得到其频谱X[k],具体变换按照公 式(9)
[0075] S42 :求频谱的平方得到短时能量谱S(k),具体计算按照公式(10);
[0077] S43 :用Mel滤波器把幅度谱转化为Mel频率谱,具体转化如公式(11)转化结果如 图6所示;
[0079] S44 :对所述Mel频率谱进行对数变换,具体变换如公式(12);
[0081] S45 :将对数变换后的Mel频率谱进行离散余弦变换(DCT)即得到MFCC,具体变换 如公式(13)
[0083] 通过以上计算步骤得到的MFCC参数特征为静态参数,它可以很好的反映语音的 静态特性,但是并没有充分利用语音的动态特征,因此可以在变换域特征参数中加入MFCC 的一阶差分参数,更好的描述语音信号的时变特性。
[0084] 关于差分参数提取过程,通常LPCC和MFCC参数仅仅反映了语音信号参数的静态 特性,由于人耳对语音静态特性感知不灵敏,为了解决困难,因而通过增加动态特性差分参 数dk来提高感知灵敏度。分别对所求出的LPCC参数和MFCC参数做以下运算,可求得一阶 差分参数和二阶差分参数,差分参数dk的计算公式采用公式(14):
[0086] 式中dk表示第k个一阶差分参数,t为一阶导数时间差,通常取1或2,ck表示第k个倒谱系数,其中取k= 2,d为差分参数,c为四个语音参数,用公式(14)迭代两次,就可 得到LPCC参数或者MFCC参数的二阶差分参数,LPCC与一阶差分LPCC参数效果如图3所 示,MFCC与一阶差分MFCC参数效果如图7所示。
[0087] 关于所述Fisher准则,是Fisher线性判别过程,在模式识别中,可以利用评价函 数对特征参数进行选择,假设n维特征X在一条直线上投影,应寻找一条投影直线,使得类 间距离最大,如图8所示,对于两个类^和wi,假设各类的特征是二维分布,如图8中A、B 部分,将它们在直线1和丫2上投影,特征向量X的线性组合y用式(15)表示为:
[0088] y=YtX(15)
[0089] 当| |Y| | = 1时,则y就是X在Y方向直线上的投景^,图8中,A是X属于%的分 布,B是X属于力的分布;C表示Y/X,X属于力的分布;D表示Y/X,X属于W(l的分布;E表 示Y2TX,X属于W(l的分布;F表示Y2TX,X属于Wl的分布,那么属于wi的特征向量X的平均值 Ui用式(16)表示,其中n彦示属于w凍X的个数:
[0091] 根据式(16)可以得到特征向量X的线性组合y的平均值叫和特征向量X的线性 组合y的类内方差〇i2,具体的叫满足式(17),类内方差〇 /满足式(18)
[0094] 为了使^与^能进行有效的识别,需要两类的特征区分度很大,因此需要用 Fisher评价函数J(Y)来描述区 分度,J(Y)满足式(19)
[0096] 从式(19)可知,J(Y)取得最大值,可得最佳两类分离效果,具体的计算公式如下 则满足式(20)
[0097] Fpisher - 0between/ 0within(20)
[0098] 在式(20)中FFishOT被称为特征参量的Fisher比,Fisher比越大类别区分度越好, 〇within是特征参量对应各个类的类内散度(方差)之和,满足式(21)
[0100] 在共有C个类Wi,表示Ck在第i类上的均值,当1 <i<C时且各个类的样本 数为叫,可得第k个参量类内散度〇within,特征参量的类间散度是〇brtw_满足式(22)
[0102] 其中mk表示ck对所有样本的均值。LPCC和MFCC参数Fisher比效果如图9所示。
[0103] 关于采用K-means算法对LPCC参数和MFCC参数进行混合,k-means算法也被称 为k-平均算法,是一种得到最广泛使用的聚类算法,它是将各个聚类子集内的所有数据样 本均值作为该聚类的代表点,算法的主要思想是用迭代方法将数据集划分为不同的类别, 使得评价聚类性能的准则函数达到最优即误差平方和准则函数达到最优,从而使生成的每 一个聚类(又成簇)内紧凑,类间独立。K-means聚类算法使用误差平方和准则来评价聚 类性能,给定数据集X,其中仅包含描述属性,不包含类别属性,假设X包含k个聚类子集 XpX2,…,Xk,各个聚类子集中的样本数分别为ni,n2,…,nk,各个聚类子集的聚类中心分别 为叫,m2,…,mk,误差平方和准则函数如式(23)
[0105] 那么K-means算法按以下步骤:
[0106] S71 :为每一个聚类确定一个初始聚类中心,这样就有k个初试聚类中心;
[0107] S72 :将样本几种的样本按照最小距离原则分配到最邻近聚类;
[0108] S73 :使用每一个聚类中的样本均值作为新的聚类中心;
[0109] S74 :重复步骤S72和S73,直到聚类中心不再变化并得到k个聚类。
[0110] k-means聚类结果如图10所示。
[0111] 根据本发明的一个具体实施例,所述语音信号混合特征参数的提取方法包括采用 交叠分段法来分帧,其中语音帧长为30ms,帧移为10ms。
[0112] 在本说明书的描述中,术语"一个实施例"、"一些实施例"、"具体实施例""具体示 例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的 至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的 实施例或实例。而且,描述的MFCC、MFCC参数、MFCC特征参数可以是同一意思的不同表达, LPCC、LPCC参数、LPCC特征参数也可以是同一意思的不同表达,在任何的一个或多个实施 例或示例中以合适的方式结合。
[0113] 以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人 员来说,本发明可以有各种更改和变化。凡在本发明的创造性精神和原则之内,所作的任何 修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种语音信号混合特征参数的提取方法,包括对语音信号X (η)预处理过程、特征提 取过程、特征混合过程,其特征在于 所述语音信号X (η)预处理过程包括对语音信号X (η)进行预加重、分帧、加窗和端点检 测处理过程; 所述语音信号X (η)特征提取过程包括LPCC参数提取过程和MFCC参数提取过程以及 LPCC差分参数和MFCC差分参数提取过程; 所述特征混合过程包括采用Fisher准则和K-means算法对LPCC参数和MFCC参数以 及LPCC差分参数和MFCC差分参数进行混合的过程。2. 根据权利要求1所述的语音信号混合特征参数的提取方法,其特征在于所述加窗处 理过程即是得到加窗后语音Sw(H)的过程,其中Sw(H) =X(H) ι(η),式中O彡η彡(N-1), 式中w(n)为加窗函数,且满足函数式3. 根据权利要求1所述的语音信号混合特征参数的提取方法,其特征在于所述LPCC参 数提取过程包括求取线性预测LPC过程、计算LPCC过程,其中 求取线性预测LPC过程是按照声道全极点模型进行求取,式 中G表示模型的增益常数,p表示预测LPC的阶数,ak表示线性预测系数(k = 1,2, ...,p); 计算LPCC时,首先语音信号X (η)的倒谱是对它进行Z变换,然后取对数后,再进行反 Z变换,具体变换是首先按照式,把X(Z)的相位信息jargX(z)忽略不计,从而得 到能得到语音信号x(n)的倒谱:c (n) = C1 (log|X(z) I ),再通过LPC系数an得到LPCC参 数,具体按照递推公式可以得到LPCC 参数。4. 根据权利要求1所述的语音信号混合特征参数的提取方法,其特征在于所述MFCC参 数提取过程包括如下步骤 S41 :把经过预处理后的语音信号进行FFT变换得到其频谱X[k]:,变换公式为542 :求频谱的平方得到短时能量谱S (k),具体计算公式为543 :用Mel滤波器把幅度谱转化为Mel频率谱,具体计算公式为544 :对所述Mel频率谱进行对数变换,变换公式为545 :将对数变换后的Mel频率谱进行离散余弦变换(DCT)即得到MFCC,变换公式为5. 根据权利要求1所述的语音信号混合特征参数的提取方法,其特征在于对LPCC参数 和MFCC参数进行差分参数dk提取的过程包括一阶差分参数提取和二阶差分参数提取,其 中差分参数dk提取满足公式:式中dk表示第k个一阶差分参数,t 为一阶导数时间差,通常取1或2, Ck表示第k个倒谱系数,其中取k = 2, d为差分参数,C 为四个语音参数,用dk公式将迭代两次,即可得到MFCC的二阶差分参数。6. 根据权利要求1所述的语音信号混合特征参数的提取方法,其特征在于所述Fisher 准则为利用评价函数对特征参数进行选择,假设η维特征X在一条直线上投影,则寻找一条 投影直线,使得类间距离最大,具体为: 首先对于两个类《〇和w i,假设各类的特征是二维分布,将它们在直线1和Y 2上投 影,特征向量X的线性组合y表示为y = YTX,属于Wi的特征向量X的平均值u i表示为其中Hi表示属于w i类特征向量X的个数,那么特征向量X的线性组合y的 平均值表示为特征向量X的线性组合y的类内方差σ /表示为 5然后用Fisher评价函数来描述区分度,具体计算采用公 工〔^Fisher ^ between^ ^ within? 中 ^Visher 称为特征参量的Fisher比,σ within是特征 参量对应各个类的类内散度(方差)之和,0)3__是特征参量的类间散度,其中,其式中mk表示c k对所有样本 的均值。7. 根据权利要求1所述的语音信号混合特征参数的提取方法,其特征在于所述采用 K-means算法对LPCC参数和MFCC参数进行混合的过程具体为 首先假设X包含k个聚类子集X1, X2,…,Xk,各个聚类子集中的样本数分别为 Ii1, n2,…,nk,各个聚类子集的聚类中心分别为叫,m2,…,m k,误差平方和准则函数为则K-means算法按以下步骤: S71:为每一个聚类确定一个初始聚类中心,这样就有k个初试聚类中心; S72:将样本几种的样本按照最小距离原则分配到最邻近聚类; S73使用每一个聚类中的样本均值作为新的聚类中心; S74:重复步骤S72和S73,直到聚类中心不再变化并得到k个聚类。8. 根据权利要求1至7任一所述的语音信号混合特征参数的提取方法,其特征在于采 用交叠分段法来分帧,其中语音帧长为30ms,帧移为10ms。
【专利摘要】本发明提供了一种基于Fisher准则与k-means聚类的语音信号混合特征提取方法,包括对语音信号x(n)预处理过程、特征提取过程、特征混合过程,其特征在所述语音信号x(n)预处理过程包括对语音信号x(n)进行预加重、分帧、加窗和端点检测处理过程;所述语音信号x(n)特征提取过程包括LPCC参数提取过程和MFCC参数提取过程以及LPCC差分参数和MFCC差分提取过程;所述特征混合过程包括对LPCC参数和MFCC参数以及差分参数利用Fisher准则和k-means混合过程。本发明能够在不增加计算量的情况下提高识别率,而且提高系统鲁棒性和稳健性。
【IPC分类】G10L15/02, G10L15/08
【公开号】CN104900229
【申请号】CN201510274148
【发明人】景新幸
【申请人】桂林电子科技大学信息科技学院
【公开日】2015年9月9日
【申请日】2015年5月25日

最新回复(0)