基于语音短命令和声纹技术解除手机锁屏的方法

xiaoxiao2020-9-10  12

专利名称:基于语音短命令和声纹技术解除手机锁屏的方法
基于语音短命令和声纹技术解除手机锁屏的方法
技术领域
本发明涉及一种基于语音短命令和声纹技术解除手机锁屏的方法。
背景技术
现有手机大都是通过触摸动作,光照判断,密码保护等技术达到解除锁屏状态的目的。采用触摸动作,光照判断等技术解除手机锁屏,手机不具有安全性,任何人都可以解 锁手机,而采用密码保护的方式解除手机锁屏,虽然可以防止其他非授权用户使用手机,但操作时不够方便快捷。公开号为102148899A,
公开日为2011-8-10的发明专利,是将用户输入指令波形与手机系统已有解锁声音指令的波形(也就是时域信号)进行比对,判断是否吻合来决定是否解锁,通过比对波形得到吻合或者为80% -100%吻合,这是不可能实现的,因为同一个人在不同时刻讲述相同的一个词或者一句话,其波形差异也很大,因此,该发明不具备可实施性。

发明内容本发明要解决的技术问题,在于提供一种基于语音短命令和声纹技术解除手机锁屏的方法,既方便快捷又保证了手机使用的安全性,在此基础上对差异值的计算进行了规定,引入分帧加窗,MFCC系数计算和矢量量化处理技术,使用户的声音特性能够更准确的提取和比较,提高了便捷性和安全性上的用户体验。本发明通过以下两种技术方案来解决上述技术问题的方案一一种基于语音短命令和声纹技术解除手机锁屏的方法,包括预置阶段和解锁阶段,所述预置阶段包括如下步骤步骤I、用户输入预置语音口令,所述语音口令在手机中的保存形式为时域信号;步骤2、将保存形式为时域信号的所述预置语音口令的音频数据执行快速傅立叶变换,将所述预置语音口令的音频数据变换成预置语音口令的频域信号;步骤3、在用户手机系统中提供一默认的通过阈值或由用户设定一通过阈值;所述解锁阶段包括如下步骤步骤4、用户输入解锁语音口令,所述语音口令在手机中的保存形式为时域信号;步骤5、将保存形式为时域信号的所述解锁语音口令的音频数据执行快速傅里叶变换,所述解锁语音口令的音频数据变换成解锁语音口令的频域信号谱;步骤6、计算所述解锁语音口令频域信号与所述预置语音口令频域信号的差异值;步骤7、判断所述差异值是否小于所述通过阈值,如果是,则解除手机锁屏状态,如果否,则提示解锁失败。进一步地,所述差异值通过求欧氏距离获得。方案二 一种基于语音短命令和声纹技术解除手机锁屏的方法,包括预置阶段和解锁阶段,所述预置阶段包括如下步骤步骤10、用户输入预置语音口令,所述预置语音口令在手机中的保存形式为时域信号;步骤11、将保存形式为时域信号的所述预置语音口令的音频数据进行分帧加窗处理,并计算预置语音口令的帧数量N ;步骤12、对每一帧预置语音口令执行快速傅里叶变换,每一帧预置语音口令对应变换成一预置语音口令的频域信号;步骤13、用X个Mel频标上线性分布的三角窗滤波器,对各预置语音口令的频域信号依次滤波,滤波后,每一预置语音口令的频域信号均获得对应的X个能量值;所述X为自 然数,I彡X彡128 ;步骤14、对前Y1帧预置语音口令中每一帧预置语音口令对应的X个能量值求预置语音口令的噪声能量均值,所述Y1为自然数,I ^ Y1 ^ N ;所述求预置语音口令噪声能量均值的过程具体为将第一帧预置语音口令对应的X个能量值至第Y1帧预置语音口令对应的X个能量值分别求算数平均值,得到预置语音口令的X个噪声能量均值,所述算术平均值的求解过程具体为即先对第一帧预置语音口令对应的第一个能量值至第Y1帧预置语音口令对应的第一个能量值求算数平均值,得到预置语音口令的第一个噪声能量均值,而后依次类推求算数平均值,完成后共得到预置语音口令的Y1个噪声能量均值;步骤15、在剩余的N-Y1帧预置语音口令中,每一帧预置语音口令对应的X个能量值均分别相对应地减去预置语音口令的X个噪声能量均值,每一帧预置语音口令均获得与之对应的X个降噪能量值;所述N-Y1是指将N帧的预置语音口令去掉用于求噪声能量均值的第一帧至第Y1帧预置语音口令;步骤16、对剩余N-Y1帧预置语音口令中每一帧预置语音口令对应的X个降噪能量值进行离散余弦变换,共获得预置语音口令的N-Y1个Z维MFCC系数;所述Z为自然数,I彡Z彡128 ;步骤17、对获得的预置语音口令的N-Y1个Z维MFCC系数进行矢量量化,设置量化码本的长度为K,K为自然数,且I < K < 128 ;则获得一量化码本,该量化码本由K个Z维MFCC组成;步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过阈值;所述解锁阶段包括如下步骤步骤20、用户输入解锁语音口令;所述解锁语音口令在手机中的保存形式为时域
信号;步骤21、将保存形式为时域信号的所述解锁语音口令的音频数据进行分帧加窗处理,并计算解锁语音口令的帧数量M ;步骤22、对每一帧解锁语音口令执行快速傅里叶变换,每一帧解锁语音口令对应变换成一解锁语音口令的频域信号;步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波,滤波后,每一解锁语音口令的频域信号均获得对应的解锁语音口令的X个能量值; 步骤24、对前Y2帧解锁语音口令中每一帧解锁语音口令对应的X个能量值求解锁语音口令的噪声能量均值,所述求解锁语音口令噪声能量均值的过程具体为将第一帧解锁语音口令对应的X个解锁语音 口令的能量值至第Y2帧解锁语音口令对应的X个能量值分别求算数平均值,得到解锁语音口令的X个噪声能量均值,所述算数平均值的求解过程具体为即先对第一帧解锁语音口令对应的第一个能量值至第Y2帧解锁语音口令对应的第一个能量值求算数平均值,得到解锁语音口令的第一个噪声能量均值,而后依次类推求算数平均值,完成后共得到X个解锁语音口令的噪声能量均值;步骤25、在剩余的M-Y2帧解锁语音口令中,每一帧解锁语音口令对应的X个能量均值分别相对应地减去解锁语音口令的X个噪声能量均值,每一帧解锁语音口令均获得与之对应的X个降噪能量值;所述M-Y2是指将M帧的解锁语音口令去掉用于求噪声能量均值的第一帧至第Y2帧解锁语音口令;步骤26、对剩余M-Y2帧解锁语音口令中每一帧解锁语音口令对应的X个降噪能量值进行离散余弦变换,共获得解锁语音口令的M-Y2个Z维MFCC系数;步骤27、将解锁语音口令的每个Z维MFCC系数分别与所述预置语音口令的量化码本进行——比对,解锁语音口令共M-Y2个Z维MFCC系数,则比对M-Y2轮,由于该量化码本由K个Z维MFCC组成,每一轮比对,均获得K个距离值,并选取其中的最小距离值,即每一轮比对获得一个最小距离值,全部比对完,共获得M-Y2个最小距离值,将M-Y2个最小距离值求和并除以M-Y2,得到平均最小距离;所述比对为求欧氏距离;步骤28、判断所述平均最小距离是否小于所述通过阈值,如果是,则解除手机锁屏状态,如果否,则提示解锁失败。进一步地,步骤11中,通过公式N = (1^-20)/10+1向下取整求得所述预置语音口令的帧数量N,其中,公式中L1表示所述预置语音口令的音频时长,L1的单位为毫秒,公式中的20表示帧长度为20毫秒,公式中的10表示帧叠加为10毫秒。进一步地,步骤21中,通过公式M= (L2-20)/10+l向下取整求得所述解锁语音口令的帧数量M,其中,公式中L2表示所述解锁语音口令的音频时长,L2的单位为毫秒,公式中的20表示帧长度为20毫秒,公式中的10表示帧叠加为10毫秒。进一步地,输入所述预置语音口令和所述解锁语音口令时,对所述预置语音口令和所述解锁语音口令的信号采样率均为16000Hz。进一步地,所述三角窗滤波器的Mel频标的个数24 < X < 39。进一步地,所述三角窗滤波器是用24个Mel频标上线性分布的三角窗滤波器,即X = 24,所述三角窗滤波器的中心频率分别为100,200,300,400,500,600,700,800,900,1000,1149,1320,1516,1741,2000,2297,2639,3031,3482,4000,4595,5278,6063,6964,带宽为100,100,100,100,100,100,100,100,100,124,160,184,211,242,278,320,367,422,484,556,639,734,843,969,以上数值单位均为 Hz。进一步地,所述三角窗滤波器是用39个Mel频标上线性分布的三角窗滤波器,即X = 39,所述三角窗滤波器的中心频率分别% :50,100,150,200,260,320,390,460,530,610,700,790,890,990,1100,1210,1340,1480,1610,1770,1930,2100,2280,2480,2680,2900,3140,3380,3650,3930,4230,4560,4900,5260,5650,6060,6500,6970,7470,带宽为100,100,100,120,127,127,148,148,148,169,190,190,233,233,254,254,296,296,275,339,339,360,381,424,424,466,508,508,572,593,636,699,720,763,826,869,932,996,1060,以上数值单位均为Hz。
进一步地,所述离散余弦变换的计算公式是
权利要求
1.ー种基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于包括预置阶段和解锁阶段,所述预置阶段包括如下步骤 步骤I、用户输入预置语音ロ令,所述语音ロ令在手机中的保存形式为时域信号; 步骤2、将保存形式为时域信号的所述预置语音ロ令的音频数据执行快速傅立叶变换,将所述预置语音ロ令的音频数据变换成预置语音ロ令的频域信号; 步骤3、在用户手机系统中提供一默认的通过阈值或由用户设定一通过阈值; 所述解锁阶段包括如下步骤 步骤4、用户输入解锁语音ロ令,所述语音ロ令在手机中的保存形式为时域信号; 步骤5、将保存形式为时域信号的所述解锁语音ロ令的音频数据执行快速傅里叶变换,所述解锁语音ロ令的音频数据变换成解锁语音ロ令的频域信号谱; 步骤6、计算所述解锁语音ロ令频域信号与所述预置语音ロ令频域信号的差异值; 步骤7、判断所述差异值是否小于所述通过阈值,如果是,则解除手机锁屏状态,如果否,则提示解锁失败。
2.根据权利要求I所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于所述差异值通过求欧氏距离获得。
3.ー种基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于包括预置阶段和解锁阶段,所述预置阶段包括如下步骤 步骤10、用户输入预置语音ロ令,所述预置语音ロ令在手机中的保存形式为时域信号; 步骤11、将保存形式为时域信号的所述预置语音ロ令的音频数据进行分帧加窗处理,并计算预置语音ロ令的帧数量N ; 步骤12、对每ー帧预置语音ロ令执行快速傅里叶变换,每ー帧预置语音ロ令对应变换成一预置语音ロ令的频域信号; 步骤13、用X个Mel频标上线性分布的三角窗滤波器,对各预置语音ロ令的频域信号依次滤波,滤波后,每ー预置语音ロ令的频域信号均获得对应的X个能量值;所述X为自然数,I彡X彡128 ; 步骤14、对前Y1帧预置语音ロ令中每ー帧预置语音ロ令对应的X个能量值求预置语音ロ令的噪声能量均值,所述Y1为自然数,I ^ Y1 ^ N ;所述求预置语音ロ令噪声能量均值的过程具体为将第一帧预置语音ロ令对应的X个能量值至第Y1帧预置语音ロ令对应的X个能量值分别求算数平均值,得到预置语音ロ令的X个噪声能量均值,所述算术平均值的求解过程具体为即先对第一帧预置语音ロ令对应的第一个能量值至第Y1帧预置语音ロ令对应的第一个能量值求算数平均值,得到预置语音ロ令的第一个噪声能量均值,而后依次类推求算数平均值,完成后共得到预置语音ロ令的Y1个噪声能量均值; 步骤15、在剰余的N-Y1帧预置语音ロ令中,每ー帧预置语音ロ令对应的X个能量值均分别相对应地减去预置语音ロ令的X个噪声能量均值,每ー帧预置语音ロ令均获得与之对应的X个降噪能量值;所述N-Y1是指将N帧的预置语音ロ令去掉用于求噪声能量均值的第一帧至第Y1帧预置语音ロ令; 步骤16、对剩余N-Y1帧预置语音ロ令中每ー帧预置语音ロ令对应的X个降噪能量值进行离散余弦变换,共获得预置语音ロ令的N-Y1个Z维MFCC系数;所述Z为自然数,I彡Z彡128 ; 步骤17、对获得的预置语音ロ令的N-Y1个Z维MFCC系数进行矢量量化,设置量化码本的长度为K,K为自然数,且I彡K彡128 ;则获得一量化码本,该量化码本由K个Z维MFCC组成; 步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过阈值; 所述解锁阶段包括如下步骤 步骤20、用户输入解锁语音ロ令;所述解锁语音ロ令在手机中的保存形式为时域信 号; 步骤21、将保存形式为时域信号的所述解锁语音ロ令的音频数据进行分帧加窗处理,并计算解锁语音ロ令的帧数量M ; 步骤22、对每ー帧解锁语音ロ令执行快速傅里叶变换,每ー帧解锁语音ロ令对应变换成一解锁语音ロ令的频域信号; 步骤23、用所述三角窗滤波器对各解锁语音ロ令的频域信号依次滤波,滤波后,每ー解锁语音ロ令的频域信号均获得对应的解锁语音ロ令的X个能量值; 步骤24、对前Y2帧解锁语音ロ令中每ー帧解锁语音ロ令对应的X个能量值求解锁语音ロ令的噪声能量均值,所述求解锁语音ロ令噪声能量均值的过程具体为将第一帧解锁语音ロ令对应的X个解锁语音ロ令的能量值至第Y2帧解锁语音ロ令对应的X个能量值分别求算数平均值,得到解锁语音ロ令的X个噪声能量均值,所述算数平均值的求解过程具体为即先对第一帧解锁语音ロ令对应的第一个能量值至第Y2帧解锁语音ロ令对应的第一个能量值求算数平均值,得到解锁语音ロ令的第一个噪声能量均值,而后依次类推求算数平均值,完成后共得到X个解锁语音ロ令的噪声能量均值; 步骤25、在剩余的M-Y2帧解锁语音ロ令中,每ー帧解锁语音ロ令对应的X个能量均值分别相对应地减去解锁语音ロ令的X个噪声能量均值,每ー帧解锁语音ロ令均获得与之对应的X个降噪能量值;所述M-Y2是指将M帧的解锁语音ロ令去掉用于求噪声能量均值的第一帧至第Y2帧解锁语音ロ令; 步骤26、对剩余M-Y2帧解锁语音ロ令中每ー帧解锁语音ロ令对应的X个降噪能量值进行离散余弦变换,共获得解锁语音ロ令的M-Y2个Z维MFCC系数; 步骤27、将解锁语音ロ令的每个Z维MFCC系数分别与所述预置语音ロ令的量化码本进行——比对,解锁语音ロ令共M-Y2个Z维MFCC系数,则比对M-Y2轮,由于该量化码本由K个Z维MFCC组成,每ー轮比对,均获得K个距离值,并选取其中的最小距离值,即每ー轮比对获得ー个最小距离值,全部比对完,共获得M-Y2个最小距离值,将M-Y2个最小距离值求和并除以M-Y2,得到平均最小距离;所述比对为求欧氏距离; 步骤28、判断所述平均最小距离是否小于所述通过阈值,如果是,则解除手机锁屏状态,如果否,则提示解锁失败。
4.根据权利要求3中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于步骤11中,通过公式N = (1^-20)/10+1向下取整求得所述预置语音ロ令的帧数量N,其中,公式中L1表示所述预置语音ロ令的音频时长,L1的単位为毫秒,公式中的20表示帧长度为20毫秒,公式中的10表示帧叠加为10毫秒。
5.根据权利要求3中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于步骤21中,通过公式M= (L2-20)/10+l向下取整求得所述解锁语音ロ令的巾贞数量M,其中,公式中L2表示所述解锁语音ロ令的音频时长,L2的单位为毫秒,公式中的20表示帧长度为20毫秒,公式中的10表示帧叠加为10毫秒。
6.根据权利要求3中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于输入所述预置语音ロ令和所述解锁语音ロ令吋,对所述预置语音ロ令和所述解锁语音ロ令的信号采样率均为16000Hz。
7.根据权利要求3中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于所述三角窗滤波器的Mel频标的个数24 < X < 39。
8.根据权利要求7中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于所述三角窗滤波器是用24个Mel频标上线性分布的三角窗滤波器,即X = 24,所述三角窗滤波器的中心频率分别为100,200,300,400,500,600,700,800,900,1000,1149,1320,1516,1741,2000,2297,2639,3031,3482,4000,4595,5278,6063,6964,带宽为100,100,100,100,100,100,100,100,100,124,160,184,211,242,278,320,367,422,484,556,639,734,843,969,以上数值单位均为Hz。
9.根据权利要求7中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于所述三角窗滤波器是用39个Mel频标上线性分布的三角窗滤波器,即X = 39,所述三角窗滤波器的中心频率分别为50,100,150,200,260,320,390,460,530,610,700,790,890,990,1100,1210,1340,1480,1610,1770,1930,2100,2280,2480,2680,2900,3140,3380,3650,3930,4230,4560,4900,5260,5650,6060,6500,6970,7470,带宽为100,100,100,120,127,127,148,148,148,169,190,190,233,233,254,254,296,296,275,339,339,360,381,424,424,466,508,508,572,593,636,699,720,763,826,869,932,996,1060,以上数值单位均为Hz。
10.根据权利要求3中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于所述离散余弦变换的计算公式是 Z^</)C0S[-Ya-]其中En(j)表示第j个降噪能量值,I≤j≤X,I≤i≤Z,i、j均为自然数。
11.根据权利要求3中所述的基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于步骤11和步骤21中的加窗处理均为加汉明窗处理。
全文摘要
本发明提供一种基于语音短命令和声纹技术解除手机锁屏的方法,在预置阶段,用户输入预置语音口令,并将其执行快速傅立叶变化,然后确定一通过阈值,在解锁阶段,用户输入解锁语音口令,并将其执行快速傅立叶变化,计算所述解锁语音口令频域信号与所述预置语音口令频域信号的差异值,通过比较差异值是否小于通过阈值来判定是否解锁手机,通过语音短命令和声纹认证技术解除手机锁屏状态,既方便快捷又保证了手机使用的安全性,在此基础上对差异值的计算进行了规定,引入分帧加窗,MFCC系数计算和矢量量化处理技术,使用户的声音特性能够更准确的提取和比较,提高了便捷性和安全性上的用户体验。
文档编号H04M1/725GK102647521SQ20121009708
公开日2012年8月22日 申请日期2012年4月5日 优先权日2012年4月5日
发明者余志鹏, 关胤, 刘德建, 吴拥民 申请人:福州博远无线网络科技有限公司

最新回复(0)