一种适用于数字助听器的移频压缩方法

xiaoxiao2020-10-23 28

一种适用于数字助听器的移频压缩方法
【技术领域】
[0001] 本发明设及助听器技术，尤其设及一种适用于数字助听器的移频压缩方法。
【背景技术】
[0002] 移频压缩算法是数字助听器中最重要的算法之一，特别是对那些感音神经性听力损失患者。助听器主要是对语音进行放大（singleormultichannels),然而，对于感音神经性听力损失患者来说，他们一般低频损失比较小，但高频损失很高。当损失达到60~ 70地或者W上时，如果仅仅是对高频进行补偿，是不能够满足需求的。其原因如下；（1)目前一般助听器振幅放大增益和频带宽度受到麦克风和扬声器性能的限制，补偿增益一般只能达到60化左右。（2)患者在高频处损失达到60地W上时，可听范围很狭窄，如图1所示为一位病人的特征频段的听阔与痛域图，可W发现，患者在4kW下频段约有40~75化的可听范围，而高频仅有15~30化的范围。（3)与语音中辅音的声学物理特性相关，清辅音中绝大部分中屯、频率位于地hzW上，由于助听器在高频很难达到20地W上的增益，而有 35%的重要语音集中在2化ZW上，仅仅通过放大很难提高患者对言语理解。（4)声学上的扩散掩蔽特性，该种特性决定了低频声音对高频声有更多的掩蔽性，由于低频放大而高频放不大，导致元音对辅音的掩蔽性，言语辨别下降。
[0003] 但是，人耳对声音的分辨能力并不是依靠绝对频率，而是频率的相对比率，对于那些深重度感音神经性患者，虽然高频损失严重，但其低频的残余听力范围还是比较大的。现有可行的方法通常是把高频语音压缩到低频处，W提高患者的可听频率范围。
[0004] 早期的研究主要是单纯的进行频率压缩、等比例与非线性方式，该样却很大程度上改变了语音的清晰度与可懂度，同时压缩之后的语音能量大大改变，也影响了患者对语音的辨识。基于该两点的考虑，本发明根据不同频段语音所占能量与可懂度之间的关系，提出一种基于能量守恒的适用于数字助听器的移频压缩方法，可较好的解决上述问题。

【发明内容】

[0005] 基于此，有必要针对现有技术存在的上述问题，提供一种适用于数字助听器的移频压缩方法，W解决现有技术存在的问题。
[0006] 一种适用于数字助听器的移频压缩方法，其包括如下步骤：
[0007]S101、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围；
[0008]S103、对语音进行预处理；
[0009]S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比P，W压缩率 (P+1)进行频率信号压缩；
[0010] S107、对称处理，进行N点IFFT变换；
[0011] S109、变换回来的语音与上一帖信号重叠相加，输出的信号进行自动增益补偿。
[0012] 本发明一较佳实施方式中，步骤S103中，语音的采样频率为16化Z、每帖16ms、帖移为8ms、FFT大小为N，在FFT处理之前，进行hamming加窗处理。
[0013] 本发明一较佳实施方式中，步骤S109中，首先计算前L帖的平均声压级，再根据输出的语音声压级。
[0014] 本发明一较佳实施方式中，进一步包括对输出的语音声压级进行如下处理：首先统计前L帖的平均增益值gain_pre，然后用公式gam_0Ut= 3*沪"'"_jwe+ (l-€')*巧?m_〇; 计算，作为当前帖输出的声压级补偿增益。
[0015] 本发明一较佳实施方式中，对gain_pre的更新如下；
[0016] 沪_乃/-(' =九*沪_户'-(' + 0 -九）*沪，其中，gain_o是补偿后语音声压级的补偿增益，gain_out是平滑之后的补偿增益。
[0017] 本发明一较佳实施方式中，步骤S109中，当SPL_ori小于患者的听域，则无需进行能量补偿，认为不是语音；当SPL_ori大于患者的听域，则进行能量补偿。
[0018] 相较于现有技术，本发明提供的适用于数字助听器的移频压缩方法既保留了目标频段的语音信息，又能够将需要压缩的高频频段进行压缩，较好的提高了语音的辨识度与可懂度，同时也补偿了由于移频导致的语音能量损失。
【附图说明】
[0019] 图1为一位病人的特征频段的听阔与痛域图；
[0020] 图2为本发明提供的适用于数字助听器的移频压缩方法的流程图；
[0021] 图3为f；h为3化Z所得到的语音时域图；
[0022] 图4为本发明一实施例中所述适用于数字助听器的移频压缩方法的工作流程图；
[0023] 图5为本发明构建的基于频率与语音能量W及其可懂度之间的关系图；
[0024] 图6为原语音经过传统方法与采用本发明提供的所述适用于数字助听器的移频压缩方法所获得的语音结果的对比图；
[00巧]图7为传统方法与本发明提供的所述适用于数字助听器的移频压缩方法的光谱对比图。
【具体实施方式】
[0026] 为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是，本发明可许多不同的形式来实现，并不限于本文所描述的实施方式。相反地，提供该些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
[0027] 需要说明的是，当元件被称为"固定于"另一个元件，它可W直接在另一个元件上或者也可W存在居中的元件。当一个元件被认为是"连接"另一个元件，它可W是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语"垂直的"、"水平的"、"左"、 "右及类似的表述只是为了说明的目的，并不表示是唯一的实施方式。
[0028] 除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在于限制本发明。本文所使用的术语"及/或"包括一个或多个相关的所列项目的任意的和所有的组合。
[0029] 请参阅图1，本发明提供本发明提供一种适用于数字助听器的移频压缩方法，其包括如下步骤；SlOl、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围；S103、对语音进行预处理；S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比 P，W压缩率（P+1)进行频率信号压缩间07、对称处理，进行N点IFFT变换间09、变换回来的语音与上一帖信号重叠相加，输出的信号进行自动增益补偿。
[0030] 研究表明，语音信号的频率与语音能量W及该频率处的可懂度有如表1所示的关系。
[0031] 表1 ;频率与语音能量和可懂度的关系
[0032]
[0033] 从表1中可W看出，语音的能量主要集中在125hz~2000hz的低频部分，占93% 左右；而化hz~祉hz的高频部分的语音可懂度占60%W上，特别是化hz~祉hz的高频部分，语音能量只占了 2%左右，可懂度却达到了 25%，所W高频部分的语音对语音理解有很大的作用，其中500hz~2000hz语音尤为重要。另据许伟等人的研究（许伟，曾新吾，粪昌超，不同带宽和采样频率语音可懂度的实验研究[A]，2008年全国声学学术会议论文集 [C]，2008年），利用《电声产品主观评价用节目源》国家标准CD中的语音，进行不同频率重采样获得测试源，通过8人试听的主观判断结果，对0~化hz语音进行分段滤波，考查不同频段缺失对语音质量的影响，发现在语音内容完全可懂的要求下，语音频率的最低上限应取在化hz，最高下限处于3(K)hz;同时，语音采样频率高于化hz时，对语音质量没有明显影响，采样频率在化hz~地hz语音质量下降明显，但完全可懂，当采样频率低于地hz时，语义理解变得较为困难。
[0034] 由W上研究分析可知，在进行移频压缩过程中，300hz~化hz的语音特别重要，是不能够被破坏的，化hz~化hz的语音应尽量保留。本发明中，对于目标频率的选择，一个是基于患者高频损伤程度，一个是基于频率与语音能量W及其可懂度之间的关系（发明人构建的一种折算关系）。
[00巧]本发明提供的适用于数字助听器的移频压缩方法为非线性移频压缩方法，其改进还在于对能量的补偿。本发明的助听器中，一般情况下，移频压缩方法是放在WDRC(Wide DynamicRangecompression,宽动态范围压缩）之后进行对语音处理的。WDRC之后，根据患者的实际情况对语音进行了一定的增益，经过该算法之后，又把增益给降了下来。如图3 所示，为f；h为处hz所得到的语音时域图，音频的幅值明显的下降了，该样移频就影响了声音的响度。针对该种情况，本发明提出时域内进行声压级能量补偿的方法。
[0036] 由于对于压缩比不同，能量损失是不同的，所W能量补偿方式，需要能够自动增益调节，补偿的原理首先统计当前帖语音的平均能量：
[0037]
[0038] 再由声压级转换公式：
[0039]
[0040] 其中；s_ini(n)是第i帖的原语音信号，Xi(n)是i帖语音FFT之后的频域信息， pref是常数20upa，N是FFT的长度。
[0041] 由于语音的短时平稳性，需要统计前面L帖的，W维持不会因对语音的时域图造成很大的增益误差而引入噪声。
[0042] 求补偿增益gain公式；
[0043]
[0044] 即可求得补偿后的信号。
[0045] 请参阅图4,本发明一实施例中，所述适用于数字助听器的移频压缩方法包括如下步骤：
[0046]S101、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围。
[0047] 具体地，首先确定患者的高频损失程度，也即截止频率化eq;然后根据压缩比P来确定需要压缩频率范围与目标频率范围。本发明人经过多次测量，构建出折算关系，即基于频率与语音能量W及其可懂度之间的关系，如图5所示。
[0048]S103、对语音进行预处理。
[0049] 具体地，对语音进行预处理，本发明采用的语音的采样频率为16化Z、每帖16ms、帖移为8ms、FFT大小为N，在FFT(化StFourierTransformation,快速傅氏变换）处理之前，进行hamming加窗处理。
[0050] S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比P，W压缩率 (P+1)进行频率信号压缩。
[0051] 具体地，根据步骤S101确定的需要压缩频率范围与目标频率范围，算出压缩比P， W压缩率（P+1)进行频率信号压缩。
[0052] 需要注意，压缩率是P+1，目标频率内的信号并不是直接被覆盖，而是也要被压缩，由此才能包含更重要的信息。
[0053]S107、对称处理，进行N点IFFT变换。
[0054] 即进行快速傅里叶逆变换，把信号从频域变换到时域。
[00巧]S109、变换回来的语音与上一帖信号重叠相加，输出的信号进行自动增益补偿。
[0056] 具体地，变换回来的语音与上一帖信号重叠相加，输出的信号进行自动增益补偿，首先计算前L帖的平均声压级，再根据输出的语音声压级，按如图5所示的方式进行补偿。
[0057] 当SPL_ori小于患者的听域，则无需进行能量补偿，一般认为不是语音；当SPL_ ori大于该阔值，按图所示进行能量补偿。
[0058] 该里为了每帖语音之间不至于增益差距太大，而对语音的短时平稳性造成影响，本实施例对输出的声压级补偿增益进行了如下处理；首先统计前L的平均增益值gain_ pre，然后用W下的公式计算：
[0059]
[0060] 作为当前帖输出的声压级补偿增益，同时，对gain_pre的更新如下；
[0061]
[0062] 其中；gain_o是补偿后语音声压级的补偿增益，gain_out是平滑之后的补偿增益rm.〇
[0063] 图6所示为原语音经过传统方法与采用本发明提供的所述适用于数字助听器的移频压缩方法所获得的语音结果的对比图，从图中可明显发现，经过所述适用于数字助听器的移频压缩方法处理之后的声音响度更大。
[0064] 请参阅图7,为传统方法与本发明提供的所述适用于数字助听器的移频压缩方法的光谱对比图，从中，可W更直观地看出语音的频率成分变化，在未处理之前语音主要集中在2化Z~祉hz;经过所述适用于数字助听器的移频压缩方法处理之后，高频成分很少，低频成分加强，并且原高频信号在中频区得到加强。
[0065] 表2为传统方法与本发明提供的所述适用于数字助听器的移频压缩方法的补偿声压级对比，即经过传统方法与所述适用于数字助听器的移频压缩方法处理后输出的一段语音的平均声压级的比较。可W发现，截止频率越低，也即压缩比越大，自动增益能量补偿的效果越明显，输出声压级越高。
[0066] 表2补偿声压级对比
[0067]
[0068]
[0069] 相较于现有技术，本发明提供的所述适用于数字助听器的移频压缩方法既保留了目标频段的语音信息，又能够将需要压缩的高频频段进行压缩，较好地提高了语音的辨识度与可懂度，同时也补偿了由于移频导致的语音能量损失。
[0070] W上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可W做出若干变形和改进，该些都属于本发明的保护范围。因此，本发明专利的保护范围应W所附权利要求为准。
【主权项】
1. 一种适用于数字助听器的移频压缩方法，其特征在于，包括如下步骤： SlOl、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围； S103、对语音进行预处理； S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比p，以压缩率（p+1)进行频率信号压缩； S107、对称处理，进行N点IFFT变换； S109、变换回来的语音与上一帧信号重叠相加，输出的信号进行自动增益补偿。2. 如权利要求1所述的适用于数字助听器的移频压缩方法，其特征在于，步骤S103 中，语音的采样频率为16khz、每帧16ms、帧移为8ms、FFT大小为N，在FFT处理之前，进行 hamming加窗处理。3. 如权利要求1所述的适用于数字助听器的移频压缩方法，其特征在于，步骤S109中，首先计算前L帧的平均声压级，再根据输出的语音声压级。4. 如权利要求3所述的适用于数字助听器的移频压缩方法，其特征在于，进一步包括对输出的语音声压级进行如下处理：首先统计前L帧的平均增益值gain_pre，然后用公式 gii/π _out =: <3 * g<7/_? jre + (I - i)g<7/_/z _〇;计算，作为当前帧输出的声压级补偿增益。5. 如权利要求4所述的适用于数字助听器的移频压缩方法，其特征在于，对gain_pre的更新如下：,其中，gain_o是补偿后语音声压级的补偿增益，gain_out是平滑之后的补偿增益。6. 如权利要求1所述的适用于数字助听器的移频压缩方法，其特征在于，步骤S109中，当SPL_ori小于患者的听域，则无需进行能量补偿，认为不是语音；当SPL_ori大于患者的听域，则进行能量补偿。
【专利摘要】本发明提供一种适用于数字助听器的移频压缩方法，其包括如下步骤：S101、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围；S103、对语音进行预处理；S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比p，以压缩率(p+1)进行频率信号压缩；S107、对称处理，进行N点IFFT变换；S109、变换回来的语音与上一帧信号重叠相加，输出的信号进行自动增益补偿。所述适用于数字助听器的移频压缩方法既保留了目标频段的语音信息，又能够将需要压缩的高频频段进行压缩，较好地提高了语音的辨识度与可懂度，同时也补偿了由于移频导致的语音能量损失。
【IPC分类】H04R25/00
【公开号】CN104902419
【申请号】CN201510164360
【发明人】郭朝阳, 王新安, 张国新, 赵志良, 罗香香, 薛峰杰, 王丹
【申请人】深圳市微纳集成电路与系统应用研究院, 北京大学深圳研究生院
【公开日】2015年9月9日
【申请日】2015年4月9日

2012-2014专利技术

最新回复(0)