基于曲线压缩实现的宽动态范围压缩方法和系统的制作方法

xiaoxiao2020-10-23  18

基于曲线压缩实现的宽动态范围压缩方法和系统的制作方法
【技术领域】
[0001] 本发明设及数字信号技术领域,尤其设及一种基于曲线压缩实现的宽动态范围压 缩方法和系统。
【背景技术】
[0002] 在助听器的各类算法中,听力补偿算法是最基本、最重要的一种算法。听力补偿算 法的目的在于对声音进行压缩放大,将正常人的听力动态范围通过算法处理后,映射到听 力受损患者的听力动态范围内,并尽可能保持声音的辨识度和低失真度。
[0003] 如图1所示,病人和正常人听阔和痛阔听力曲线图,反映某一病人和正常人分别 在各频率点的听阔与痛阔水平。听力损失大概是50地,其中,THm为病人的听阔,化M为病 人的痛阔;TH。为正常人的听阔,UL。为正常人的痛阔。
[0004] 正常人的听阔水平和痛阔水平为一定的,由于性别原因可能会有所差异;但是,听 力损失患者的听阔水平和痛阔水平却是因个体不同而差别迴异。
[0005] 听阔是指,在某一频率范围内,一个人刚好能听到声音的声压级大小;痛阔是指, 一个人所能接受的最大听力声压级大小。一般来说,听力受损患者的听阔比正常人的听阔 值大,整个可听声音频域上的动态范围都缩小,其直接体现就是在某一频率范围内,正常人 可W听到的较高或者较低的声音听力损伤患者都无法听到。
[0006] 为对该一部分损失的听力进行补偿,使听力损伤患者能听到正常人的声音,助听 器设计者提出了 "压缩"该一概念。如图2所示,为一典型的宽动态压缩声压补偿后的I/O 图。其中,沿输入输出顺序分别为线性放大区,直线压缩区,输出限制区。
[0007] 一般的,宽动态范围压缩算法在听阔到痛阔中间采用直线压缩的方式,该处理方 法虽然也能将正常人听力动态范围映射到听力受损患者的听力动态范围之内,但却不能很 好地响应听力受损患者对补偿后的声音的反馈。有些患者可能觉得声音放大地超出自己的 预期,又有些患者可能会觉得声音放大地达不到自己的预期。简而言之,直线压缩的方式不 够灵活,达不到最佳用户体验。

【发明内容】

[000引有鉴于此,本发明提供一种基于曲线压缩实现的宽动态范围压缩方法和系统,解 决直线压缩方式不够灵活的缺点,使处理结果更理想。
[0009] 本发明实施例提供一种基于曲线压缩实现的宽动态范围压缩方法,包括;S1、对输 入的音频时域信号进行快速傅立叶变换,得到频域序列;S2、对所述频域序列进行多通道宽 动态范围压缩,划分为多个子频率带;S3、计算所述多子频率带的频域信号的平均声压值, 确定输入声压级;S4、根据输入声压级计算输出声压级;S5、根据所述输入声压级和输出声 压级计算幅值增益值;S6、对幅值进行逆傅立叶变,输出时域信号。
[0010] 本发明实施例还提供一种基于曲线压缩实现的宽动态范围系统,包括:快速傅立 叶变换模块,用于对输入的音频时域信号进行快速傅立叶变换,得到频域序列;多通道宽动 态范围压缩模块,用于对所述频域序列进行多通道宽动态范围压缩,划分为多个子频率带; 第一计算模块,用于计算所述多个子频率带的频域信号的平均声压值,确定输入声压级;第 二计算模块,用于根据输入声压级计算输出声压级;第=计算模块,用于根据所述输入声压 级和输出声压级计算幅值增益值;逆傅立叶变换模块,用于对幅值进行逆傅立叶变换,输出 时域信号。
[0011] 本发明的基于曲线压缩实现的宽动态范围采用曲线压缩的方式,增加曲线压缩因 子该一可配置的参数来达到声压级压缩,实现了一般宽动态范围压缩算法补偿声音的功 能,同样很好地解决了直线压缩方式不够灵活的缺点,使得处理结果更理想,使用户有更好 的体验。
【附图说明】
[0012] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 W根据该些附图获得其他的附图。
[0013] 图1是现有的病人和正常人听阔和痛阔听力曲线图;
[0014] 图2是现有的宽动态压缩声压补偿后的输入输出图。
[0015] 图3是根据本发明一实施例的宽动态压缩声压补偿后的输入输出图;
[0016] 图4是根据本发明一实施例的宽动态范围方法的流程图;
[0017]图5是根据本发明一实施例的宽动态范围系统的结构示意图。 具体实施例
[0018] 下面结合附图和具体实施例对本发明的技术方案作进一步更详细的描述。显然, 所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实 施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都 应属于本发明保护的范围。
[0019] 本发明提出一种基于曲线压缩实现的宽动态范围压缩方法,采用曲线压缩的方 式,增加曲线压缩因子该一可配置的参数来达到声压级压缩。如图3所示,其中,b2表示正 常直线压缩方式,bl表示曲线弥补用户觉得补偿不足的弊处,b3表示曲线弥补用户觉得补 偿超过预期的弊处。
[0020] 该宽动态范围压缩方法中,输入离散时域信号x[n],经过分帖,汉明加窗, FFT(pastFourierTransformation,快速傅立叶变换)变换到频域内的信号,再通过求解 7通道内的增益,在宽动态范围压缩(WideDynamicRangeCompression,WDRC)处理后,再 经过IFFT(InverseFastFourierTransformation,逆傅立叶变换)将频域信号转换为时域 信号,输出X' (n)。
[0021] 如图4所示,本实施例提供一种基于曲线压缩实现的宽动态范围压缩方法,包括:
[0022] 步骤S1、对输入的音频时域信号进行FFT,得到频域序列;
[002引具体地,对输入的音频时域信号X(n),n= 0~127,进行FFT,得到频域序列X㈱,N= 0 ~127。
[0024]S2、对所述频域序列进行多通道宽动态范围压缩,划分为多个子频率带;
[0025] 优选地,多通道为8通道,每一通道频率带的频域信号增益为统一值。本发明实施 例取fO= 62Hz,n= 12甜Z,f2 = 250Hz,f3 = 500Hz,f4 =lOOOHz,巧=2000Hz,f6 = 4000Hz,f7 = 8000Hz。
[0026]S3、计算所述多个子频率带的频域信号的平均声压值,确定输入声压级;
[0027] 所述平均声压值
[002引
[0029] 其中,X(k)为落在一频率带内的频域信号,m为落在该段频率带内的信号个数,N 为FFT的采样点数,Pref为基准声压。
[0030] 在平均声压值计算之前还包括计算输入信号的平均能量P(n) =X2化);w及计算 瞬时声压SP(n) = 201g(P(n)/Puf),其中,健康人耳听觉感受有极宽的动态范围,可达0~ 140 地。
[0031] 如用帕斯卡(Pa)来表达声音,须处理小至20uPa,大至2, 000, 000,OOOPa的数字。 如此一来,用化来表达声音或噪音会颇为不便,较简单的做法是用一个对数标度来表达声 音的响亮度。此处,W10作为基数,为避免化来表达声音 需要处理大量复杂,难W操纵的 数字,故用分贝(地)该个标度,该标度W听觉阔20U化作为参考声压值,并定义该个声压水 平为0地。)基准声压为Puf= 20uPa,也即参考声压值。
[0032]S4、根据输入声压级spl_in计算输出声压级spl_out;
[0033] 根据输入声压级判断声压值的声压范围,再根据声压范围计算输出声压级。
[0034] (1)spl_out[i] =spl[i] +(THhi[i]-THn[i])
[0035]
[0036] (3)spl_out[i] =Uliii[i]
[0037] 其中,声压范围包括1-正常人听阔W下;2-正常人听阔到痛阔之间;3-正常 人痛阔W上。
[003引输入声压级处于小于正常人听阔、输入声压级处于正常人听阔痛阔之间,输入声 压级处于痛阔之上,其计算公式分别如下:
[004U 0 = 02
[0042] 其中,a就是曲线压缩因子,I为输入声压级,0为输出声压级。
[0043] S5、根据所述输入声压级和输出声压级计算幅值增益值gain;

[0048] 所述计算幅值增益值后,对所述幅值增益值乘W频谱信号,得到补偿的幅值 X' (0)~X'(127)。
[0049] S6、对幅值进行IFFT,输出时域信号。
[0化0]对X'(0)~X'(127)进行IFFT,得到时域输出,在此保留前面的64点当做一帖输 出。
[0051] 如图5所示,本实施例提供一种基于曲线压缩实现的宽动态范围压缩系统,用于 宽动态范围压缩方法实现,具体包括:
[005引FFT模块1,用于对输入的音频时域信号进行FFT,得到频域序列;
[0化3] 多通道宽动态范围压缩模块2,用于对所述频域序列进行多通道宽动态范围压缩, 划分为多个子频率带;;
[0化4] 第一计算模块3,用于计算所述多个子频率带的频域信号的平均声压值,确定输入 声压级;
[0055] 第二计算模块4,用于根据输入声压级计算输出声压级;
[0056] 第=计算模块5,用于根据所述输入声压级和输出声压级计算幅值增益值;
[0057] IFFT模块6,用于对幅值进行IFFT,输出时域信号。
[0化引优选地,所述第二计算模块4还包括判断模块,用于判断声压值的声压范围,并根 据声压计算输出声压级。
[0059] 所述IFFT模块6还包括补偿单元,用于对所述幅值增益值乘此频谱信号,得到补 偿的幅值。
[0060] 需要说明的是,通过W上的实施例的描述,本领域的技术人员可W清楚地了解到 本发明可借助软件加必需的硬件平台的方式来实现,当然也可W全部通过硬件来实施。基 于该样的理解,本发明的技术方案对【背景技术】做出贡献的全部或者部分可软件产品的 形式体现出来,所述计算机软件产品可W存储在存储介质中,如ROM/RAM、磁碟、光盘等,包 括若干指令用W使得一台计算机设备(可W是个人计算机,服务器,或者网络设备等)执行 本发明各个实施例或者实施例的某些部分所述的方法。
[0061] W上所揭露的仅为本发明实施例中的较佳实施例而已,当然不能W此来限定本发 明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
【主权项】
1. 一种基于曲线压缩实现的宽动态范围压缩方法,其特征在于,包括: 51、 对输入的音频时域信号进行快速傅立叶变换,得到频域序列; 52、 对所述频域序列进行多通道宽动态范围压缩,划分为多个子频率带; 53、 计算所述多个子频率带的频域信号的平均声压值,确定输入声压级; 54、 根据输入声压级计算输出声压级; 55、 根据所述输入声压级和输出声压级计算幅值增益值; 56、 对幅值进行逆傅立叶变换,输出时域信号。2. 如权利要求1所述的基于曲线压缩实现的宽动态范围压缩方法,其特征在于,所述 S2中,多通道为8通道,每一通道频率带的频域信号增益为统一值。3. 如权利要求1所述的基于曲线压缩实现的宽动态范围压缩方法,其特征在于,所述 S3中,所述平均声压值根据公式:计算,其中,X (k)为落在一频率带内的频域信号,m为落在该段频率带内的信号个数,N 为快速傅立叶变换的采用点数,Pref为基准声压。4. 如权利要求1所述的基于曲线压缩实现的宽动态范围压缩方法,其特征在于,所述 S4中,根据输入声压级判断声压值的声压范围,再根据声压范围计算输出声压级。5. 如权利要求1所述的基于曲线压缩实现的宽动态范围压缩方法,其特征在于,所述 S5中,所述计算幅值增益值后,对所述幅值增益值乘以频谱信号,得到补偿的幅值。6. -种基于曲线压缩实现的宽动态范围压缩系统,其特征在于,包括: 快速傅立叶变换模块,用于对输入的音频时域信号进行快速傅立叶变换,得到频域序 列; 多通道宽动态范围压缩模块,用于对所述频域序列进行多通道宽动态范围压缩,划分 为多个子频率带; 第一计算模块,用于计算所述多个子频率带的频域信号的平均声压值,确定输入声压 级; 第二计算模块,用于根据输入声压级计算输出声压级; 第三计算模块,用于根据所述输入声压级和输出声压级计算幅值增益值; 逆傅立叶变换模块,用于对幅值进行逆傅立叶变换,输出时域信号。7. 如权利要求6所述的基于曲线压缩实现的宽动态范围压缩系统,其特征在于,所述 多通道为8通道,每一通道频率带的频域信号增益为统一值。8. 如权利要求6所述的基于曲线压缩实现的宽动态范围压缩系统,其特征在于,所述 平均声压值根据公式:计算,其中,X (k)为落在一频率带内的频域信号,m为落在该段频率带内的信号个数,N 为快速傅立叶变换的采用点数,Pref为基准声压。9. 如权利要求6所述的基于曲线压缩实现的宽动态范围压缩系统,其特征在于,所述 第二计算模块还包括判断模块,用于根据输入声压级判断声压值的声压范围,再根据声压 范围计算输出声压级。10.如权利要求6所述的基于曲线压缩实现的宽动态范围压缩系统,其特征在于,所述 逆傅立叶变换模块还包括补偿单元,用于对所述幅值增益值乘以频谱信号,得到补偿的幅 值。
【专利摘要】本发明公开了一种基于曲线压缩实现的宽动态范围压缩方法,包括:S1、对输入的音频时域信号进行FFT,得到频域序列;S2、对所述频域序列进行多通道宽动态范围压缩;S3、计算各子频率带的频域信号的平均声压值;S4、根据输入声压级计算输出声压级;S5、根据所述输入声压级和输出声压级计算幅值增益值;S6、对幅值进行IFFT,输出时域信号。本发明还提供一种具有邮件回复的网页即时通讯系统。本发明基于曲线压缩实现的宽动态范围采用曲线压缩的方式,增加曲线压缩因子这一可配置的参数来达到声压级压缩,实现了一般宽动态范围压缩算法补偿声音的功能,同样很好地解决了直线压缩方式不够灵活的缺点,使得处理结果更理想,使用户有更好的体验。
【IPC分类】H04R25/00
【公开号】CN104902420
【申请号】CN201510165596
【发明人】郭朝阳, 王新安, 张国新, 罗香香, 林巍, 王学祥, 舒畅, 蒲智星, 王丹
【申请人】深圳市微纳集成电路与系统应用研究院, 北京大学深圳研究生院
【公开日】2015年9月9日
【申请日】2015年4月9日

最新回复(0)