用于隐藏帧错误的方法和设备以及用于对音频进行解码的方法和设备的制造方法
【技术领域】
[0001] 示例性实施例设及帖错误隐藏,更具体地说,设及一种在使用时频变换 (time-化equencytransform)处理的音频编码和解码中在解码的音频信号的一部分帖中 发生错误时,能够使重建声音质量的恶化最小化的帖错误隐藏方法和设备W及音频解码方 法和设备。
【背景技术】
[0002] 当编码的音频信号通过有线/无线网络被发送时,如果一部分包由于传输错误而 被损坏或失真,则在解码的音频信号的一部分帖中会发生错误。如果错误未被适当校正,贝U 在包括发生错误的帖(在下文中,被称为"错误帖")和相邻帖的持续时间中,解码的音频信 号的声音质量会降低。
[0003] 关于音频信号编码,众所周知对特定信号执行时频变换处理并随后在频域中执行 压缩处理的方法提供了良好的重建声音质量。在时频变换处理中,广泛地使用修正离散余 弦变换(MDCT)。在该种情况下,对于音频信号解码,使用逆MDCT(IMDCT)将频域信号变换为 时域信号,并可对该时域信号执行重叠相加(0LA)处理。在0LA处理中,如果在当前帖中发 生错误,则下一帖也会被影响。具体地说,通过将先前帖和后续帖之间的混叠分量与时域信 号中的重叠部分相加来产生最终的时域信号,如果发生错误,则不存在精确的混叠分量,因 此,可能产生噪声,从而导致相当大的重建声音质量恶化。
[0004] 当使用时频变换处理对音频信号进行编码和解码时,在多个用于隐藏帖错误的方 法之中的用于通过对先前好帖(PGF)的参数进行回归分析来获得错误帖的参数的回归分 析方法中,可通过稍微考虑错误帖的原始能量来进行隐藏,但是在信号逐渐增强或严重波 动的部分中,错误隐藏效率会降低。此外,当将被应用的参数类型的数量增加时,回归分析 方法将会引起复杂度的增加。在通过重复地复制错误帖的PGF来恢复错误帖中的信号的重 复方法中,可能由于0LA处理的特性而难W使重建声音质量的恶化最小化。通过对PGF和 下一好帖(NGF)的参数进行插值来对错误帖的参数进行预测的插值方法需要额外一个帖 的延迟,因此,不宜将该插值方法应用在对于延迟敏感的通信编解码器中。
[0005] 因此,当使用时频变换处理对音频信号进行编码和解码时,需要一种在无需额外 时间延迟或复杂度的过分增加的情况下对帖错误进行隐藏W使由于帖错误而引起的重建 声音质量的恶化最小化的方法。
【发明内容】
[0006] 技术问题
[0007] 示例性实施例提供了一种帖错误隐藏方法和设备,所述帖错误隐藏方法和设备用 于在使用时频变换处理对音频信号进行编码和解码时在没有额外时间延迟并具有低复杂 度的情况下对帖错误进行隐藏。
[000引示例性实施例还提供了一种音频解码方法和设备,所述音频解码方法和设备用于 在使用时频变换处理对音频信号进行编码和解码时使由于帖错误而引起的重建声音质量 的恶化最小化。
[0009] 示例性实施例还提供了一种音频编码方法和设备,所述音频解码方法和设备用于 在音频解码设备中更精确地检测关于用于帖错误隐藏的瞬态帖的信息。
[0010] 示例性实施例还提供了一种非暂时性计算机可读存储介质,所述非暂时性计算机 可读存储介质存储有该样的程序指令;该程序指令在被计算机运行时执行帖错误隐藏方 法、音频编码方法或音频解码方法。
[0011] 示例性实施例还提供了一种采用帖错误隐藏设备、音频编码设备或音频解码设备 的多媒体装置。
[001引技术方案
[0013] 根据示例性实施例的一方面,提供了一种帖错误隐藏(FEC)方法,包括:基于关于 时频逆变换处理之后产生的时域信号的帖状态和相位匹配标志中的至少一个,选择基于相 位匹配的第一主模式和基于简单重复的第二主模式之一;基于选择的模式对当前帖执行时 域错误隐藏处理,其中,当前帖是错误帖,或者,当前帖是在先前错误帖之后的好帖。
[0014] 根据示例性实施例的另一方面,提供了一种音频解码方法,包括:当当前帖是错误 帖时,在频域中执行错误隐藏处理;当当前帖是好帖时对频谱系数进行解码;对作为错误 帖或好帖的当前帖执行时频逆变换处理;基于关于时频逆变换处理之后产生的时域信号的 帖状态和相位匹配标志中的至少一个,选择基于相位匹配的第一主模式和基于简单重复的 第二主模式之一,并基于选择的模式对当前帖执行时域错误隐藏处理,其中,当前帖是错误 帖,或者,当前帖是在先前错误帖之后的好帖。
[00巧]有益效果
[0016] 根据示例性实施例,在使用时频变换处理的音频编码和解码中,当在解码的音频 信号中的一部分帖中发生错误时,通过按照根据时域中的信号特性的最佳方法执行平滑处 理,在解码的音频信号中由于错误帖而引起的快速信号波动可被平滑,并且复杂度低也没 有额外延迟。
[0017]具体地说,作为瞬态帖的错误帖或者构成突发错误的错误帖可被更精确地重建, 并且作为结果,紧接着错误帖的正常帖所受到的影响也可被最小化。
[0018]另外,通过将基于相位匹配从存储在缓冲器中的多个先前帖获得的预定大小的区 段复制到作为错误帖的当前帖并执行在相邻帖之间的平滑处理,可额外预期低频带的重建 声音质量的提高。
【附图说明】
[0019] 图la和图化分别是根据示例性实施例的音频编码设备和音频解码设备的框图;
[0020] 图2a和图化分别是根据另一示例性实施例的音频编码设备和音频解码设备的框 图;
[0021] 图3a和图3b分别是根据另一示例性实施例的音频编码设备和音频解码设备的框 图;
[0022] 图4a和图4b分别是根据另一示例性实施例的音频编码设备和音频解码设备的框 图;
[0023]图5是根据示例性实施例的频域音频编码设备的框图;
[0024] 图6是用于描述当使用重叠时长小于50%的变换窗时拖尾延迟保护化angover) 标志被设置为1的时长的示图;
[0025] 图7是根据示例性实施例的图5的频域音频编码设备中的瞬态检测单元的框图;
[0026]图8是用于描述根据示例性实施例的图7中的第二瞬态确定单元的操作的示图;
[0027] 图9是用于描述根据示例性实施例的图7中的信号信息(signaling in化rmation)产生单元的操作的流程图;
[002引图10是根据示例性实施例的频域音频解码设备的框图;
[0029] 图11是根据示例性实施例的图10中的频谱解码单元的框图;
[0030] 图12是根据另一示例性实施例的图10中的频谱解码单元的框图;
[0031] 图13是用于描述根据示例性实施例的图12中的解交织(deinterleaving)单元 的操作的示图;
[003引图14是根据示例性实施例的图10中的重叠相加(0LA)单元的框图;
[0033] 图15是根据示例性实施例的图10的错误隐藏和0LA单元的框图;
[0034] 图16是根据示例性实施例的图15中的第一错误隐藏单元的框图;
[0035] 图17是根据示例性实施例的图15中的第二错误隐藏单元的框图;
[0036] 图18是根据示例性实施例的图15中的第S错误隐藏单元的框图;
[0037] 图19是用于描述在使用重叠时长小于50%的变换窗时由编码设备和解码设备执 行的用于去除时域混叠的加窗处理的示例的示图;
[0038] 图20是用于描述图18中的使用NGF的时域信号进行0LA处理的示例的示图;
[0039] 图21是根据另一示例性实施例的频域音频解码设备的框图;
[0040] 图22是根据示例性实施例的图21中的稳态检测单元的框图;
[0041] 图23是根据示例性实施例的图21中的错误隐藏和0LA单元的框图;
[0042] 图24是用于描述根据示例性实施例的当当前帖是错误帖时图21中的FEC模式选 择单元的操作的流程图;
[0043] 图25是用于描述根据示例性实施例的当先前帖是错误帖并且当前帖不是错误帖 时图21中的FEC模式选择单元的操作的流程图;
[0044] 图26是示出根据示例性实施例的图23中的第一错误隐藏单元的操作的框图;
[0045] 图27是示出根据示例性实施例的图23中的第二错误隐藏单元的操作的框图;
[0046] 图28是示出根据另一示例性实施例的图23中的第二错误隐藏单元的操作的框 图;
[0047] 图29是用于描述根据示例性实施例的图26中的当当前帖是错误帖时的错误隐藏 方法的框图;
[0048] 图30是用于描述根据示例性实施例的图28中的当先前帖是错误帖时用于作为瞬 态帖的下一好帖(NGF)的错误隐藏方法的框图;
[0049] 图31是用于描述根据示例性实施例的图27或图28中的当先前帖是错误帖时用 于不是瞬态帖的NGF的错误隐藏方法的框图;
[0050] 图32是用于描述图26中的当当前帖是错误帖时进行的0LA处理的示例的示图;
[0051] 图33是用于描述图27中的当先前帖是随机错误帖时对下一帖进行的OLA处理的 示例的示图;
[0052] 图34是用于描述图27中的当先前帖是突发错误帖时对下一帖进行的0LA处理的 示例的示图;
[0化3] 图35是用于描述根据示例性实施例的相位匹配方法的概念的示图;
[0054]图36是根据示例性实施例的错误隐藏设备的框图;
[0化5] 图37是根据示例性实施例的图36中的相位匹配FEC模块或时域FEC模块的框 图;
[0化6] 图38是根据示例性实施例的图37中的第一相位匹配错误隐藏单元或第二相位匹 配错误隐藏单元的框图;
[0057]图39是用于描述根据示例性实施例的图38中的平滑单元的操作的示图;
[005引图40是用于描述根据另一示例性实施例的图38中的平滑单元的操作的示图; [0化9] 图41是根据示例性实施例的包括编码模块的多媒体装置的框图;
[0060] 图42是根据示例性实施例的包括解码模块的多媒体装置的框图;
[0061] 图43是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
【具体实施方式】
[0062] 本发明构思可允许各种类型的改变或修改W及形式上的各种改变,特定的示例性 实施例将在附图中说明,并在说明书中详细描述。然而,应理解特定示例性实施例不将本发 明构思限制在特定的公开形式,而是包括本发明构思的精神和技术范围内的每个修改的、 等价的或代替的形式。在W下描述中,由于公知功能或结构将使用不必要的细节来模糊本 发明,因此不详细描述公知功能或结构。
[0063] 虽然诸如"第一"和"第二"的术语可被用于描述各种元件,但是该些元件不能由 该些术语的限制。该些术语可被用于将特定元件与另一元件区分。
[0064] 在本申请中使用的术语仅被用于描述特定示例性实施例,并不具有限制本发明构 思的目的。虽然在考虑在本发明构思中的功能的同时将当前尽可能广泛使用的一般术语选 为在本发明构思中使用的术语,但是它们可根据本领域中的普通技术人员的意图、司法先 例或者新技术的出现而改变。另外,在特定情况下,可使用由申请人有意选择的术语,并且 在此情况下,将在本发明的相应描述中公开所述术语的含义。因此,在本发明构思中使用的 术语不应由术语的简单名称来定义,而由术语的含义和本发明构思的内容来定义。
[00化]单数形式的表达包括复数形式的表达,除非它们在上下文中明显彼此不同。在本 申请中,应理解,诸如"包括"和"具有"的术语用于指示被实现的特征、数量、步骤、操作、元 素、部件或它们的组合的存在,而不预先排除存在或添加一个或更多个其它特征、数量、步 骤、操作、元素、部件或它们的组合的可能性。
[0066] 现在将参照附图详细地描述示例性实施例。
[0067] 图la和图化分别是根据示例性实施例的音频编码设备110和音频解码设备130 的框图。
[0068] 图la中示出的音频编码设备110可包括预处理单元112、频域编码单元114和参 数编码单元116。该些组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未 示出)。
[0069] 在图la中,预处理单元112可对输入信号执行滤波、下采样等,但不限于此。输入 信号可包括语音信号、音乐信号或者语音和音乐的混合信号。W下,为了描述方便,输入信 号被称为音频信号。
[0070] 频域编码单元114可对由预处理单元112提供的音频信号执行时频变换,选择与 声道的数量、编码频带和音频信号的比特率相应的编码工具,并通过使用选择的编码工具 对音频信号进行编码。时频变换使用改进离散余弦变换(MDCT)、调制重叠变换(MLT)或快 速傅里叶变换(FFT),但不限于此。当给定的比特数充足时,可将一般的变换编码方法用于 所有频带,当给定的比特数不足时,可将带宽扩展方案应用于一部分频带。当音频信号是立 体声道或多声道时,如果给定的比特数充足,则可对每个声道执行编码,如果给定的比特数 不足,则可应用向下混合(down-mixing)方案。频域编码单元114产生编码后的频谱系数。
[0071] 参数编码单元116可从提供自频域编码单元114的编码后的频谱系数提取参数, 并对提取的参数进行编码。例如,可针对每个子频带来提取参数,其中,子频带是对频谱系 数进行分组的单位,并可通过反映临界频带而具有统一或非统一的长度。当每个子频带具 有非统一的长度时,存在于低频频带中的子频带与存在于高频频带中的子频带相比可具有 相对短的长度。包括在一个帖中的子频带的数量和长度可根据编解码器算法而变化,并可 影响编码性能。参数可包括例如缩放因子、功率、平均能量或范数,但不限于此。作为编码 的结果而获得的频谱系数和参数可形成比特流,并且比特流可被存储在存储介质中,或者 可通过信道W例如包的形式被发送。
[0072] 图化中示出的音频解码设备130可包括参数解码单元132、频域解码单元134和 后处理单元136。频域解码单元134可包括帖错误隐藏算法。该些组件可被集成在至少一 个模块中,并可被实现为至少一个处理器(未示出)。
[0073] 在图化中,参数解码单元132可从接收到的比特流解码出参数,并从解码后的参 数W帖为单位检查是否已发生了错误。各种公知的方法可被用于错误检查,并且关于当前 帖是正常帖还是错误帖的信息被提供给频域解码单元134。
[0074] 当当前帖是正常帖时,频域解码单元134可通过一般的变换解码处理执行解码来 产生合成的频谱系数。当当前帖是错误帖时,频域解码单元134可通过错误隐藏算法对先 前好帖(PG巧的频谱系数进行缩放来产生合成的频谱系数。频域解码单元134可通过对合 成的频谱系数执行频时变换来产生时域信号。
[0075] 后处理单元136可对从频域解码单元134提供的时域信号执行滤波、上采样等W 提高声音质量,但是不限于此。后处理单元136提供重建的音频信号作为输出信号。
[0076] 图2a和图化分别是根据另一示例性实施例的音频编码设备210和音频解码设备 230的框图,其中,音频编码设备210和音频解码设备230具有切换结构。
[0077] 图2a中示出的音频编码设备210可包括预处理单元212、模式确定单元213、频域 编码单元214、时域编码单元215和参数编码单元216。该些组件可被集成在至少一个模块 中,并可被实现为至少一个处理器(未示出)。
[007引在图2a中,由于预处理单元212基本上与图la的预处理单元112相同,因此省略 其描述。
[0079]模式确定单元213可通过参考输入信号的特性来确定编码模式。模式确定单元 213可根据输入信号的特性,确定适用于当前帖的编码模式是语音模式还是音乐模式,并且 还可确定对于当前帖有效的编码模式是时域模式还是频域模式。可通过使用帖的短期特性 或多个帖的长期特性来感知输入信号的特性,但不限于此。例如,如果输入信号与语音信号 相应,则编码模式可被确定为语音模式或时域模式,如果输入信号与除了语音信号之外的 信号(即,音乐信号或混合信号)对应,则编码模式可被确定为音乐模式或频域模式。当输 入信号的特性与音乐模式或频域模式相应时,模式确定单元213可将预处理单元212的输 出信号提供给频域编码单元214,当输入信号的特性与语音模式或时域模式相应时,模式确 定单元213将预处理单元212的输出信号提供给时域编码单元215。
[0080] 由于频域编码单元214基本上与图la的频域编码单元114相同,因此省略其描 述。
[0081] 时域编码单元215可对从预处理单元212提供的音频信号执行码激励线性预测 (CEL巧编码。详细地讲,可将代数CELP用于CELP编码,但是CELP编码不限于此。时域编 码单元215产生编码后的频谱系数。
[0082] 参数编码单元216
可从提供自频域编码单元214或时域编码单元215的编码后的 频谱系数提取参数,并对提取的参数进行编码。由于参数编码单元216基本上与图la的参 数编码单元116相同,因此省略其描述。作为编码的结果而获得的频谱系数和参数可与编 码模式信息一起形成比特流,并且比特流可通过信道W包的形式被发送,或可存储在存储 介质中。
[0083] 图化中示出的音频解码设备230可包括参数解码单元232、模式确定单元233、频 域解码单元234、时域解码单元235和后处理单元236。频域解码单元234和时域解码单元 235中的每个可包括每个相应域中的帖错误隐藏算法。该些组件可被集成在至少一个模块 中,并可被实现为至少一个处理器(未示出)。
[0084] 在图化中,参数解码单元232可从W包的形式发送的比特流解码出参数,并从解 码后的参数W帖为单位检测是否已发生了错误。各种公知的方法可被用于错误检查,并且 关于当前帖是正常帖还是错误帖的信息被提供给频域解码单元234或时域解码单元235。
[0085] 模式确定单元233可检查包括在比特流中的编码模式信息,并将当前帖提供给频 域解码单元234或时域解码单元235。
[0086] 当编码模式是音乐模式或频域模式时,频域解码单元234可进行操作,并且当当 前帖是正常帖时,频域解码单元234可通过一般的变换解码处理执行解码来产生合成的频 谱系数。当当前帖是错误帖,并且先前帖的编码模式是音乐模式或频域模式时,频域解码单 元234可通过帖错误隐藏算法对PGF的频谱系数进行缩放来产生合成的频谱系数。频域解 码单元234可通过对合成的频谱系数执行频时变换来产生时域信号。
[0087]当编码模式是语音模式或时域模式时,时域解码单元235可进行操作,并且当当 前帖是正常帖时,时域解码单元235可通过一般的CELP解码处理执行解码来产生时域信 号。当当前帖是错误帖,并且先前帖的编码模式是语音模式或时域模式时,时域解码单元 235可执行时域中的帖错误隐藏算法。
[008引后处理单元236可对从频域解码单元234或时域解码单元235提供的时域信号执 行滤波、上采样等,但不限于此。后处理单元236提供重建的音频信号作为输出信号。
[0089] 图3a和图3b分别是根据另一不例性实施例的音频编码设备310和音频解码设备 330的框图。
[0090] 图3a中示出的音频编码设备310可包括预处理单元312、线性预测(L巧分析单 元313、模式确定单元314、频域激励编码单元315、时域激励编码单元316和参数编码单元 317。该些组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[0091] 在图3a中,由于预处理单元312基本上与图la的预处理单元112相同,因此省略 其描述。
[0092] LP分析单元313可通过对输入信号执行LP分析来提取LP系数,并从提取的LP系 数产生激励信号。可基于编码模式将激励信号提供给频域激励编码单元315和时域激励编 码单元316中的一个。
[0093] 由于模式确定单元314基本上与图2a的模式确定单元213相同,因此省略其描 述。
[0094] 当编码模式是音乐模式或频域模式时,频域激励编码单元315可进行操作,由于 除了输入信号是激励信号之外,频域激励编码单元315基本上与图la的频域编码单元114 相同,因此省略其描述。
[0095] 当编码模式是语音模式或时域模式时,时域激励编码单元316可进行操作,并且 由于时域激励编码单元316基本上与图2a的时域编码单元215相同,因此省略其描述。
[0096] 参数编码单元317可从提供自频激励编码单元315或时域激励编码单元316的编 码后的频谱系数提取参数,并对提取的参数进行编码。由于参数编码单元317基本上与图 la的参数编码单元116相同,因此省略其描述。作为编码的结果而获得的频谱系数和参数 可与编码模式信息一起形成比特流,并且比特流可通过信道W包的形式被发送,或可被存 储在存储介质中。
[0097] 图3b中示出的音频解码设备330可包括参数解码单元332、模式确定单元333、频 域激励解码单元334、时域激励解码单元335、LP合成单元336和后处理单元337。频域激 励解码单元334和时域激励解码单元335中的每一个可包括每个相应域中的帖错误隐藏算 法。该些组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。
[009引在图3b中,参数解码单元332可从W包的形式发送的比特流解码出参数,并从解 码后的参数W帖为单位检查是否已发生错误。各种公知的方法可用于错误检查,并且关于 当前帖是正常帖还是错误帖的信息被提供给频域激励解码单元334或时域激励解码单元 335。
[0099] 模式确定单元333可检查包括在比特流中的编码模式信息,并将当前帖提供给频 域激励解码单元334或时域激励解码单元335。
[0100] 当编码模式是音乐模式或频域模式时,频域激励解码单元334可进行操作,并且 当当前帖是正常帖时,频域激励解码单元334可通过一般的变换解码处理执行解码来产生 合成的频谱系数。当当前帖是错误帖,并且先前帖的编码模式是音乐模式或频域模式时,频 域激励解码单元334可通过帖错误隐藏算法对PGF的频谱系数进行缩放来产生合成的频谱 系数。频域激励解码单元334可通过对合成的频谱系数执行频时变换来产生激励信号,其 中,所述激励信号是时域信号。
[0101] 当编码模式是语音模式或时域模式时,时域激励解码单元335可进行操作,并且 当当前帖是正常帖时,时域激励解码单元335可通过一般的CELP解码处理执行解码来产生 激励信号,其中,所述激励信号为时域信号。当当前帖是错误帖,并且先前帖的编码模式是 语音模式或时域模式时,时域激励解码单元335可执行时域中的帖错误隐藏算法。
[0102] LP合成单元336可通过对从频域激励解码单元334或时域激励解码单元335提供 的激励信号执行LP合成来产生时域信号。
[0103] 后处理单元337可对从LP合成单元336提供的时域信号执行滤波、上采样等,但 是不限于此。后处理单元337提供重建的音频信号作为输出信号。
[0104] 图4a和图4b分别是根据另一示例性实施例的音频编码设备410和音频解码设备 430的框图,其中,音频编码设备410和音频解码设备430具有切换结构。
[01化]图4a中示出的音频编码设备410可包括预处理单元412、模式确定单元413、频域 编码单元414、LP分析单元415、频域激励编码单元416、时域激励编码单元417和参数编码 单元418。该些组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。 由于可考虑通过组合图2a的音频编码设备210和图3a的音频编码设备310来得到图4a 中示出的音频编码设备410,因此不重复共同部件的操作描述,并且现在将描述模式确定单 元413的操作。
[0106] 模式确定单元413可通过参考输入信号的特性和比特率来确定输入信号的编码 模式。模式确定单元413可基于根据输入信号的特性当前帖是语音模式还是音乐模式W及 基于对于当前帖有效的编码模式是时域模式还是频域模式,来将编码模式确定为CELP模 式或另一模式。当输入信号的特性与语音模式相应时,模式确定单元413可将编码模式确 定为CELP模式,当输入信号的特性与音乐模式和高比特率相应时,模式确定单元413可将 编码模式确定为频域模式,当输入信号的特性与音乐模式和低比特率相应时,模式确定单 元413可将编码模式确定为音频模式。模式确定单元413可在编码模式是频域模式时将输 入信号提供给频域编码单元414,在编码模式是音频模式时经由LP分析单元415将输入信 号提供给频域激励编码单元416,并在编码模式是CELP模式时经由LP分析单元415将输入 信号提供给时域激励编码单元417。
[0107] 频域编码单元414可与图la的音频编码设备110中的频域编码单元114或图2a 的音频编码设备210中的频域编码单元214相应,并且频域激励编码单元416或时域激励 编码单元417可与图3a的音频编码设备310中的频域激励编码单元315或时域激励编码 单元316相应。
[0108] 图4b中示出的音频解码设备430可包括参数解码单元432、模式确定单元433、频 域解码单元434、频域激励解码单元435、时域激励解码单元436、LP合成单元437和后处理 单元438。频域解码单元434、频域激励解码单元435和时域激励解码单元436中的每一个 可包括每个相应域中的帖错误隐藏算法。该些组件可被集成在至少一个模块中,并可被实 现为至少一个处理器(未示出)。由于可考虑通过组合图化的音频解码设备230和图3b 的音频解码设备330来得到图4b中示出的音频解码设备430,因此不重复共同部分的操作 描述,并且现在将描述模式确定单元433的操作。
[0109] 模式确定单元433可检查包括在比特流中的编码模式信息,并将当前帖提供给频 域解码单元434、频域激励解码单元435或时域激励解码单元436。
[0110] 频域解码单元434可与图化的音频解码设备130中的频域解码单元134或图化 的音频解码设备230中的频域解码单元234相应,频域激励解码单元435或时域激励解码 单元436可与图3b的音频解码设备330中的频域激励解码单元334或时域激励解码单元335相应。
[0111] 图5是根据示例性实施例的频域音频编码设备的框图。
[0112] 图5中示出的频域音频编码设备510可包括瞬态检测单元511、变换单元512、信 号分类单元513、能量编码单元514、频谱归一化单元515、比特分配单元516、频谱编码单元 517和复用单元518。该些组件可被集成在至少一个模块中,并可被实现为至少一个处理器 (未示出)。频域音频编码设备510可执行图2中示出的频域音频编码单元214的全部功能 和参数编码单元216的部分功能。除了信号分类单元513之外,频域音频编码设备510可 被在口U-TG. 719标准中公开的编码器的配置代替,并且变换单元512可使用重叠时长为 50%的变换窗。另外,除了瞬态检测单元511和信号分类单元513之外,频域音频编码设备 510可被在ITU-TG. 719标准中公开的编码器的配置代替。在每个情况下,虽然未示出,但 是噪声级别估计单元还可被包括在如口U-TG. 719标准中的频谱编码单元517的后端,W 估计在比特分配处理中没有被分配比特的频谱系数的噪声级别,并将估计的噪声级别插入 比特流中。
[0113] 参照图5,瞬态检测单元511可通过分析输入信号来检测展现瞬态特性的时长,并 响应于检测的结果针对每个帖产生瞬态信号信息。各种公知方法可被用于检测瞬态时长。 根据示例性实施例,当变换单元512可使用重叠时长小于50%的窗时,瞬态检测单元511可 首先确定当前帖是否是瞬态帖,然后验证已被确定为瞬态帖的当前帖。瞬态信号信息可由 复用单元518包括在比特流中,并可被提供给变换单元512。
[0114] 变换单元512可基于瞬态时长的检测结果确定将被用于变换的窗大小,并基于确 定的窗大小来执行时频变换。例如,短窗可被应用于已检测到瞬态时长的子频带,长窗可被 应用于还未检测到瞬态时长的子频带。作为另一示例,短窗可被应用于包括瞬态时长的帖。
[0115] 信号分类单元513可分析从变换单元512提供的频谱W确定每个帖是否与谐波帖 相应。各种公知的方法可被用于确定谐波帖。根据示例性实施例,信号分类单元513可将 从变换单元512提供的频谱划分为多个子频带,并针对每个子频带获得峰值能量值和平均 能量值。随后,信号分类单元513可针对每个帖获得峰值能量值比平均能量值高预定比例 或预定比例W上的子频带的数量,并将获得的子频带的数量大于或等于预定值的帖确定为 谐波帖。可预先通过实验或仿真来确定预定比例和预定值。谐波信号信息可通过复用单元 518被包括在比特流中。
[0116] 能量编码单元514可获得每个子频带单元中的能量,并对能量进行量化和无损编 码。根据实施例,与每个子频带单元中的平均频谱能量相应的范数值可被用作能量,并且缩 放因子或功率也可被使用,但是能量不限于此。每个子频带的范数值可被提供给频谱归一 化单元515和比特分配单元516,并可通过复用单元518被包括在比特流中。
[0117] 频谱归一化单元515可通过使用在每个子频带单元中获得的范数值来对频谱进 行归一化。
[0118] 比特分配单元516可通过使用在每个子频带单元中获得的范数值来按整数单位 或小数点单位来分配比特。另外,比特分配单元516可通过使用在每个子频带单元中获得 的范数值来计算掩蔽阔值,并通过使用掩蔽阔值来估计感知所需的比特数量,即,可允许的 比特数量。比特分配单元516可限制分配的比特数量不超过每个子频带的可允许的比特数 量。比特分配单元516可从具有更大的范数值的子频带开始顺序地分配比特,并基于每个 子频带的感知重要性对每个子频带的范数值进行加权,W调整分配的比特数量,从而更多 数量的比特被分配给感知重要的子频带。如在口U-TG. 719标准中,从能量编码单元514 提供给比特分配单元516的量化后的范数值可在被预先调整之后用于比特分配W考虑屯、 理声学加权和掩蔽效应。
[0119] 频谱编码单元517可通过使用每个子频带的分配的比特数量来对归一化后的频 谱进行量化,并对量化的结果进行无损编码。例如,阶乘脉冲编码(FPC)可被用于频谱编 码。另外,网格编码(trelliscoding)也可被用于频谱编码,但频谱编码不限于此。此外, 也可根据相应编解码器实现的环境或用户需要来使用各种频谱编码方法。根据FPC,可WW 阶乘格式来表示分配数量的比特内的信息,诸如脉冲的位置、脉冲的幅度和脉冲的符号。关 于由频谱编码单元517编码的频谱的信息可通过复用单元518被包括在比特流中。
[0120] 图6是用于描述当使用重叠时长小于50%的窗时需要拖尾延迟保护化angover) 标志的时长的示图。
[0121] 参照图6,当当前帖n+1的已被检测为瞬态的时长与没有执行重叠的时长610相应 时,瞬态帖的窗(例如,短窗)不必用于下一帖n。然而,当当前帖n+1的已被检测为瞬态的 时长与发生重叠的时长610相应时,可通过针对下一帖n使用瞬态帖的窗来预期已考虑了 信号特性的重建声音质量的提高。如上所述,当使用了重叠时长小于50%的窗时,可基于帖 中被检测为瞬态的位置来确定是否产生拖尾延迟保护标志。
[0122] 图7是根据示例性实施例的图5中示出的瞬态检测单元511 (在图7中被称为710) 的框图。
[0123] 图7中示出的瞬态检测单元710可包括滤波单元712、短期能量计算单元713、长 期能量计算单元714、第一瞬态确定单元715、第二瞬态确定单元716和信号信息产生单元 717。该些组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。除 了短期能量计算单元713、第二瞬态确定单元716和信号信息产生单元717之外,瞬态检测 单元710可被在口U-TG. 719标准中公开的配置代替。
[0124] 参照图7,滤波单元712可对在例如48KHZ采样的输入信号执行高通滤波。
[01巧]短期能量计算单元713可接收由滤波单元712滤波的信号,将每个帖划分为例如 四个子帖(即,四个块),并计算每个块的短期能量。另外,短期能量计算单元713还可针对 输入信号W帖为单位计算每个块的短期能量,并将计算出的每个块的短期能量提供给第二 瞬态确定单元716。
[0126] 长期能量计算单元714可帖为单位计算每个块的长期能量。
[0127] 第一瞬态确定单元715可针对每个块将短期能量与长期能量进行比较,如果在当 前帖的块中短期能量比长期能量高预定比例或预定比例W上,则确定当前帖是瞬态帖。
[0128] 第二瞬态确定单元716可执行附加验证处理,并可再次确定已被确定为瞬态帖的 当前帖是否是瞬态帖。该是为了防止由于因滤波单元712中的高通滤波而导致的低频带中 的能量去除而发生的瞬态确定错误。
[0129] 现在在如图8所示一个帖由四个块构成(目P,四个子帖0、1、2和3被分配给四个 块)并且基于帖n的第二块1将帖检测为瞬态的情况下描述第二瞬态确定单元716的操作。
[0130] 首先,具体地,可将在帖n的第二块1之前存在的第一多个块L810的短期能量的 第一平均值与包括帖n中的第二块1和其后存在的块的第二多个块H830的短期能量的第 二平均值进行比较。在该种情况下,根据被检测为瞬态的位置,包括在第一多个块L810中 的块的数量和包括在第二多个块服30中的块的数量可改变。也就是说,可计算包括已被检 测为瞬态的块和在其后存在的块的第一多个块的短期能量的平均值(即,第二平均值)与 在已被检测为瞬态的块之前存在的第二多个块的短期能量的平均值(即,第一平均值)之 比。
[0131] 其次,
可计算在高通滤波之前的帖n的短期能量的第S平均值与在高通滤波之后 的帖n的短期能量的第四平均值之比。
[0132] 最后,如果第二平均值与第一平均值之比在第一阔值和第二阔值之间,并且第S 平均值与第四平均值之比大于第S阔值,则即使第一瞬态确定单元715已首先确定了当前 帖是瞬态帖,第二瞬态确定单元716也可做出当前帖是正常帖的最终确定。
[0133] 可通过实验或仿真来预先设置第一阔值至第=阔值。例如,第一阔值和第二阔值 可被分别设置为0. 7和2. 0,对于超宽带信号,第=阔值可被设置为50,对于宽带信号,第= 阔值可被设置为30。
[0134] 由第二瞬态确定单元716执行的两个比较处理可防止具有短暂大幅度的信号被 检测为瞬态的错误。
[01巧]返回参照图7,信号信息产生单元717可从在第二瞬态确定单元716中的确定结 果,根据先前帖的拖尾延迟保护标志确定当前帖的帖类型是否要被更新,根据当前帖的已 被检测为瞬态的块的位置来不同地设置当前帖的拖尾延迟保护标志,产生其结果作为瞬态 信号信息。现将参照图9详细地描述此操作。
[0136] 图9是用于描述根据示例性实施例的图7中示出的信号信息产生单元717的操作 的流程图。图9示出如图8中所示构造一个帖,使用重叠时长小于50%的变换窗,并且在块 2和3发生重叠的情况。
[0137] 参照图9,在操作912,可从第二瞬态确定单元716接收最终确定的当前帖的帖类 型。
[0138] 在操作913,可基于当前帖的帖类型来确定当前帖是否是瞬态帖。
[0139] 如果在操作913确定当前帖的帖类型不指示瞬态帖,则在操作914,可检查针对先 前帖设置的拖尾延迟保护标志。
[0140] 在操作915,可确定先前帖的拖尾延迟保护标志是否是1,如果作为在操作915中 的确定结果,先前帖的拖尾延迟保护标志是1,即,如果先前帖是影响重叠的瞬态帖,则在操 作916,不是瞬态帖的当前帖可被更新为瞬态帖,并且随后当前帖的拖尾延迟保护标志可被 设置为0W用于下一帖。将当前帖的拖尾延迟保护标志设置为0表示由于当前帖是由于先 前帖而被更新的瞬态帖,因此下一帖不受当前帖的影响。
[0141] 如果作为在操作915中的确定结果,先前帖的拖尾延迟保护标志是0,则在操作 917,可在不更新帖类型的情况下,将当前帖的拖尾延迟保护标志设置为0。也就是说,保持 当前帖的帖类型不是瞬态帖。
[0142] 如果作为在操作913中的确定结果,当前帖的帖类型指示瞬态帖,则在操作918, 可接收已在当前帖中检测到的并被确定为瞬态的块。
[0143] 在操作919,可确定已在当前帖中检测到的并被确定为瞬态的块是否与重叠时长 相应,例如,在图8中,确定已在当前帖中检测到的并被确定为瞬态的块的数量是否大于1, 良P,是否是2或3。如果在操作919确定已在当前帖中检测到的并被确定为瞬态的块与2或 3 (指示重叠时长)不相应,则在操作917,可在不更新帖类型的情况下,将当前帖的拖尾延 迟保护标志设置为0。也就是说,如果已在当前帖中检测到的并被确定为瞬态的块的数量为 0,则可将当前帖的帖类型保持为瞬态帖,并且可将当前帖的拖尾延迟保护标志设置为0W 不影响下一帖。
[0144] 如果作为在操作919中的确定结果,已在当前帖中检测到的并被确定为瞬态的块 与2或3 (指示重叠时长)相应,则在操作920,可在不更新帖类型的情况下,将当前帖的拖 尾延迟保护标志设置为1。也就是说,虽然当前帖的帖类型被保持为瞬态帖,但是当前帖可 影响下一帖。该表示如果当前帖的拖尾延迟保护标志是1,则虽然确定下一帖不是瞬态帖, 下一帖也可被更新为瞬态帖。
[0145] 在操作921,当前帖的拖尾延迟保护标志和当前帖的帖类型可被形成为瞬态信号 信息。具体地说,当前帖的帖类型(即,指示当前帖是否是瞬态帖的信号信息)可被提供给 音频解码设备。
[0146] 图10是根据示例性实施例的频域音频解码设备1030的框图,其中,频域音频解码 设备1030可与图化的频域解码单元134、图化的频域解码单元234、图3b的频域激励解 码单元334或图4b的频域解码单元434相应。
[0147] 图10中示出的频域音频解码设备1030可包括频域帖错误隐藏(FEC)模块1032、 频谱解码单元1033、第一存储器更新单元1034、逆变换单元1035、普通重叠相加(OLA)单元 1036和时域FEC模块1037。除了嵌入在第一存储器更新单元1034中的存储器(未示出) 之外的组件可被集成在至少一个模块中,并可被实现为至少一个处理器(未示出)。第一存 储器更新单元1034的功能可被分配给并包括在频域FEC模块1032和频谱解码单元1033 中。
[0148] 参照图10,参数解码单元1010可从接收到的比特流解码出参数,并从解码出的参 数W帖为单位检查是否已发生错误。参数解码单元1010可与图化的参数解码单元132、图 化的参数解码单元232、图3b的参数解码单元332或图4b的参数解码单元432相应。由 参数解码单元1010提供的信息可包括指示当前帖是否是错误帖的错误标志和到目前为止 连续的错误帖的数量。如果确定在当前帖中已发生错误,则诸如坏帖指示符炬FI)的错误 标志可被设置为1,指示不存在关于错误帖的信息。
[0149] 频域FEC模块1032可在其中具有频域错误隐藏算法,并且当由参数解码单元1010 提供的错误标志BFI是1且先前帖的解码模式是频域模式时,频域FEC模块1032可进行操 作。根据示例性实施例,频域FEC模块1032可通过重复在存储器(未示出)中存储的PGF 的合成频谱系数来产生错误帖的频谱系数。在该种情况下,可通过考虑先前帖的帖类型和 到目前为止已发生的错误帖的数量来执行重复处理。为了方便描述,当已连续发生的错误 帖的数量是2个或更多个时,此事件与突发错误相应。
[0150] 根据示例性实施例,当当前帖是形成突发错误的错误帖,并且先前帖不是瞬态帖 时,频域FEC模块1032可从例如第五错误帖开始将解码出的PGF的频谱系数强制向下缩放 固定值3地。也就是说,如果当前帖与连续发生的错误帖中的第五错误帖相应,则频域FEC 模块1032可通过减少解码出的PGF的频谱系数的能量并重复能量减少的频谱系数,来产生 第五错误帖的频谱系数。
[0151] 根据另一示例性实施例,当当前帖是形成突发错误的错误帖,并且先前帖是瞬态 帖时,频域FEC模块1032可从例如第二错误帖开始将解码出的PGF的频谱系数向下缩放固 定值3地。也就是说,如果当前帖与连续发生的错误帖中的第二错误帖相应,则频域FEC模 块1032可通过减少解码出的PGF的频谱系数的能量并重复能量减少的频谱系数,来产生第 二错误帖的频谱系数。
[0152] 根据另一示例性实施例,当当前帖是形成突发错误的错误帖时,频域FEC模块 1032可通过随机地改变针对错误帖产生的频谱系数的符号来针对每个帖减小由于频谱系 数的重复而产生的调制噪声。在形成突发错误的错误帖组中随机符号开始将被应用到的错 误帖可根据信号特性而不同。根据示例性实施例,可根据信号特性是否指示当前帖是瞬态 而不同地设置随机符号开始将被应用到的错误帖的位置,或者,可针对不是瞬态的信号之 中的稳态信号不同地设置随机符号开始将被应用到的错误帖的位置。例如,当确定在输入 信号中存在谐波分量时,输入信号可被确定为信号波动不严重的稳态信号,并且与稳态信 号相应的错误隐藏算法可被执行。通常,从编码器发送的信息可被用于输入信号的谐波信 息。当低复杂度不是必需的时,可使用由解码器合成的信号来获得谐波信息。
[0153] 可将随机符号应用到错误帖的所有频谱系数,或者,由于通过不将随机符号应用 到等于或小于例如200化的非常低的频带中可预期更好的性能,因此可将随机符号应用到 高于预定义频带的频带中的频谱系数。该是因为在低频带中,波形或能量会因为符号的改 变而产生相当大的改变。
[0154] 根据另一示例性实施例,频域FEC模块1032不仅可对形成突发错误的错误帖应用 向下缩放或随机符号,还可在每隔一个的帖是错误帖的情况下应用向下缩放或随机符号。 也就是说,当当前帖是错误帖,在前一个的帖(one-化ameprevious化ame)是好帖,并且在 前两个的帖(two-化ameprevious化ame)是错误帖时,可应用向下缩放或随机符号。
[0155] 当由参数解码单元1010提供的错误标志BFI是0时,即,当当前帖是好帖时,频谱 解码单元1033可进行操作。频谱解码单元1033可通过使用由参数解码单元1010解码的 参数执行频谱解码来合成频谱系数。将在下面参照图11和图12更详细地描述频谱解码单 元 1033。
[0156] 关于作为好帖的当前帖,第一存储器更新单元1034可针对下一帖对合成频谱系 数、使用解码出的参数获得的信息、到目前为止连续发生的错误帖的数量、关于信号特性或 每个帖的帖类型的信息等进行更新。信号特性可包括瞬态特性或稳态特性,帖类型可包括 瞬态帖、稳态帖或谐波帖。
[0157] 逆变换单元1035可通过对合成频谱系数执行时频逆变换来产生时域信号。逆变 换单元1035可基于当前帖的错误标志和先前帖的错误标志来将当前帖的时域信号提供给 普通0LA单元1036和时域阳C模块1037之一。
[0158] 当当前帖和先前帖都是好帖时,普通0LA单元1036可进行操作。普通0LA单元 1036可通过使用先前帖的时域信号来执行普通0LA处理,作为普通0LA处理的结果,产生当 前帖的最终时域信号,并将最终时域信号提供给后处理单元1050。
[0159] 当当前帖是错误帖时,或者当当前帖是好帖,先前帖是错误帖并且最近的PGF的 解码模式是频域模式时,时域FEC模块1037可进行操作。也就是说,当当前帖是错误帖时 可由频域FEC模块1032和时域FEC模块1037执行错误隐藏处理,当先前帖是错误帖并且 当前帖是好帖时,可由时域FEC模块1037执行错误隐藏处理。
[0160] 图11是根据示例性实施例的图10中示出的频谱解码单元1033 (在图11中被称 为1110)的框图。
[0161] 图11中示出的频谱解码单元1110可包括无损解码单元1112、参数反量化单元 1113、比特分配单元1114、频谱反量化单元1115、噪声填充单元1116和频谱成形单元1117。 噪声填充单元1116可在频谱成形单元1117的后端。该些组件可被集成在至少一个模块中, 并可被实现为至少一个处理器(未示出)。
[0162] 参照图11,无损解码单元1112可对在编码处理中已执行无损编码的参数(例如, 范数值或频谱系数)执行无损解码。
[0163] 参数反量化单元1113可对无损解码后的范数值进行反量化。在解码处理中,可使 用各种方法(例如矢量量化(V曲、标量量化(S曲、网格编码量化(TCQ)、格矢量量化(LV曲 等)之一对范数值进行量化,可使用相应方法来对范数值进行反量化。
[0164] 比特分配单元1114可基于量化后的范数值或反量化后的范数值W子频带为单位 分配所需的比特。在该种情况下,W子频带为单位分配的比特的数量可与在编码处理中分 配的比特的数量相同。
[0165] 频谱反量化单元1115可通过使用W子频带为单位分配的比特的数量执行反量化 处理来产生归一化的频谱系数。
[0166] 噪声填充单元1116可产生噪声信号,并W子频带为单位将噪声信号填充到归一 化的频谱系数之中的需要噪声填充的部分中。
[0167] 频谱成形单元1117可通过使用反量化后的范数值来使归一化的频谱系数成形。 可通过频谱成形处理来获得最终解码后的频谱系数。
[0168] 图12是根据另一示例性实施例的图10中示出的频谱解码单元1033(在图12中 被称为1210)的框图,其中,频谱解码单元1033可被优选地应用到短窗被用于信号波动严 重的帖(例如,瞬态帖)的情况。
[0169] 图12中示出的频谱解码单元1210可包括无损解码单元1212、参数反量化单元 1213、比特分配单元1214、频谱反量化单元1215、噪声填充单元1216、频谱成形单元1217和 解交织单元1218。噪声填充单元1216可在频谱成形单元1217的后端。该些组件可被集成 在至少一个模块中,并可被实现为至少一个处理器(未示出)。与图11中示出的频谱解码 单元1110相比,还增加了解交织单元1218,因此,不再重复相同组件的操作的描述。
[0170] 首先,当当前帖是瞬态帖时,将被使用的变换窗需要比用于稳态帖的变换窗(参 照图13的1310)更短。根据示例性实施例,瞬态帖可被划分为四个子帖,总共四个短窗(参 照图13的1330)可被用作用于每个子帖的短窗。在描述解交织单元1218的操作之前,现 将描述编码器端中的交织处理。
[0171] 可设置使得当瞬态帖被划分为四个子帖时使用四个短窗获得的四个子帖的频谱 系数的和与针对瞬态帖使用一个长窗获得的频谱系数的和相同。首先,通过应用四个短窗 来执行变换,并且作为结果,可获得频谱系数的四个集。接下来,按照每个集的频谱系数的 顺序来连续执行交织。具体地说,如果假设第一短窗的频谱系数是c01、c02、…、cOn,第二 短窗的频谱系数是cll、cl2、…、cln,第二短窗的频谱系数是c21、c22、…、c2n,第四短窗 的频谱系数是c31、c32、…、c3n,则交织的结果可W是cOl、cll、c21、c31、…、cOn、cln、c2n、c3n。
[0172] 如上所述,通过交织处理,可像使用长窗的情况一样来更新瞬态帖,并可执行诸如 量化和无损编码的后续编码处理。
[0173] 返回参照图12,解交织单元1218可被用于将由频谱成形单元1217提供的重建频 谱系数更新为最初使用短窗的情况。瞬态帖具有能量波动严重的特性,通常趋向于在开始 部分具有低能量在末尾部分具有高能量。因此,当PGF是瞬态帖时,如果瞬态帖的重建频谱 系数被重复用于错误帖,则由于能量波动严重的帖连续存在,因此噪声会非常大。为了防止 该点,当PGF是瞬态帖时,可使用利用第S短窗和第四短窗解码的频谱系数代替使用第一 短窗和第二短窗解码的频谱系数,来产生错误帖的频谱系数。
[0174] 图14是根据示例性实施例的图10中示出的普通0LA单元1036 (在图14中被称 为1410)的框图,其中,普通0LA单元1036 (在图14中被称为1410)可在当前帖和先前帖 是好帖(正常帖)时进行操作,并对由逆变换单元(图10的1035)提供的时域信号(即, IMDCT信号)执行0LA处理。
[01巧]图14中示出的普通0LA单元1410可包括加窗单元1412和0LA单元1414。
[0176] 参照图14,加窗单元1412可对当前帖的IMDCT信号执行加窗处理W去除时域混 叠。W下将参照图19来描述重叠时长小于50%的窗的情况。
[0177] 0LA单元1414可对加窗后的IMDCT信号执行0LA处理。
[0178] 图19是用于描述当使用重叠时长小于50%的窗时由编码设备和解码设备执行的 用于去除时域混叠的加窗处理的示例的示图。
[0179] 参照图19,可彼此相反的方向来表示由编码设备使用的窗格式和由解码设备 使用的窗格式。当新的输入被接收到时,编码设备通过使用过去存储的信号来应用加窗。 当重叠时长的大小被减小W防止时间延迟时,重叠时长可位于窗的两端。解码设备通过对 当前帖n中图19 (a)的旧音频输出信号执行0LA处理来生成音频输出信号,其中,当前帖n 中图19(a)的旧音频输出信号与当前帖n的区域中的旧加窗IMDCT输出信号相同。音频输 出信号的将来区域被用于在下一帖中的0LA处理。图19(b)示出根据示例性实施例的用于 隐藏错误帖的窗格式。当在频域编码中发生错误时,通常重复过去的频谱系数,因此,可能 无法在错误帖中去除时域混叠。因此,修改的窗可被用于隐藏由于时域混叠而造成的失真 (arti化ct)。具体地说,当使用重叠时长小于50%的窗时,为了减少由于短重叠时长而引起 的噪声,可通过将重叠时长的长度1930调整为Jms(0<J<帖大小)来对重叠进行平滑。
[0180] 图15是根据示例性实施例的图10中示出的时域FEC模块1037的框图。
[0181] 图15中示出的时域阳C模块1510可包括阳C模式选择单元1512、第一时域错误 隐藏单元1513、第二时域错误隐藏单元1514、第=时域错误隐藏单元1515和第二存储器更 新单元1516。第二存储器更新单元1516的功能可被包括在第一时域错误隐藏单元1513、 第二时域错误隐藏单元1514和第S时域错误隐藏单元1515中。
[018引参照图15,阳C模式选择单元1512可通过接收当前帖的错误标志BFI、先前帖的错 误标志Prev_BFI和连续错误帖的数量来选择在时域中的FEC模式。对于错误标志,1可指 示错误帖,0可指示好帖。当连续错误帖的数量等于或大于例如2时,可确定突发错误被
形 成。作为在FEC模式选择单元1512的选择结果,可将当前帖的时域信号提供给第一时域错 误隐藏单元1513、第二时域错误隐藏单元1514和第S时域错误隐藏单元1515中的一个。
[0183] 第一时域错误隐藏单元1513可在当前帖是错误帖时执行错误隐藏处理。
[0184] 第二时域错误隐藏单元1514可在当前帖是好帖并且先前帖是形成随机错误的错 误帖时执行错误隐藏处理。
[0185] 第S时域错误隐藏单元1515可在当前帖是好帖并且先前帖是形成突发错误的错 误帖时执行错误隐藏处理。
[0186] 第二存储器更新单元1516可更新用于对当前帖进行错误隐藏处理的各种类型的 信息,并将该信息存储在存储器(未示出)中W用于下一帖。
[0187] 图16是根据示例性实施例的图15中示出的第一时域错误隐藏单元1513的框图。 当当前帖是错误帖时,如果通常使用重复在频域中获得的过去的频谱系数的方法,如果在 IMDCT和加窗之后执行OLA处理,则在当前帖的开始部分中的时域混叠分量改变,并因此不 可能进行完美重建,从而导致不希望的噪声。即使使用重复方法,第一时域错误隐藏单元 1513也可被使用W使得噪声的出现最小化。
[0188] 图16中示出的第一时域错误隐藏单元1610可包括加窗单元1612、重复单元 1613、OLA单元1614、重叠大小选择单元1615和平滑单元1616。
[0189] 参照图16,加窗单元1612可执行与图14的加窗单元1412的操作相同的操作。
[0190] 重复单元1613可将在当前帖之前两个的帖(被称为"在前旧")的IMDCT信号应 用到作为错误帖的当前帖的开始部分。
[01W]OLA单元1614可对由重复单元1613重复的信号和当前帖的IMDCT信号执行OLA处理。作为结果,可产生当前帖的音频输出信号,并可通过使用在前两个的帖的信号来减少 音频输出信号的开始部分中的噪声的产生。即使当在频域中应用缩放和先前帖的频谱的重 复时,也可大大减少当前帖的开始部分中的噪声的产生的可能性。
[0192] 重叠大小选择单元1615可选择将在平滑处理中应用的平滑窗的重叠时长的长度 ov_size,其中,ov_size可W总是相同的值(例如,针对20ms的帖大小的12ms)或者可根 据特定条件而不同地调整。特定条件可包括当前帖的谐波信息、能量差等。谐波信息指示 当前帖是否具有谐波特性,并可从编码设备被发送或者由解码设备获得。能量差指示当前 帖的能量与每个帖能量的移动平均E"^之间的归一化的能量差的绝对值。可由等式1 来表示能量差。
[0193]
(1)
[0194]在等式1中,E祖二 0. 8XE祖+0. 2XEcurr。
[0195] 平滑单元1616可将选择的平滑窗应用在先前帖的信号(旧音频输出)与当前帖 的信号(被称为"当前音频输出")之间,并执行0LA处理。可该样的方式形成平滑窗: 相邻窗之间的重叠时长的和为1。满足该样的条件的窗的示例是正弦波窗、使用基函数的窗 和汉宁窗,但平滑窗不限于此。根据示例性实施例,可使用正弦波窗,在该种情况下,可由等 比2来表示窗函数w(n)。
[0196]
[0197] 在等式2中,ov_size表示将在平滑处理中使用的重叠的时长,其中,ov_size由重 叠大小选择单元1615选择。
[0198] 通过执行如上所述的平滑处理,当当前帖是错误帖时,可防止先前帖和当前帖之 间的不连续性,其中,该不连续性可因为通过使用从在当前帖之前两个的帖复制的IMDCT 信号来代替在先前帖中存储的IMDCT信号而产生。
[0199] 图17是根据示例性实施例的图15中示出的第二时域错误隐藏单元1514的框图。
[0200] 图17中示出的第二时域错误隐藏单元1710可包括重叠大小选择单元1712和平 滑单元1713。
[0201] 参照图17,重叠大小选择单元1712可如图16的重叠大小选择单元1615 -样,选 择将在平滑处理中应用的平滑窗的重叠时长的长度〇v_size。
[0202] 平滑单元1713可将选择的平滑窗应用在旧IMDCT信号和当前IMDCT信号之间,并 执行OLA处理。同样,可该样的方式形成平滑窗:相邻窗之间的重叠时长的和为1。
[0203] 也就是说,当先前帖是随机错误帖,并且当前帖是好帖时,由于不可能进行正常加 窗,因此难W去除先前帖的IMDCT信号和当前帖的IMDCT信号之间的重叠时长中的时域混 叠。因此,可通过执行平滑处理来代替OLA处理来使噪声最小化。
[0204] 图18是根据示例性实施例的图15中示出的第S时域错误隐藏单元1515的框图。
[0205] 图18中示出的第S时域错误隐藏单元1810可包括重复单元1812、缩放单元 1813、第一平滑单元1814、重叠大小选择单元1815和第二平滑单元1816。
[0206]参照图18,重复单元1812可将作为好帖的当前帖的IMDCT信号之中的用于下一帖 的部分复制到当前帖的开始部分。
[0207] 缩放单元1813可调整当前帖的规模W防止突然的信号增大。根据示例性实施例, 缩放单元1813可执行向下缩放3地。缩放单元1813可W是可选的。
[020引第一平滑单元1814可将平滑窗应用到先前帖的IMDCT信号和从将来帖(化化re化ame)复制的IMDCT信号,并执行OLA处理。同样,可该样的方式形成平滑窗;相邻窗 之间的重叠时长的和为1。也就是说,当将来信号被复制时,需要加窗来去除可能在先前帖 和当前帖之间发生的不连续性,可通过0LA处理使过去信号被将来信号代替。
[0209] 像图16的重叠大小选择单元1615 -样,重叠大小选择单元1815可选择将在平滑 处理中应用的平滑窗的重叠时长的长度〇v_size。
[0210] 第二平滑单元1816可通过将选择的平滑窗应用在作为被代替的信号的旧IMDCT 信号和作为当前帖信号的当前IMDCT信号之间,来执行OLA处理,同时去除不连续性。同样, 可该样的方式形成平滑窗:相邻窗之间的重叠时长的和为1。
[0211] 也就是说,当先前帖是突发错误帖并且当前帖是好帖时,由于不可能进行正常加 窗,因此不能去除先前帖的IMDCT信号和当前帖的IMDCT信号之间的重叠时长中的时域混 叠。在突发错误帖中,由于能量的减少或连续的重复可能产生噪声等,因此可采用复制将来 信号W用于当前帖的重叠的方法。在该种情况下,平滑处理可被执行两次,W去除当前帖中 可能产生的噪声并同时去除在先前帖和当前帖之间可能发生的不连续性。
[0212] 图20是用于描述图18中的使用NGF的时域信号进行0LA处理的示例的示图。
[0213] 图20(a)示出当先前帖不是错误帖时通过使用先前帖执行重复或增益缩放的方 法。参照图20化),为了不使用额外延迟,通过仅针对尚未通过重叠解码的部分将在作为 NGF的当前帖中解码的时域信号重复到过去来执行重叠,并还执行增益缩放。将被重复的信 号的大小可被选为小于或等于重叠部分的大小的值。根据示例性实施例,重叠部分的大小 可W是13XL/20,其中,例如,对于窄带(NB),L是160,对于宽带(WB),L是320,对于超宽 带(SWB),L是640,对于全频带(FB),L是960。
[0214] 现在将描述通过重复获得NGF的时域信号来生成将用于时间重叠处理的信号的 方法。
[0215] 在图20化)中,通过将在帖n+2的将来部分中标记的大小为13XL/20的块复制到 帖n+1中的与帖n+2的将来部分的相同位置相应的将来部分,来执行缩放调整,W使用帖 n+2的将来部分的值来代替帖n+1的将来部分的现有值。例如,缩放的值是-3地。为了去 除在复制中的帖n+2和帖n+1之间的不连续性,从图20化)中的帖n+1 (先前帖值)获得的 时域信号和从将来部分复制的信号可在大小为13XL/20的第一块处彼此线性重叠。通过 该处理,可获得用于重叠的最终信号,当更新的n+1信号和n+2信号彼此重叠时,可输出帖 n+2的最终时域信号。
[0216] 图21是根据另一示例性实施例的频域音频解码设备2130的框图。与图10中示 出的实施例相比,还包括了稳态检测单元2138。因此,不再重复与图10的组件相同的组件 的操作的详细描述。
[0217] 参照图21,稳态检测单元2138可通过分析由逆变换单元2135提供的时域信号来 检测当前帖是否是稳态的。在稳态检测单元2138中的检测的结果可被提供给时域FEC模 块 2136。
[021引图22是根据示例性实施例的图21中示出的稳态检测单元2138(在图22中被称 为2210)的框图。在图21中示出的稳态检测单元2210可包括稳态帖检测单元2212和滞 后应用(hysteresisapplication)单元 2213。
[0219] 参照图22,稳态帖检测单元2212可通过接收包括包络变化量(envelopedelta) env_delta、先前帖的稳态模式stat_mode_old、能量差diff_energy等的信息,来确定当前 帖是否是稳态。通过使用关于频域的信息来获得包络变化量env_delta,包络变化量env_ delta指示先前帖和当前帖之间的每个频带范数值差的平均能量。可由等式3来表示包络 变化量env_delta。
[0220]
[0221 ] EEd_M=ENV-SM阳EEd+ (1-ENV_SMF) *EEd_M做
[022引在等式3中,norm_old(k)表示先前帖的频带k的范数值,norm(k)表示当前帖的 频带k的范数值,nb_sfm表示频带的数量,Ecd表示当前帖的包络变化量,Ee^m是通过将平滑 因子应用到Ecd而获得的,并可被设置为将用于稳态确定的包络变化量,ENV_SMF表示包络 变化量的平滑因子,并根据本发明的示例性实施例,ENV_SMF可W是0. 1。具体地,当能量差 diff_energy小于第一阔值,并且包络变化量env_delta小于第二阔值时,当前帖的稳态模 式stat_mode_curr可被设置为1。第一阔值和第二阔值分别可W是0. 032209和1. 305974, 但不限于此。
[0223] 如果确定当前帖是稳态,则滞后应用单元2213可通过应用先前帖的稳态模式 stat_mode_old来产生当前帖的最终稳态信息stat_mode_out,W防止当前帖的稳态信息 的频繁改变。也就是说,如果在稳态帖检测单元2212中确定当前帖是稳态并且先前帖是稳 态,则当前帖被检测为稳态帖。
[0224] 图23是根据示例性实施例的图21中示出的时域FEC模块2136的框图。
[02巧]图23中示出的时域阳C模块2310可包括阳C模式选择单元2312、第一时域错误 隐藏单元2313、第二时域错误隐藏单元2314和第一存储器更新单元2315。第一存储器更 新单元2315的功能可被包括在第一时域错误隐藏单元2313和第二时域错误隐藏单元2314 中。
[0226] 参照图23,阳C模式选择单元2312可通过接收当前帖的错误标志BFI、先前帖的 错误标志Prev_BFI和各种参数来选择时域中的FEC模式。对于错误标志,1可指示错误帖, 0可指示正常帖。作为FEC模式选择单元2312中的选择结果,当前帖的时域信号可被提供 给第一时域错误隐藏单元2313和第二时域错误隐藏单元2314。
[0227] 第一时域错误隐藏单元2313可在当前帖是错误帖时执行错误隐藏处理。
[0228] 第二时域错误隐藏单元2314可在当前帖是好帖且先前帖是错误帖时执行错误隐 藏处理。
[0229] 第一存储器更新单元2315可更新用于对当前帖进行错误隐藏处理的各种类型的 信息,并可将该些信息存储在存储器(未示出)中W用于下一帖。
[0230] 在由第一时域错误隐藏单元2313和第二时域错误隐藏单元2314执行的OLA处理 中,可根据输入信号是瞬态还是稳态,或者当输入信号是稳态时根据稳态级别,来应用适合 的方法。根据示例性实施例,当信号是稳态时,平滑窗的重叠时长的长度被设置为长,否则, 可原样使用在普通OLA处理中使用的长度。
[0231] 图24是用于描述根据示例性实施例的当当前帖是错误帖时图23的FEC模式选择 单元2312的操作的流程图。
[0232] 在图24中,当当前帖是错误帖时用于选择FEC模式的参数类型如下:当前帖的错 误标志、先前帖的错误标志、PGF的谐波信息、NGF的谐波信息和连续错误帖的数量。当当前 帖是好帖时,连续错误帖的数量可被重置。另外,参数还可包括PGF的稳态信息、能量差和 包络变化量。每一条谐波信息可从编码器被发送,或者可由解码器单独地产生。
[0233] 参照图24,在操作2411,可通过使用各种参数确定输入信号是否是稳态。具体地, 当PGF是稳态,能量差小于第一阔值,并且PGF的包络变化量小于第二阔值时,可确定输入 信号是稳态。可通过实验或仿真预先设置第一阔值和第二阔值。
[0234] 如果在操作2411中确定输入信号是稳态,则在操作2413,可执行重复和平滑处 理。如果确定输入信号是稳态,则平滑窗的重叠时长的长度可被设置为更长,例如,设置为 6ms。
[02巧]如果在操作2411中确定输入信号不是稳态,则在操作2415,可执行普通OLA处理。
[0236] 图25是用于描述根据示例性实施例的当先前帖是错误帖并且当前帖不是错误帖 时图23的FEC模式选择单元2312的操作的流程图。
[0237] 参照图25,在操作2512,可通过使用各种参数确定输入信号是否是稳态。可使用 与图24的操作2411使用的相同参数。
[0238] 如果在操作2512中确定输入信号不是稳态,则在操作2513,可通过检查连续错误 帖的数量是否大于1来确定先前帖是否是突发错误帖。
[0239] 如果在操作2512中确定输入信号是稳态,则在操作2514,可响应于作为错误帖的 先前帖,执行对NGF的错误隐藏处理,即,重复和平滑处理。当确定输入信号是稳态时,平滑 窗的重叠时长的长度可被设置为更长,例如,设置为6ms。
[0240] 如果在操作2513中确定输入信号不是稳态并且先前帖是突发错误帖,则在操作 2515, 可响应于作为突发错误帖的先前帖,执行对NGF的错误隐藏处理。
[024U 如果在操作2513中确定输入信号不是稳态并且先前帖是随机错误帖,则在操作 2516, 可执行普通OLA处理。
[0242] 图26是示出根据示例性实施例的图23的第一时域错误隐藏单元2313的操作的 流程图。
[0243] 参照图26,在操作2601,当当前帖是错误帖时,可重复先前帖的信号,并可执行平 滑处理。根据示例性实施例,可应用重叠时长为6ms的平滑窗。
[0244] 在操作2603,可将重叠区域中的预定时长的能量化wl与非重叠区域中的预定时 长的能量化w2进行比较。具体地说,当在错误隐藏处理之后重叠区域的能量减小或显著增 加时,由于当在重叠中相位颠倒时会发生能量的减小,当在重叠中相位保持时会发生能量 的增加,因此可执行普通OLA处理。当信号比较平稳时,由于在操作2601中的错误隐藏性 能很好,因此如果作为操作2601的结果,重叠区域和非重叠区域之间的能量差大,则表示 由于在重叠中的相位而产生了问题。
[0245] 如果作为在操作2603的比较结果,重叠区域和非重叠区域之间的能量差大,则在 操作2604,不选择操作2601的结果,并可执行普通OLA处理。
[0246] 如果作为在操作2603的比较结果,重叠区域和非重叠区域之间的能量差不大,贝U 可选择操作2601的结果。
[0247] 图27是示出根据示例性实施例的图23的第二时域错误隐藏单元2314的操作的 流程图。图27的操作2701、操作2702和操作2703可分别与图25的操作2514、操作2515 和操作2516相应。
[0248] 图28是示出根据另一示例性实施例的图23的第二时域错误隐藏单元2314的操 作的流程图。与图27的实施例相比,图28的实施例不同之处在于当作为NGF的当前帖是 瞬态帖时的错误隐藏处理(操作2801)W及当作为NGF的当前帖不是瞬态帖时使用具有不 同的重叠时长长度的平滑窗的错误隐藏窗(操作2802和2803)。也就是说,图28的实施例 可被应用于除了普通OLA处理之外还包括对瞬态帖的OLA处理的情况。
[0249] 图29是用于描述根据示例性实施例的图26中的当当前帖是错误帖时的错误隐藏 方法的框图。与图16的实施例相比,图29的实施例不同之处在于不包括与重叠大小选择 单元(图16的1615)相应的组件,同时还包括了能量检查单元2916。也就是说,平滑单元 2915可应用预定平滑窗,能量检查单元2916可执行与图26的操作2603和2604相应的功 能。
[0250]
图30是用于描述根据本发明的实施例的图28中的当先前帖是错误帖时用于作为 瞬态帖的NGF的错误隐藏方法的框图。当先前帖的帖类型是瞬态时,可优选地应用图30的 实施例。也就是说,由于先前帖是瞬态,因此可通过在过去帖中使用的错误隐藏方法来执行 对NGF的错误隐藏处理。
[0巧1] 参照图30,窗更新单元3012可通过考虑先前帖的窗来更新将被用于对当前帖进 行平滑处理的窗的重叠时长的长度。
[0巧2] 平滑单元3013可通过将由窗更新单元3012更新的平滑窗应用到先前帖和作为 NGF的当前帖,来执行平滑处理。
[0253] 图31是用于描述根据本发明的实施例的图27或图28中的当先前帖是错误帖时 用于不是瞬态帖的NGF的错误隐藏方法的框图,其中,该错误隐藏方法与图17和图18的实 施例相应。也就是说,根据连续错误帖的数量,可如图17中那样执行与随机错误帖相应的 错误隐藏处理,或者可如图18中那样执行与突发错误帖相应的错误隐藏处理。然而,与图 17和图18的实施例相比,图31的实施例的不同之处在于预先设置了重叠大小。
[0254] 图32是用于描述图26中的当当前帖是错误帖时的OLA处理的示例的示图。图 32(a)是针对瞬态帖的示例。图32(b)示出对非常平稳的帖的OLA处理,其中,M的长度长 于N,并且在平滑处理中的重叠时长的长度长。图32(c)示出对比图32(b)的情况更不平稳 的帖的OLA处理,图32 (d)示出普通OLA处理。该OLA处理可与对NGF的OLA处理独立地 被使用。
[0255] 图33是用于描述图27中的先前帖是随机错误帖时对NGF的OLA处理的示例的示 图。图33 (a)示出对非常平稳的帖的OLA处理,其中,长度K长于L在平滑处理中的重叠时 长的长度长。图33(b)示出对比图33a的情况不平稳的帖的OLA处理,图33(c)示出普通 OLA处理。该OLA处理可与对错误帖的OLA处理独立地被使用。因此,可进行错误帖和NGF 之间的OLA处理的各种组合。
[0256] 图34是用于描述图27中的当先前帖是突发错误帖时对NGFn+2的OLA处理的示 例的示图。与图18和图20相比,图34的不同之处在于可通过调整平滑窗的重叠时长的长 度3412或3413来执行平滑处理。
[0巧7] 图35是用于描述应用于示例性实施例的相位匹配方法的概念的示图。
[0巧引参照图35,当在解码的音频信号中的帖n中发生错误时,可在缓冲器中存储的N个过去好帖之中,捜索与先前帖n-1中的解码信号中的捜索区段3512最相似的匹配区段 3513,其中,捜索区段3512与帖n相邻。此时,可根据与将被捜索的音调分量相应的最小频 率的波长来确定捜索区段3512的大小和缓冲器中的捜索范围。为了使捜索的复杂度最小 化,捜索区段3512的大小优选为小。例如,捜索区段3512的大小可被设置为大于最小频率 的波长的一半,并小于最小频率的波长。缓冲器中的捜索范围可被设置为等于或大于将被 捜索的最小频率的波长。根据本发明的实施例,可根据基于上述的标准的输入频带(NB、WB、 SWB或FB)来预先设置捜索区段3512的大小和缓冲器中的捜索范围。
[0巧9] 具体地说,可从捜索范围内的过去解码信号之中捜索到与捜索区段3512具有最 高互相关性的匹配区段3513,可获得与匹配区段3513相应的位置信息,并可将从匹配区段 3513的末端开始的预定时长3514复制到已发生错误的帖n。可通过考虑窗长度(例如,通 过将帖长度和重叠时长的长度相加而获得的长度)来设置预定时长3514。
[0%0] 图36是根据示例性实施例的错误隐藏设备3610的框图。
[0261]图36中示出的错误隐藏设备3610可包括相位匹配标志产生单元3611、第一阳C 模式选择单元3612、相位匹配阳C模块3613、时域阳C模块3614和存储器更新单元3615。 [0%2] 参照图36,相位匹配标志产生单元3611可产生相位匹配标志,其中,相位匹配标 志用于确定当在下一帖中发生错误时是否在每个好帖中使用相位匹配错误隐藏处理。为 此,可使用每个子频带的能量和频谱系数。可从范数值获得能量,但不限于此。具体地说,当 作为正常帖的当前帖中的具有最大能量的子频带属于预定低频带,并且帖内或帖间能量改 变不大时,相位匹配标志可被设置为1。根据示例性实施例,当当前帖中的具有最大能量的 子频带属于75化到1000化,并且当前帖中关于相应子频带的索引与先前帖中关于相应子 频带的索引相同时,可将相位匹配错误隐藏处理应用到已发生错误的下一帖。根据另一示 例性实施例,当当前帖中的具有最大能量的子频带属于75化到1000化,并且当前帖的关于 相应子频带的索引与先前帖中关于相应子频带的索引之间的差等于或小于1时,可将相位 匹配错误隐藏处理应用到已发生错误的下一帖。根据另一示例性实施例,当当前帖中的具 有最大能量的子频带属于75化到1000化,当前帖的关于相应子频带的索引与先前帖的关 于相应子频带的索引相同,当前帖是能量改变小的稳态帖,并且在缓冲器中存储的N个过 去帖是正常帖且不是瞬态帖时,可将相位匹配错误隐藏处理应用到已发生错误的下一帖。 根据另一示例性实施例,当当前帖中的具有最大能量的子频带属于75化到1000化,当前帖 的关于相应子频带的索引与先前帖的关于相应子频带的索引之间的差等于或小于1,当前 帖是能量改变小的稳态帖,并且在缓冲器中存储的N个过去帖是正常帖且不是瞬态帖时, 可将相位匹配错误隐藏处理应用到已发生错误的下一帖。可通过对差能量与在上述的稳态 帖检测处理中使用的阔值进行比较来确定当前帖是否是稳态帖。另外,可确定在缓冲器中 存储的多个过去帖之中的最近的=个帖是否是正常帖,可确定在缓冲器中存储的多个过去 帖之中的最近的两个帖是否是瞬态帖,但本实施例不限于此。
[0263]当由相位匹配标志产生单元3611产生的相位匹配标志被设置为1时,如果在下一 帖发生错误,则可应用相位匹配错误隐藏处理。
[0264]第一阳C模式选择单元3612可通过考虑相位匹配标志W及帖的状态中的至少一 个来从多个FEC模式选择一个FEC模式。可从当前帖的状态或通过另外地考虑至少一个先 前帖的状态来获得帖的状态。相位匹配标志可指示PGF的状态。先前帖和当前帖的状态可 包括先前帖或当前帖是否是错误帖,当前帖是随机错误帖还是突发错误帖,或者是否已执 行了对先前错误帖的相位匹配错误隐藏处理。根据示例性实施例,多个FEC模式可包括基 于相位匹配错误隐藏处理的第一主FEC模式和基于时域错误隐藏处理的第二主FEC模式。 第一主FEC模式可包括第一子FEC模式、第二子FEC模式和第S子FEC模式,其中,第一子 FEC模式被用于相位匹配标志被设置为1并且是随机错误帖的当前帖,第二子FEC模式在先 前帖是错误帖并且已执行了对先前帖的相位匹配错误隐藏处理时被用于作为NGF的当前 帖,第S子FEC模式在已执行了对先前帖的相位匹配错误隐藏处理时被用于形成突发错误 帖的当前帖。根据示例性实施例,第二主FEC模式可包括第四子FEC模式和第五子FEC模 式,其中,第四子FEC模式被用于相位匹配标志被设置为0并且是错误帖的当前帖,第五子 FEC模式被用于相位匹配标志被设置为0并且是先前错误帖的NGF的当前帖。根据示例性 实施例,可WW与参照图23所描述的相同方法来选择第四子FEC模式或第五子FEC模式, 并可根据选择的FEC模式来执行相同的错误隐藏处理。
[02化]当由第一阳C模式选择单元3612选择的阳C模式是第一主阳C模式时,相位匹配 FEC模块3613可进行操作,并可通过执行与第一子FEC模式至第S子FEC模式中的每一个 子FEC模式相应的相位匹配错误隐藏处理,来产生错误被隐藏的时域信号。该里,为了便于 描述,示出了经过存储器更新单元3615输出错误被隐藏的时域信号。
[0266] 当由第一阳C模式选择单元3612选择的阳C模式是第二主阳C模式时,时域阳C 模块3614可进行操作,并可通过执行与第四子FEC模式和第五子FEC模式中的每一个子 FEC模式相应的相位匹配错误隐藏处理,来产生错误被隐藏的时域信号。同样,为了便于描 述,示出了经过存储器更新单元3615输出错误被隐藏的时域信号。
[0267] 存储器更新单元3615可接收在相位匹配阳C模块3613或时域阳C模块3614中的 错误隐藏的结果,并可更新用于对下一帖进行错误隐藏处理的多个参数。根据示例性实施 例,存储器更新单元3615的功能可被包括在相位匹配FEC模块3613和时域FEC模块3614 中。
[0268] 如上所述,通过针对错误帖重复时域中的相位匹配信号来代替重复频域中获得的 频谱系数,在使用重叠时长的长度小于50%的窗时,可有效地抑制在低频带中的重叠时长 中可能产生的噪声。
[0269] 图37是根据示例性实施例的图36的相位匹配FEC模块3613或时域FEC模块3614 的框图。
[0270] 图37中示出的相位匹配阳C模块3710可包括第二阳C模式选择单元3711、第一 相位匹配错误隐藏单元3712、第二相位匹配错误隐藏单元3713和第=相位匹配错误隐藏 单元3714,图37中示出的时域阳C模块3730可包括第S阳C模式选择单元3731、第一时 域错误隐藏单元3732和第二时域错误隐藏单元3733。根据示例性实施例,第二FEC模式 选择单元3711和第SFEC模式选择单元3731可被包括在图36的第一FEC模式选择单元 3612 中。
[027U参照图37,当PGF在预定低频带中具有最大能量并且能量的改变小于预定阔值 时,第一相位匹配错误隐藏单元3712可对作为随机错误帖的当前帖执行相位匹配错误隐 藏处理。根据本发明的实施例,即使满足W上条件,也可获得相关性尺度(correlation scale)accA,并可根据相关性尺度accA是否在预定范围内来执行相位匹配错误隐藏处理 或普通0LA处理。也就是说,通过考虑捜索范围中存在的区段之间的相关性W及捜索区段 与捜索范围中存在的区段之间的互相关性,来优选地确定是否执行相位匹配错误隐藏处 理。现将更详细地描述该处理。
[0272] 可通过等式4来获得相关性尺度accA。
[0273] (4)
[0274] 在等式4中,d表示在捜索范围中存在的区段的数量,Rq表示用于针对存储在帖 冲器中的N个过去正常帖(y信号)捜索具有与捜索区段(X信号)3512相同长度的匹配区 段3513(参照图35)的互相关性,Ryy表示存储在缓冲器中的N个过去好帖(y信号)中存 在的区段之间的相关性。
[0275] 接下来,可确定相关性尺度accA是否在预定范围内,如果相关性尺度accA在预定 范围内,则可执行对作为错误帖的当前帖的相位匹配错误隐藏处理,否则,可执行对当前帖 的普通OLA处理。根据示例性实施例,如果相关性尺度accA小于0. 5或大于1. 5,则可执行 普通0LA处理,否则,可执行相位匹配错误隐藏处理。该里,上限值和下限值仅是说明性的, 并可通过实验或仿真来将上限值和下限值预先设置为最佳值。
[0276] 当先前帖是错误帖并且已执行了对先前帖的相位匹配错误隐藏处理时,第二相位 匹配错误隐藏单元3713可对作为PGF的当前帖执行相位匹配错误隐藏处理。
[0277] 当先前帖是错误帖并且已执行了对先前帖的相位匹配错误隐藏处理时,第S相位 匹配错误隐藏单元3714可对形成突发错误帖的当前帖执行相位匹配错误隐藏处理。
[0278] 当PGF在预定低频带中不具有最大能量时,第一时域错误隐藏单元3732可对作为 错误帖的当前帖执行时域错误隐藏处理。
[0279] 当PGF在预定低频带中不具有最大能量时,第二时域错误隐藏单元3733可对作为 先前错误帖的NGF的当前帖执行时域错误隐藏处理。
[0280] 图38是根据示例性实施例的图37的第一相位匹配错误隐藏单元3712或第二相 位匹配错误隐藏单元3713的框图。
[0281] 图38中示出的相位匹配错误隐藏单元3810可包括最大相关性捜索单元3812、复 制单元3813和平滑单元3814。平滑单元3814可被选择性地包括。
[0282] 参照图38,最大相关性捜索单元3812可从存储在缓冲器中的N个过去好帖中捜 索与PGF中的解码信号中的捜索区段具有最大相关性(即,最相似)的匹配区段,其中,捜 索区段与当前帖相邻。作为捜索的结果而获得的匹配区段的位置索引可被提供给复制单元 3813。最大相关性捜索单元3812可按照相同的方式针对作为随机错误帖的当前帖或在先 前帖是随机错误帖并且已执行了对先前帖的相位匹配错误隐藏处理时的作为好帖的当前 帖来进行操作。当当前帖是错误帖时,可优选地预先执行频域错误隐藏处理。根据示例性 实施例,最大相关性捜索单元3812可获得用于在已确定将被执行相位匹配错误隐藏处理 的作为错误帖的当前帖的相关性尺度,并再次确定相位匹配错误隐藏处理是否合适。
[0283] 复制单元3813可通过参考匹配区段的位置索引来将从匹配区段的末端开始的预 定时长复制到作为错误帖的当前帖。另外,当先前帖是随机错误帖并且已执行了对先前帖 的相位匹配错误隐藏处理时,复制单元3813可通过参考匹配区段的位置索引来将从匹配 区段的末端开始的预定时长复制到作为正常帖的当前帖。此时,与窗长度相应的时长可被 复制到当前帖。根据示例性实施例,当从匹配区段的末端开始的可复制时长比窗长度短时, 从匹配区段的末端开始的可复制时长可被重复地复制到当前帖。
[0284] 平滑单元3814可通过0LA执行平滑处理来产生关于错误被隐藏的当前帖的时域 信号,W使当前帖和相邻帖之间的不连续性最小化。将参照图39和图40来详细描述平滑 单元3814的操作。
[0285] 图39是用于描述根据示例性实施例的图38的平滑单元3814的操作的示图。
[0286] 参照图39,可在存储在缓冲器中的N个过去好帖中捜索与先前帖n-1中的解码信 号中的捜索区段3912最相似的匹配区段3913,其中,捜索区段3912与作为错误帖的当前帖 n相邻。接下来,可通过考虑窗长度,将从匹配区段3913的末端开始的预定时长复制到已发 生错误的当前帖n。当复制处理完成时,可在当前帖n的开始部分,对复制的信号3914和存 储在先前帖n-1中的用于重叠的Oldauout信号3915执行第一重叠时长3916的重叠。由 于信号的相位彼此匹配,因此第一重叠时长3916的长度可比在普通0LA处理中使用的长度 更短。例如,如果在普通OLA处理中使用6ms,则第一重叠时长3916可使用1ms,但不限于 此。当从匹配区段3913的末端开始的可复制时长比窗长度短时,从匹配区段3913的末端 开始的可复制时长可部分重叠,并可被重复地复制到当前帖n。根据示例性实施例,重叠时 长可与第一重叠时长3916相同。在该种情况下,可在下一帖n+1的开始部分,对两个复制 的信号3914和3917中的重叠部分与存储在当前帖n中的用于重叠的Oldauout信号3918 执行第二重叠时长3919的重叠。由于信号的相位彼此匹配,因此第二重叠时长3919的长 度可比在普通0LA处理中使用的长度更短。例如,第二重叠时长3919的长度可与第一重叠 时长3916的长度相同。也就是说,当从匹配区段3913的末端开始的可复制时长等于或长 于窗长度时,可执行仅针对第一重叠时长3916的重叠。如上所述,通过对复制的信号3914 和存储在先前帖n-1中的用于重叠的Oldauout信号3915执行重叠,可使在当前帖n的开 始部分与先前帖n-1的不连续性最小化。作为结果,可产生信号3920,其中,信号3920与窗 长度相应,并且对于信号3920,已执行了当前帖n和先前帖n-1之间的平滑处理并且错误已 被隐藏。
[0287] 图40是用于描述根据另一示例性实施例的图38的平滑单元3814的操作的示图。 [028引参照图40,可在存储在缓冲器中的N个过去正常帖中捜索与先前帖n-1中的解码 信号中的捜索区段4012最相似的匹配区段4013,其中,捜索区段4012与作为错误帖的当前 帖n相邻。接下来,可通过考虑窗长度,将从匹配区段4013的末端开始的预定时长复制到 已发生错误的当前帖n。当复制处理完成时,可在当前帖n的开始部分,对复制的信号4014 和存储在先前帖n-1中的用于重叠的Oldauout信号4015执行第一重叠时长4016的重叠。 由于信号的相位彼此匹配,因此第一重叠时长4016的长度可比在普通0LA处理中使用的长 度更短。例如,如果在普通0LA处理中使用6ms,则第一重叠时长4016可使用1ms,但不限于 此。当从匹配区段4013的末端开始的可复制时长比窗长度短时,从匹配区段4013的末端 开始的可复制时长可部分重叠,并可被重复地复制到当前帖n。在该种情况下,可执行对两 个复制的信号4014和4017中的重叠部分4019的重叠。重叠部分4019的长度可优选地与 第一重叠时长4016的长度相同。也就是说,当从匹配区段4013的末端开始的可复制时长 等于或长于窗长度时,可执行仅针对第一重叠时长4016的重叠。如上所述,通过对复制的 信号4014和存储在先前帖n-1中的用于重叠的
Oldauout信号4015执行重叠,可使在当前 帖n的开始部分与先前帖n-1的不连续性最小化。作为结果,可产生第一信号4020,其中, 第一信号4020与窗长度相应,并且对于第一信号4020,已执行了当前帖n和先前帖n-1之 间的平滑处理并且错误已被隐藏。接下来,通过在重叠时长4022中执行对与重叠时长4022 相应的信号和存储在当前帖n中的用于重叠的Oldauout信号4018的重叠,可产生第二信 号4023,其中,对于第二信号4023,作为错误帖的当前帖n和重叠时长4022中的下一帖n+1 之间的不连续性被最小化。
[0289] 因此,当信号的主频率(例如,基本频率)在每个帖中不同时,或者当信号快速变 化时,即使在复制的信号的尾部(即,与下一帖n+1的重叠时长中)发生相位失配,也可通 过执行平滑处理来使当前帖n和下一帖n+1之间的不连续性最小化。
[0290] 与第一信号4020和第二信号4023的每个将来区域相应的部分(即,与下一帖n+1 重叠的区域)可被存储在存储器中,其中,对于第一信号4020,已执行了当前帖n和先前帖 n-1之间的平滑处理并且错误已被隐藏,对于第二信号4023,当前帖n和下一帖n+1之间的 重叠时长4022中的不连续性已被最小化。在NGF中,可根据信号的特征来选择存储在存储 器中的部分之一,并且在实际解码中,存储在存储器中的部分之一可作为Oldauout信号W 用于重叠。
[0291] 除了选择Oldauout信号的部分之外,对NGF的相位匹配可与在时域中对NGF的处 理相同。
[0292] 根据本发明的实施例,在图40中产生的相位匹配块的两个Oldauout信号4015和 4018可被如下确定;
[0293]
[0294]
[0295] 其中,mean_en_hi曲表示指示针对每个帖的信号的变化级别的信息,并可由存储 器更新单元预先针对正常帖来计算。根据本发明的实施例,mean_en_hi曲可指示在计算时 在针对每个频带获得两个先前帖的能量平均值与当前帖的能量之比之后针对所有频带获 得的帖的平均值。当mean_en_hi曲的值接近于1时,该可表示两个先前帖的能量平均值与 当前帖的能量之间的变化不大,当mean_en_hi曲的值小于0. 5或大于2时,该可表示能量 的变化非常大。
[0296] 当能量的变化非常大时,oldoutjha_idx被设置为1,该种情况指示使用第二信 号4023。当能量的变化不大时,oldoutjha_idx被设置为0,该种情况指示使用第一信号 4020。
[0297] 接下来,对于突发错误的相位匹配的情况不需要最佳区段捜索处理,对于其它部 分,除了执行捜索处理之外,还可根据如参照图39或图40描述的相同顺序来执行隐藏处 理。
[029引图41是根据示例性实施例的包括编码模块的多媒体装置的框图。
[0299] 参照图41,多媒体装置4100可包括通信单元4110和编码模块4130。另外,多媒 体装置4100还可根据作为编码的结果而获得的音频比特流的使用来包括用于存储该音频 比特流的存储单元4150。此外,多媒体装置4100还可包括麦克风4170。也就是说,可选择 性地包括存储单元4150和麦克风4170。多媒体装置4100还可包括任意解码模块(未示 出),例如,用于执行普通解码功能的解码模块或根据示例性实施例的解码模块。编码模块 4130可通过与包括在多媒体装置4100中的其它组件(未示出)集成为一体来由至少一个 处理器(未示出)来实现。
[0300] 通信单元4110可接收从外部提供的音频信号或编码比特流中的至少一个,或可 发送恢复音频信号或作为由编码模块4130进行编码的结果而获得的编码比特流中的至少 一个。
[0301] 通信单元4110被配置为通过无线网络(诸如无线互联网、无线内联网、无线电话 网络、无线局域网(LAN)、Wi-Fi、Wi-Fi直连(W抑)、第S代(3G)、第四代(4G)、藍牙、红外数 据组织(IrDA)、射频识别(RFID)、超宽带扣WB)、Zigbee或近场通信(NFC))或有线网络(诸 如有线电话网络或有线互联网),将数据发送到外部多媒体装置,或从外部多媒体装置接收 数据。
[0302] 根据示例性实施例,编码模块4130可考虑在通过通信单元4110或麦克风4170提 供的时域信号中,当前帖中的检测为瞬态的时长是否属于重叠时长,来设置用于下一帖的 拖尾延迟保护标志。
[0303] 存储单元4150可存储操作多媒体装置4100所需要的各种程序。
[0304] 麦克风4170可将来自用户或外部的音频信号提供给编码模块4130。
[0305]图42是根据示例性实施例的包括解码模块的多媒体装置的框图。
[0306] 图42的多媒体装置4200可包括通信单元4210和解码模块4230。另外,根据作 为解码结果而获得的恢复的音频信号的使用,图42的多媒体装置4200还可包括用于存储 恢复的音频信号的存储单元4250。另外,图42的多媒体装置4200还可包括扬声器4270。 也就是说,存储单元4250和扬声器4270是可选的。图42的多媒体装置4200还可包括编 码模块(未示出),例如,用于执行普通编码功能的编码模块或根据示例性实施例的编码模 块。解码模块4230可与包括在多媒体装置4200中的其它组件(未示出)集成,并可由至 少一个处理器实现。
[0307] 参照图42,通信单元4210可接收从外部提供的音频信号或编码比特流中的至少 一个,或可发送作为解码模块4230的解码结果而获得的恢复音频信号或作为编码的结果 获得的音频比特流中的至少一个。通信单元4210可与图41的通信单元4110实质上相似 地实现。
[0308] 根据示例性实施例,解码模块4230可接收通过通信单元4210提供的比特流,当当 前帖是错误帖时在频域中执行错误隐藏处理,当当前帖是好帖时对频谱系数进行解码,对 作为错误帖或好帖的当前帖执行时频逆变换处理,基于关于时频逆变换处理之后产生的时 域信号的帖状态和相位匹配标志中的至少一个来选择基于相位匹配的第一主模式和基于 简单重复的第二主模式之一,并基于选择的模式对当前帖执行时域错误隐藏处理,其中,当 前帖是错误帖,或者当前帖是在先前错误帖之后的好帖。
[0309] 存储单元4250可存储由解码模块4230产生的恢复音频信号。另外,存储单元4250 可存储操作多媒体装置4200所需的各种程序。
[0310] 扬声器4270可将由解码模块4230产生的恢复音频信号输出到外部。
[0311] 图43是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
[0312] 图43中示出的多媒体装置4300可包括通信单元4310、编码模块4320和解码模块 4330。另外,多媒体装置4300还可根据作为编码的结果而获得的音频比特流或作为解码的 结果而获得的恢复音频信号的使用,来包括用于存储音频比特流或恢复音频信号的存储单 元4340。另外,多媒体装置4300还可包括麦克风4350和/或扬声器4360。编码模块4320 和解码模块4330可通过与包括在多媒体装置4300中的其它组件(未示出)集成为一体, 来由至少一个处理器(未示出)实现。
[0313] 由于图43中示出的多媒体装置4300的组件与由图41中示出的多媒体装置4100 的组件或图42中示出的多媒体装置4200的组件相应,因此,省略对其的详细描述。
[0314] 图41、图42和图43中示出的多媒体装置4100、4200和4300中的每一个可包括语 音通信专用终端(诸如电话或移动电话)、广播或音乐专用装置(诸如TV或MP3播放器) 或语音通信专用终端和广播或音乐专用终端的混合终端装置,但不限于此。另外,多媒体装 置4100、4200和4300中的每一个可被用作客户机、服务器或位于客户机和服务器之间的换 能器。
[0315] 当多媒体装置4100、4200或4300是例如移动电话时,尽管未示出,但多媒体装置 4100、4200或4300还可包括用户输入单元(诸如键区)、用于显示由用户界面或移动电话 处理的信息的显示单元W及用于控制移动电话的功能的处理器。另外,移动电话还可包括 具有图像拾取功能的相机单元和用于执行移动电话所需的功能的至少一个组件。
[0316] 当多媒体装置4100、4200或4300是例如TV时,尽管未示出,但多媒体装置4100、 4200或4300还可包括用户输入单元(诸如键区)、用于显示接收到的广播信息的显示单元 W及用于控制TV的所有功能的处理器。另外,TV还可包括用于执行TV的功能的至少一个 组件。
[0317] 根据实施例的方法可被编写为计算机可执行程序,并可被实现在通用数字计算机 中,其中,该通用数字计算机通过使用非暂时性计算机可读记录介质执行所述程序。另外, 可在实施例中使用的数据结构、程序指令或数据文件可WW各种方式被记录在非暂时性计 算机可读记录介质中。非暂时性计算机可读记录介质是可存储随后可由计算机系统读取的 数据的任何数据存储装置。非暂时性计算机可读记录介质的示例包括磁存储介质(诸如硬 盘、软盘和磁带)、光学记录介质(诸如CD-ROM和DVD)、磁光介质(诸如光盘)W及专口被 配置为存储和执行程序指令的硬件装置(诸如ROM、RAM和闪存)。另外,非暂时性计算机 可读记录介质可W是用于传输指定程序指令、数据结构等的信号的传输介质。程序指令的 示例不仅可包括由编译器创建的机器语言代码还可包括由计算机使用解释器等可执行的 高级语言代码。
[031引虽然已专口示出和描述了示例性实施例,但本领域的普通技术人员将理解在不脱 离由权利要求限定的本发明构思的精神和范围的情况下,可在示例性实施例中进行形式和 细节上的各种改变。
【主权项】
1. 一种帧错误隐藏(FEC)方法,包括: 基于关于时频逆变换处理之后产生的时域信号的帧状态和相位匹配标志中的至少一 个,选择基于相位匹配的第一主模式和基于简单重复的第二主模式之一; 基于选择的模式对当前帧执行时域错误隐藏处理,其中,当前帧是错误帧,或者,当前 帧是在先前错误帧之后的好帧。2. 如权利要求1所述的FEC方法,其中,帧状态是从当前帧或者是从当前帧和至少一个 先前帧被获得的。3. 如权利要求1所述的FEC方法,其中,相位匹配标志包括第一参数和第二参数,其 中,第一参数被产生以用于在每个好帧确定在下一错误帧中是否使用相位匹配,第二参数 根据在先前帧中是否使用了相位匹配而被产生。4. 如权利要求3所述的FEC方法,其中,第一参数是使用好帧中的子频带的能量值和频 谱系数而被产生的。5. 如权利要求1所述的FEC方法,其中,帧状态包括关于当前帧或先前帧是否是错误帧 的信息以及关于稳态性的信息。6. 如权利要求1所述的FEC方法,其中,第一主模式包括第一子模式、第二子模式和第 三子模式,其中,第一子模式用于作为错误帧的当前帧、第二子模式用于在作为随机错误帧 的先前帧之后的作为好帧的当前帧,第三子模式用于在作为突发错误帧的先前帧之后的作 为好帧的当前帧。7. 如权利要求1所述的FEC方法,其中,第二主模式包括第四子模式和第五子模式,其 中,第四子模式用于作为错误帧的当前帧,第五子模式用于在作为错误帧的先前帧之后的 作为好帧的当前帧。8. 如权利要求1所述的FEC方法,其中,基于第一主模式的时域错误隐藏处理包括:将 从存储在缓冲器中的多个正常帧搜索到的预定大小的区段复制到当前帧。9. 如权利要求1所述的FEC方法,其中,基于第一主模式的时域错误隐藏处理包括:将 从存储在缓冲器中的多个正常帧搜索到的预定大小的区段复制到当前帧,并在相邻帧之间 执行平滑处理。10. 如权利要求9所述的FEC方法,其中,平滑处理包括对当前帧的开始部分的处理。11. 如权利要求9所述的FEC方法,其中,平滑处理包括对当前帧的开始部分和当前帧 的末尾部分的处理。12. 如权利要求8或9所述的FEC方法,其中,基于第一主模式的时域错误隐藏处理包 括:从存储在缓冲器中的多个好帧之中搜索与先前好帧的解码信号中的相邻于当前帧的搜 索区段具有最高相关性的匹配区段,并将从该匹配区段开始的预定大小的区段复制到当前 帧。13. 如权利要求12所述的FEC方法,其中,搜索区段的大小和缓冲器中的搜索范围是根 据与将被搜索的音调分量相应的最小频率的波长而被确定的。14. 如权利要求1所述的FEC方法,还包括:在当前帧是错误帧时,在时频逆变换处理 之前对当前帧执行频域错误隐藏处理。15. 如权利要求1所述的FEC方法,其中,在时频逆变换处理中使用重叠时长小于50% 的窗。16. 如权利要求1所述的FEC方法,其中,基于第一主模式的时域错误隐藏处理包括: 执行根据每个子模式而不同的平滑处理而不是执行在时频逆变换处理之后的普通重叠相 加(OLA)处理。17. 如权利要求16所述的FEC方法,其中,将作为平滑处理的结果的重叠时长和非重叠 时长之间的能量变化与预定阈值进行比较,基于比较的结果来执行普通OLA而不是执行平 滑处理。18. 如权利要求1所述的FEC方法,其中,基于第二主模式的时域错误隐藏处理包括: 执行根据每个子模式而不同的平滑处理而不是执行在时频逆变换处理之后的普通重叠相 加(OLA)处理。19. 如权利要求18所述的FEC方法,其中,将作为平滑处理的结果的重叠时长和非重叠 时长之间的能量变化与预定阈值进行比较,基于比较的结果来执行普通OLA而不是执行平 滑处理。20. 如权利要求16所述的FEC方法,其中,将被用于平滑处理的平滑窗的重叠时长的长 度是基于当前帧的信号特性而被确定的。21. 如权利要求18所述的FEC方法,其中,将被用于平滑处理的平滑窗的重叠时长的长 度是基于当前帧的信号特性而被确定的。22. 如权利要求1所述的FEC方法,其中,基于第二主模式对作为错误帧的当前帧的时 域错误隐藏处理包括: 在时频逆变换处理之后,对当前帧的信号执行加窗处理; 在时频逆变换处理之后,在当前帧的开始部分重复两个帧之前的信号; 对在当前帧的开始部分重复的信号和当前帧的信号执行重叠相加(OLA)处理; 通过将具有预定重叠时长的平滑窗应用在先前帧的信号和当前帧的信号之间来执行 OLA处理。23. 如权利要求1所述的FEC方法,其中,基于第二主模式对在作为随机错误帧的先前 帧之后的作为好帧的当前帧的时域错误隐藏处理包括: 选择将在平滑处理中应用的平滑窗的重叠时长的长度; 在时频逆变换处理之后,通过将选择的平滑窗应用在先前帧的信号和当前帧的信号之 间来执行重叠相加(OLA)处理。24. 如权利要求1所述的FEC方法,其中,基于第二主模式对在作为突发错误帧的先前 帧之后的作为好帧的当前帧的时域错误隐藏处理包括: 在时频逆变换处理之后,将当前帧的信号中的用于下一帧的部分复制到当前帧的开始 部分; 在时频逆变换处理之后,通过将平滑窗应用到先前帧的信号和从将来复制的信号,执 行重叠相加(OLA)处理; 通过将具有预定重叠时长的平滑窗应用在先前帧中被替换的信号和当前帧的信号之 间来执行OLA处理,同时去除不连续性。25. 如权利要求1所述的FEC方法,其中,选择的模式是通过进一步考虑当前帧的稳态 性而被获得的。26. 如权利要求25所述的FEC方法,其中,稳态性是使用当前帧和先前帧之间的每频带 能量差的平均值、先前帧的稳态性以及当前帧的能量与移动平均能量之间的差中的至少一 个而被确定的。27. -种音频解码方法,包括: 在当前帧是错误帧时,在频域中执行错误隐藏处理; 在当前帧是好帧时,对频谱系数进行解码; 对作为错误帧或好帧的当前帧执行时频逆变换处理; 基于关于时频逆变换处理之后产生的时域信号的帧状态和相位匹配标志中的至少一 个,选择基于相位匹配的第一主模式和基于简单重复的第二主模式之一,并基于选择的模 式对当前帧执行时域错误隐藏处理,其中,当前帧是错误帧,或者,当前帧是在先前错误帧 之后的好帧。28. 如权利要求27的音频解码方法,其中,帧状态是从当前帧或者是从当前帧和至少 一个先前帧被获得的。29. 如权利要求27的音频解码方法,其中,在当前帧是瞬态帧时,对解码的频谱系数的 解交织被执行。30. 如权利要求27的音频解码方法,其中,在时频逆变换处理中使用重叠时长小于 50%的窗。
【专利摘要】公开了一种帧错误隐藏方法和设备以及音频解码方法和设备。所述帧错误隐藏(FEC)方法包括:基于关于时频逆变换处理之后产生的时域信号的至少一个帧的状态和相位匹配标志中的至少一个,选择FEC模式;基于选择的FEC模式对当前帧执行相应的时域错误隐藏处理,其中,当前帧是错误帧,或者,当先前帧是错误帧时当前帧是正常帧。
【IPC分类】G10L19/005
【公开号】CN104885149
【申请号】CN201380061310
【发明人】成昊相, 李男淑
【申请人】三星电子株式会社
【公开日】2015年9月2日
【申请日】2013年9月24日
【公告号】EP2903004A1, US20140142957, WO2014046526A1