具有位置信息的有效传输的多通道编码器和解码器的制造方法
【技术领域】
[0001] 本发明涉及位置信息的通信,并且尤其但不完全涉及用于音频处理应用的位置数 据的通信。
【背景技术】
[0002] 随着数字信号表示和通信已日益取代模拟表示和通信,各种各样源信号的数字编 码在过去数十年已变得越来越重要。例如,诸如语音和音乐之类的音频内容越来越多地以 数字内容编码为基础。此外,随着例如环绕立体声和家庭影院设置成为流行,音频消费已日 益成为一种包络(enveloping)三维体验。
[0003] 已研制音频编码格式来提供日益有能力的、多样的和灵活的音频服务,并且尤其 已研制支持空间音频服务的音频编码格式。
[0004] 如同DTS和Dolby Digital之类的众所周知的音频编码技术产生编码的多通道音 频信号,其将空间图像表示为围绕着收听者被放置在固定位置上的许多通道。对于与对应 于多通道信号的设置不同的扬声器设置来说,空间图像将是次最优的。并且,基于通道的音 频编码系统通常不能应付不同数量的扬声器。
[0005] (MPEG-D) MPEG Surround (环绕)提供一种多通道音频编码工具,其允许现有的基 于单声道或基于立体声的编码器被扩展至多通道音频应用。图1举例说明MPEG Surround 系统的元素的示例。使用通过原始的多通道输入的分析而获得的空间参数,MPEG Surround 解码器通过单声道或立体声信号的受控上混(upmix)以获得多通道输出信号而能够重新创 建空间图像。
[0006] 由于多通道输入信号的空间图像被参数化,所以MPEG Surround允许利用不使用 多通道扬声器设置的渲染设备来解码同一个多通道比特流。示例是在耳机上的虚拟环绕立 体声再现,其被称为MPEG Surround双耳解码处理。在这种模式中,在使用普通耳机的同时 能够提供逼真的环绕立体声体验。另一示例是较高阶多通道输出例如7. 1通道至较低阶设 置例如5. 1通道的修剪(pruning)。
[0007] 实际上,随着越来越多的再现格式变得可用于主流消费者,用于渲染空间声音的 渲染配置的变化和灵活性近年来已显著增加。这要求音频的灵活表示。随着MPEG Surround 编解码器的引入,已采取重要的步骤。然而,仍然针对特定的扬声器设置来产生和发送音 频。没有规定通过不同的设置和通过非标准(即,灵活的或用户定义的)扬声器设置的再现。 实际上,具有使得音频编码和表示日益独立于特定的预定的和标称的扬声器设置的愿望。 日益优选的是:能够在解码器/渲染侧上执行针对多种多样的不同的扬声器设置的灵活适 配(adaptation)。
[0008] 为了提供更灵活的音频的表示,MPEG标准化了称为"Spatial Audio Object Coding (空间音频对象编码)"(MPEG-D SA0C)的格式。与诸如DTS、Dolby Digital和MPEG Surround之类的多通道音频编码系统形成对比,SA0C提供个别音频对象而非音频通道的 有效编码。借助于渲染矩阵,个别声音对象被映射到扬声器通道上。而在MPEG Surround 中,每一个扬声器通道能够被视为源自声音对象的不同混合,SAOC使得在解码器侧上可利 用的个别声音对象用于如图2所示的交互操纵。在SA0C中,多个声音对象和参数化数据一 起被编码到单声道或立体声缩混(downmix)中,其中参数化数据允许声音对象在植染侧上 被提取,从而允许个别音频对象可用于例如由终端用户进行的操纵。
[0009] 实际上,与MPEG Surround相类似,SA0C也创建单声道或立体声缩混。另外,计算 和包括对象参数。在解码器侧上,用户可以操纵这些参数来控制个别对象的各种各样特征 诸如位置、水平、均衡乃至应用诸如混响之类的效果。图3举例说明使得用户能够控制在 SA0C比特流中包含的个别对象的交互界面。
[0010] 通过发送音频对象而非仅仅再现通道,SA0C允许更灵活的方案并且尤其允许更多 的基于渲染的适应性(adaptability)。假定空间被扬声器充分覆盖,则这允许解码器侧将 音频对象放置在空间中的任意位置上。这样,在所发送的音频与再现或渲染设置之间没有 关系,因此能够使用任意的扬声器设置。这对于例如其中扬声器几乎从不位于预定位置上 的典型起居室中的家庭影院设置而言是有利的。在SA0C中,在解码器侧上决定在声音场景 中这些对象被放置在什么地方,这从艺术的角度来看时常不是所希望的。SA0C标准确实提 供在比特流中发送默认渲染矩阵的方式,这消除解码器责任。然而,所提供的方法依赖于或 固定的再现设置或依赖于未指明的语法。因而,SA0C没有提供规范的手段来完全发送音频 场景而与扬声器设置无关。并且,SA0C不太适合于(not well equipped)弥散性信号分量 的忠实植染。虽然具有包括所谓的多通道背景对象(multichannel background object)来 捕获漫声的可能性,但是这个对象被束缚于一个特定的扬声器配置,例如,诸如5. 1环绕扬 声器设置。
[0011] 由3D Audio Alliance (音频联盟)(3DAA)正在研制用于3D音频的音频格式的 另一规范,其中3DAA是工业联盟。3DAA致力于研制"将有助于从当前的扬声器馈送范例至 灵活的基于对象的方案的转变"的用于3D音频的传输的标准。在3DAA中,将定义允许将传 统的多通道缩混连同个别声音对象一起传输的比特流格式。另外,包括对象定位数据。在 图4中举例说明生成3DAA音频流的原理。
[0012] 在3DAA方案中,单独地在扩展流中接收声音对象,并且可以从多通道缩混中提取 这些声音对象。由此产生的多声道缩混与个别可用的对象一起进行渲染。
[0013] 这些对象可以由所谓的词干(stem)构成。这些词干基本上是分组(缩混)的轨道 (track)或对象。因此,对象可以由包装在词干中的多个子对象构成。在3DAA中,利用音 频对象的选择,能够发送多通道参考混合(reference mix)。3DAA针对每一个对象发送3D 位置数据。这些对象随后能够使用3D位置数据来提取。可供选择地,可以发送逆的混合矩 阵,其描述这些对象与参考混合之间的关系。
[0014] 根据3DAA的描述,通过给每一个对象分配角度和距离,很可能发送声音场景信 息,其表明:相对于例如默认的前进方向应该将该对象放置在什么地方。因而,针对每一个 对象,发送位置信息。这对于点源来说是有用的,但是其无法描述广源(wide source)(例 如,如同合唱或欢呼)或弥漫性声场(诸如周围环境)。当从参考混合中提取所有的点源时, 周围的多声道混合保留。与SA0C相类似,3DAA中的残留物(residual)被固定于特定的扬 声器设置。
[0015] 因而,SA0C和3DAA方案二者并入能够在解码器侧上个别操纵的个别音频对象的 传输。这两种方案之间的不同在于:SAOC通过相对于缩混提供表征音频对象的参数来提供 有关这些音频对象的信息(即,以致在解码器侧上根据缩混来生成这些音频对象),而3DAA 提供音频对象作为完整的且独立的音频对象(即,能够在解码器侧上独立于缩混来生成这 些音频对象)。对于两种方案,可以针对这些音频对象来传送位置数据。
[0016] 传统的和新的用于音频编码和分发的方案之间的显著差异在于:传统的方案固有 地假设特定的扬声器配置。因而,对于这些方案来说,每一个扬声器的位置是(被假设为)已 知的。此外,音频作为针对个别扬声器的音频信号而被编码并被分发,并因而生成将从已知 的渲染位置渲染的音频信号,并且以致当从这些位置渲染这些信号时,由此产生的声音将 产生声源位于所希望位置上的空间感知。作为这个方案的结果,只需要传送针对个别扬声 器的音频信号,并且不需要位置信息。
[0017] 然而,对于较新的方案来说,不能进行这样的假设,并相应地要求或希望也传送位 置数据。
[0018] 例如,与音频对象的所希望或所建议的位置相关的位置信息应该被传送。作为 另一示例,可取的可能是将要传送所希望的扬声器位置(或,例如,捕获信号的麦克风的位 置),以致渲染器能够在根据在编码的时间未知的给定渲染配置生成空间声音场景时考虑 这样的位置。另一示例是:当提供对于双耳虚拟声音渲染的支持时,诸如当使用HRTF处理 来经由耳机渲染空间音频时。在这个案例中,可以传送位置信息,以便双耳渲染器选择与所 希望的位置相对应的恰当的HRTF滤波器。
[0019] 然而,位置数据的通信对于音频信息的通信引入开销,并且具体地导致比其他情 况更高的数据率。可取的是尽可能减少这个开销,并因而希望位置数据的有效表示和通信。
[0020] 因此,改善的方案将是有利的,并且特别地允许位置信息的改善的表示与通信、降 低的数据率、减少的开销、便利的实现和/或改善的性能的方案将是有利的。
【发明内容】
[0021] 相应地,本发明寻求优选地、单个地或以任何组合来减轻、缓解或消除上述缺点之 中的一个或多个。
[0022] 根据本发明的一方面,提供一种用于传送位置的设备,该设备包括:用于接收位置 的接收机,该位置具有至少第一值和第二值,第一值表示第一位置参数,并且第二值表示第 二位置参数;匹配电路,用于确定第二值是否与用于第二位置参数的标称值相匹配;用于 生成输出数据的输出电路,该输出电路被安排成:当第二值与标称值相匹配时,在输出数据 的第一字段中包括表示第一值的第一数据但是在输出数据中不包括表示第二值的数据;以 及当第二值与标称值不匹配时,在第一字段中包括第二数据,第二数据表示用于第一位置 参数的无效位置值。
[0023] 本发明可以允许改善的位置的通信。特别地,一个或多个位置可以利用减少的开 销来传送。在许多实施例和情形中可以降低为了传送音频数据和相关联的位置信息所需的 数据率。这在许多实施例中可以实现而不限制能够传送的位置的范围。
[0024] 该方案基于发明人的认识,即通过允许位置有时利用比用于描述位置的参数的数 量更少的值来表明,能够实现有利地在许多情形中改善的位置的表示和通信。例如,三维位 置可以利用单个值或两个值来表示。这可以通过对于至少一个分量使用标称值来实现。这 些标称值在发射机上和在接收机上都可以是已知的。然而,该方案还虑及能够传送的位置 不限于只在一个参数方面变化的位置。相反,数据字段的数据能够动态地变化,以便在对于 至少一个其他位置参数假设标称值的情况下表示第一位置参数的值或表示这些标称值不 能用于这个其他位置参数的指示。具体地,第一数据字段能够包括指示第一位置参数的值 的数据或能够表明第二通信参数具有标称值的假设是否是有效的。
[0025]该方案可以允许低复杂度的语法用于表示。它可
以允许导致显著减少开销的非常 紧凑的位置的表示。实际上,许多位置可以利用单个值来表明而不将该位置限于单个维度。 相反,能够传送完整的二维或三维位置,其中在必要的时候,只传送一个以上的值。
[0026] 第一和第二位置参数可以表示位置并且尤其二维或三维位置的表示的不同分量。 例如,该位置可以作为具有两个或三个元素的矢量来给定,并且第一和第二参数可以对应 于位置矢量的第一和第二元素。
[0027] 例如,第一位置参数可以是方位角,并且第二位置参数可以是仰角或距离。
[0028] 第二值是否与标称值相匹配的确定可以依照匹配标准。将意识到:可以使用任何 合适的匹配标准。例如,如果第二值与标称值之间的(绝对)差小于阈值,则可以认为第二值 与标称值相匹配。
[0029] 标称值可以是初始值、预定值或例如用于以前位置的第二位置参数的值。
[0030] 可以(预)定义用于第一位置参数的有效值的集合,并且无效位置值可以是未被包 括在这个集合中的值。该集合可以作为有效值的范围来给定。
[0031] 在一些实施例中,第二数据表明在输出数据的第二字段中提供的数据的类型。
[0032] 第一字段可以是输出数据的任何字段。第二字段可以是输出数据的任何其他字 段。
[0033] 在一些实施例中,第二数据表明包括预定位置集合的指示的第二字段。
[0034]在一些实施例中,该位置进一步利用表示第三位置参数的第三值来给定,并且第 二数据表明:第二字段是否包括用于第二位置参数或第三位置参数的位置值。
[0035] 在一些实施例中,第二数据表明在至少三个位置的配对之间的相对差。
[0036] 在一些实施例中,第一位置参数与可能值的范围相关联,并且无效位置值是在该 范围之外的值。
[0037] 在一些实施例中,第二位置参数是距离参数或海拔高度(elevation)参数。
[0038] 在一些实施例中,该位置是至少以下之一:扬声器位置;声源位置;以及用于头部 相关的传递函数(Head Related Transfer Function)的虚拟声源位置。
[0039] 根据本发明的可选特征,输出电路被安排成:当第二值与标称值不匹配时,在输出 数据的第二字段中包括表示第二值的数据。
[0040]该方案可以允许用于提供和传送位置信息的有效方案。
[0041] 根据本发明的可选特征,输出电路被安排成:当第二值与标称值不匹配时,将标称 值设置成第二值。
[0042] 标称值可以用于后续的位置,即,用于使用同一方案但是利用更新的标称值来传 送后续的位置。具体地,接收机可以接收第二位置,该位置具有至少第三值和第四值,第三 值表示第一位置参数,并且第四值表示第二位置参数。匹配电路能够确定第四值是否与标 称值(在这个已被更新之后)相匹配。输出电路还被安排成:当第四值与标称值相匹配时, 在输出数据的第二字段中包括表示第三值的数据,但是在输出数据中不包括表示第四值的 数据。当第四值与标称值不匹配时,输出电路在第二字段中包括表示用于第一位置参数的 无效位置值的数据。
[0043] 该方案可以允许有效的位置的表示,并且可以特别地在许多应用中在允许不限制 的位置表示的同时导致低开销。
[0044]根据本发明的可选特征,输出电路被安排成:当第二值与标称值不匹配时,在输出 数据的第三字段中包括表示第一值的数据。
[0045] 该方案可以允许用于提供和传送位置信息的有效方案。
[0046]根据本发明的一方面,提供一种用于接收利用至少第一值和第二值给定的位置的 设备,第一值表示第一位置参数,并且第二值表示第二位置参数,该设备包括:用于接收包 括多个数据字段的输入数据的接收机;用于从多个数据字段之中的第一字段中提取第一数 据的数据提取器;用于确定第一数据是否表示用于第一位置参数的有效位置值的有效性电 路;用于确定位置的位置电路,该位置处理器被安排成:当第一数据表示有效位置值时,将 第一值确定为有效位置值,并将第二值确定为用于第二位置参数的标称值;以及当第一数 据不表示有效位置值时,从输入数据的第二字段中确定第二值。
[0047]本发明可以允许改善的位置的通信。特别地,一个或多个位置可以利用减少的开 销来传送。在许多实施例和情形中可以降低为了传送音频数据以及相关联的位置信息所需 的数据率。这可以在许多实施例中实现而不限制能够传送的位置的范围。
[0048] 该方案基于发明人的认识,即通过允许位置有时利用比用于描述该位置的参数的 数量更少的值来表明,能够实现有利地在许多情形中改善的位置的表示和通信。例如,三维 位置可以利用单个值或两个值来表示。这可以通过对于至少一个分量使用标称值来实现。 这些标称值在发射机上和在接收机上都可以是已知的。然而,该方案还虑及能够传送的位 置不限于只在一个参数方面变化的位置。相反,数据字段的数据能够动态地变化,以便在对 于至少一个其他位置参数假设标称值的情况下表示第一位置参数的值或表示这些标称值 不能用于这个其他位置参数的指示。具体地,第一数据字段能够包括表明第一位置参数的 值的数据或能够表明第二通信参数具有标称值的假设是否是有效的。
[0049] 该方案可以允许有效的和/或低复杂度的语法用于表示。它可以允许导致显著减 少开销的非常紧凑的位置的表示。实际上,许多位置可以利用单个值来表明而不将该位置 限于单个维度。相反,对于许多位置而言,仅使用一个值,能够传送完整的二维或三维位置, 并且在必要的时候,只传送一个以上的值。
[0050] 第一和第二位置参数可以表示位置并且尤其二维或三维位置的表示的不同分量。 例如,该位置可以作为具有两个或三个元素的矢量来给定,并且第一和第二参数可以对应 于位置矢量的第一和第二元素。
[0051] 例如,第一位置参数可以是方位角,并且第二位置参数可以是仰角或距离。
[0052] 第一数据是否表示有效位置值的确定可以依照有效性标准。将意识到:可以使用 任何合适的有效性标准。可以(预)定义用于第一位置参数的有效值的集合,并且无效位置 值可以是没有被包括在这个集合中的值。
[0053] 标称值可以是初始值、预定值或例如对于以前位置接收的第二位置参数的值。
[0054]当第一数据不表示有效位置值时,第一值可以在许多实施例中从输入数据的第三 字段中进行确定。
[0055] 根据本发明的可选特征,位置电路被安排成:当第一数据不表示有效位置值时,将 标称值设置成第二值。
[0056](新的)标称值随后可以用于提取后续的位置。例如,对于下一位置来说,同一方 案可以用于解码数据,但是使用新的标称值。具体地,数据提取器可以从输入数据的第二字 段中提取第二数据。有效性电路可以确定第二数据是否表示用于第一位置参数的有效位置 值。当第二数据表示有效位置值时,位置电路可以将用于新位置的第一位置参数的第三值 确定为有效位置值并将用于新位置的第二位置参数的第四值确定为(新的)标称值。当第一 数据不表示有效位置值时,位置电路可以从输入数据的第三字段中确定第四值。
[0057] 该方案可以允许有效的位置的表示,并且特别地可以在许多应用中导致低开销而 同时不限制能够传送的位置。特别地,该方案可以允许传送任何类型的位置而同时实质上 提供在位置被限制于具有特定特性诸如特定的海拔高度或距离时能够实现的通信效率。
[0058] 根据本发明的可选特征,第一数据表明在输出数据的第二字段中提供的数据的类 型。
[0059] 这可以允许特别有效的且灵活的一个或多个位置的表示和通信。
[0060] 根据本发明的可选特征,第一数据不表示有效位置值,第一数据表明第二字段包 括预定位置集合的指示;以及位置处理器被安排成确定至少第一值,以响应预定位置集合。
[0061] 这可以允许特别有效的且灵活的多个位置的表示和通信。
[0062] 根据本发明的可选特征,该位置进一步利用表示第三位置参数的第三值来给定, 并且当第一数据不表示有效位置值时,第一数据表明:第二字段包括用于第二位置参数的 位置值还是用于第三位置参数的位置值。
[0063] 这可以允许特别有效的且灵活的一个或多个位置的表示和通信。它可以允许特 别地针对三维位置的有效表示,其中两个参数通常(在位置之间)不如第三参数那样频繁改 变。第一位置参数可以具体地是方位参数,并且第二和第三位置参数可以例如分别是海拔 高度参数和距离参数。
[0064] 根据本发明的可选特征,第一数据不表示有效位置值,第一数据表明:第二字段包 括表明至少三个位置的配对之间的相对差的数据;以及位置处理器被安排成确定至少第一 值,以响应至少三个位置的配对之间的相对差。
[0065] 这可以允许特别有效的且灵活的多个位置的表示和通信。
[0066] 根据发明的可选特征,第一位置参数与可能值的范围相关联,并且无效位置值是 在该范围之外的值。
[0067] 这可以允许特别有利的用于确定和表示无效位置参数的方案。特别地,它可以允 许无效值的容易检测和表示,同时允许在给定范围内的位置的完整表示。该方案可能特别 适合于其中第一位置参数可以是角方向的实施例,因为这样的位置通常固有地与特定范围 的值相关联。
[0068] 根据本发明的可选特征,第二位置参数是距离参数和海拔高度参数之一。
[0069] 本发明可以为其中例如利用方位与距离和/或海拔高度来表示位置的实施例提 供特别有利的操作。在这样的实施例中,许多例如音频应用可以使用通常具有不同方位的 位置,但是大型集合共享海拔高度和/或距离。可以使用所描述的方案非常有效地传送这 样的位置的选集(collection)。
[0070] 根据本发明的可选特征,位置是至少以下之一:扬声器位置;声源位置;以及用于 头部相关的传递函数的虚拟声源位置。
[0071] 该方案可以提供非常有效的音频位置诸如虚拟声源位置、扬声器位置和其他声源 位置诸如所希望的音频对象的渲染位置的表示和通信。
[0072] 根据本发明的一方面,提供一种传送位置的方法,该方法包括:接收位置,该位置 具有至少第一值和第二值,第一值表示第一位置参数,并且第二值表示第二位置参数;确 定第二值是否与用于第二位置参数的标称值相匹配;生成输出数据;其中生成输出数据包 括:当第二值与标称值相匹配时,在输出数据的第一字段中包括表示第一值的第一数据,但 是在输出数据中不包括表示第二值的数据;以及当第二值与标称值不匹配时,在第一字段 中包括第二数据,第二数据表示用于第一位置参数的无效位置值。
[0073] 根据本发明的一方面,提供一种接收利用至少第一值和第二值给定的位置的方 法,第一值表示第一位置参
数,并且第二值表示第二位置参数,该方法包括:接收包括多个 数据字段的输入数据;从多个数据字段之中的第一字段中提取第一数据;确定第一数据是 否表示用于第一位置参数的有效位置值;确定位置;其中确定位置包括:当第一数据表示 有效位置值时,将第一值确定为有效位置值,并将第二值确定为用于第二位置参数的标称 值;以及当第一数据不表示有效位置值时,从输入数据的第二字段中确定第二值。
[0074] 本发明的这些以及其他的方面、特征和优点从下文描述的(一个或多个)实施例中 将是显而易见的并将参考这(一个或多个)实施例来阐述。
【附图说明】
[0075] 将仅通过示例、参考附图来描述本发明的实施例,其中: 图1举例说明MPEG Surround系统的元素的示例; 图2例示在MPEG SA0C中可能的音频对象的操纵; 图3举例说明使得用户能够控制在SA0C比特流中包含的个别对象的交互界面; 图4举例说明3DAA的音频编码的原理的示例; 图5举例说明双耳处理的示例; 图6举例说明根据本发明的一些实施例的位置数据的发射机的示例;以及 图7举例说明根据本发明的一些实施例的位置数据的接收机的示例。
【具体实施方式】
[0076] 以下的描述集中于可应用于声源位置的通信并且尤其可应用于使用头部相关的 传递函数HRTF (或等价)算法的双耳渲染的虚拟声源位置的通信的实施例。然而,将意识 到:本发明并不限于这个应用而可以应用于许多其他类型的位置的通信。
[0077]其中利用声源的虚拟定位来创建空间体验的双耳处理正变得越来越普遍。虚拟环 绕是利用HRTF来渲染声音的方法,以致音频源被感知为源自特定方向,从而创建收听物理 环绕声设置(例如5. 1扬声器)或环境(音乐会)的错觉。利用恰当的HRTF,能够计算为了收 听者感知来自任何方向的声音而在耳膜处所需的信号。如图5所示,这些信号随后在耳膜 处利用或耳机或串音消除方法(适合于通过紧密间隔开的扬声器的渲染)来重新创建。
[0078] 紧接着图5的直接渲染,能够用于渲染虚拟环绕的特定技术包括MPEG Surround 和Spatial Audio Object Coding (空间音频对象编码)以及即将到来的IS0/IEC MPEG中 有关3D Audio (音频)的工作项。这些技术提供计算有效的虚拟环绕渲染。
[0079] 通过在放置于耳朵中或靠近耳朵放置的麦克风上在2D或3D空间中在特定位置上 从声源中测量脉冲响应,能够确定所谓的Head Related Impulse Response(头部相关的脉 冲响应)(HRIR)或等价地确定HRTF。HRTF (在下面,该术语将被用于包括HRIR并且实际上 包括Binaural Room Impulse Response (双耳房间脉冲响应)(BRIR)等等)能够用于创建 在各种各样的位置上模拟多个源的双耳记录。这能够通过利用与声源的位置相对应的HRTF 的配对过滤每一个声源来实现。为了允许声源围绕收听者移动,需要具有足够的空间分辨 率的大量HRTF。HRTF滤波器时常与利用距最有效点(sweet-spot)的方位角、仰角和距离 所表明的特定的(虚拟的)声源位置相关联。
[0080] 为了控制音频对象的渲染,发射机/编码器可以发送允许渲染器选择恰当的HRTF 的个别音频对象的位置。然而,由于除了音频数据自身之外还需要传送位置数据,所以这样 的方案添加开销。
[0081] 实际上,在较新的标准中,可以提供独立于渲染配置并且相应地不与任何特定的 标称或假设的渲染配置相链接的音频数据。对于这样的音频数据,例如,可以提供允许编码 器/发射机侧指定例如所希望的空间体验的位置信息。渲染器随后能够取决于本地扬声器 配置来适配该处理,以便如利用位置数据所规定的那样来呈现音频。例如,音频数据可以 包括用于音频对象的许多声源位置,并且渲染器可以使用所接收的声源位置数据来适配渲 染,以致音频对象被感知成源自所希望的方向。在一些实施例中,可以传送或对于渲染配置 或对于所希望的参考设置而言定义假定的扬声器位置的声源位置数据。
[0082] 为了最小化由于包括位置信息的要求而导致的开销,重要的是在所传送的数据流 /信号中有效地表示和编码这些位置。
[0083] 图6举例说明用于传送位置信息并且尤其用于与相关联的位置信息一起传送音 频数据的发射机的示例。
[0084] 发射机包括接收或生成音频数据的音频处理器601。音频数据例如可以包括音频 通道、音频对象、背景音频等等。音频数据可以从记录的音频中生成或可以例如合成生成。
[0085] 发射机进一步包括接收将与音频一起传送的一个或多个位置的位置接收机603。 如所述的,这些位置可以是声源位置,诸如用于双耳渲染的虚拟声源位置、对于音频通道或 音频对象所希望的位置或扬声器位置等等。
[0086] 位置接收机603可以从任何内部或外部源接收位置信息。例如,位置接收机603可 作被实施为从子例程接收位置数据的固件操作。实际上,在一些实施例中,虚拟声场(sound stage)可以基于例如三维模型来渲染。可以提供音频给音频处理器601或由音频处理器 601生成音频,并且可以从音频处理器601提供位置信息至位置接收机603。
[0087] 每一个位置利用多个参数的值(位置变量)来给定。因而,每一个位置可以作为值 的集合来给定,其中该集合的每一个分量对应于给定参数。例如,这些位置可以作为利用第 一和第二参数的值表示的二维位置来给定或者可以作为利用第一、第二和第三参数的值表 示的三维位置来给定。因而,这些位置作为至少表示第一位置参数的第一值和表示第二位 置参数的第二值来给定。
[0088] 在下面示例中,第一位置参数对应于方位角,并且第二和第三位置参数对应于仰 角和距离(或反之亦然)。因而,每一个位置利用方位角、仰角和距离来给定。因而,在该示 例中,方位值是位置的第一值,并且它提供在这个案例中是方位参数的第一位置参数的值。 仰角是位置的第二值,并且它提供在这个案例中是仰角参数的第二位置参数的值。距离值 是位置的第三值,并且它提供在这个案例中是距离参数的第三位置参数的值。将意识到:在 许多情形中,距离可以等价地被视为用于第二位置参数的第二值(即,第二位置参数可以被 视为距离量度或属性)。
[0089] 将意识到:在其他实施例中,可以使用其他参数来表示位置,例如,诸如 Euclidian (欧几里得)坐标系统中的三个坐标(例如,xyz值)或其他坐标系统中的坐标。
[0090] 位置接收机603耦合到匹配处理器605,而匹配处理器605进一步耦合到标称值存 储器607。标称值存储器607被安排成存储用于至少第二位置参数即在特定示例中用于或 距离或海拔高度的标称值。在系统初始化时,可以在标称值存储器607中存储预定的标称 值。例如,可以存储0°的仰角和1.5米的距离的标称值作为标称值。
[0091] 对于将要发送的每一个位置,匹配处理器605接收不同位置参数的值。具体地,匹 配处理器605可以接收位置的仰角和距离,这对应于接收位置的第二值。它随后着手将接 收的值与存储的标称位置值进行比较。匹配处理器605随后可以生成表明位置的当前值是 否与存储的标称值相匹配的匹配指示。这在这些值是足够类似的时候例如在所存储的值与 当前值之间的差的值低于阈值的时候可以视为是这种情况。将意识到:在其他的实施例中 可以使用其他的匹配标准。
[0092] 在特定示例中,匹配处理器605为海拔高度和距离的两个参数生成独立的匹配指 示,即,它可以为第二和第三位置参数生成独立的匹配指示。然而,将意识到:在其他的实施 例中,可以仅生成单个匹配指示。例如,在一些实施例中,一个参数例如海拔高度可以始终 被视为恒定的(即,系统可以被限制于只在水平面中提供二维位置)。在这样的案例中,只有 距离可以由匹配处理器605来考虑。在另外的实施例中,可以生成组合的匹配指示,例如, 二进制值可以表明:海拔高度和距离与标称值相匹配,或者它们之中至少一个与标称值不 匹配。
[0093] 匹配滤波器605耦合到接收(一个或多个)匹配指示的输出处理器609。输出处理 器609还耦合到位置接收机603并且它从这个位置接收机接收这些位置的值。此外,输出 处理器609耦合到音频接收机601,其中它从音频接收机接收音频数据。输出处理器609被 安排成生成被馈送至发射机611的输出数据信号/比特流,其中发射机611被安排成将由 此产生的输出数据信号发送至合适的接收机。
[0094] 发射机在该示例中可以例如经由无线通信链路、因特网或者实际上使用任何合适 的通信媒介来发送输出数据信号至远程接收机。在许多实施例中,输出数据可以作为能够 被发送至接收机的数据或比特流来生成。在其他的实施例中,输出数据信号/比特流可以 作为数据文件来存储并且作为数据文件来传送。例如,数据文件可以存储在合适的媒介诸 如存储卡、⑶等等上面。
[0095] 输出数据将包括从音频处理器601接收的音频数据。另外,它将包括允许接收机 恢复这些位置的位置数据。然而,输出处理器609着手提供动态可变的且选择性的位置的 表示而非只是包括表示这些位置的所有值的数据。具体地,输出处理器609被安排成省去 (leave out)-些位置参数并且仅在它认为必要的时候才包括这些位置参数。此外,输出处 理器609对于输出数据使用提供这样的不断变化数据的特别有效表示的数据结构,并且特 别地使用对于许多应用并且尤其在被应用于音频应用时导致极少开销的方案。
[0096] 特别地,当用于位置参数的匹配指示表明用于第二位置参数的第二值与标称值相 匹配时,输出数据被生成为不包括表示第二位置参数的任何数据。
[0097]具体地,如果用于第一位置的海拔高度值与标称的海拔高度值相同,则输出处理 器609着手在该数据中不包括指定用于第一位置的海拔高度值的任何数据。
[0098] 类似地,如果用于第一位置的距离值与标称值相同,则输出处理器609着手在数 据中不包括指定用于第一位置的距离值的任何数据。
[0099] 输出处理器609生成比特流,以包括多个个别字段。在该示例中,每一个字段可以 包含单个值。输出处理器609生成比特流以包括位置的一个、两个或三个(在三维位置的案 例中)值,并且可以相应地为每一个位置生成一个、两个或三个位置值字段。输出处理器609 为每一个位置生成至少一个数据字段。这个字段可以被标志为第一字段。第一字段可以是 比特流的任何字段。如果生成两个字段,则下一个字段可以被标志成第二字段。第二字段 可以是比特流之中除了用于第一字段之外的任何字段。如果生成三个字段,则下一个字段 可以被标志为第三字段。第三字段可以是比特流之中除了用于第一和第二字段之外的任何 字段。应意识到:这些标签并
不暗示这些字段在比特流中无论按时间还是按顺序的任何顺 序或排序,而只是为了清楚起见所使用的标签。
[0100] 在其中第二和第三位置参数值对应于标称值的情形中,第一数据字段用于运送用 于第一位置参数的第一值。因而,具体地,对于其中海拔高度和距离具有标称值的位置而 言,输出处理器609着手生成表示方位值的数据并将这个放置在为该位置生成的唯一数据 字段中,即放置在第一字段中。
[0101] 然而,如果针对第二和第三位置参数值之中任何一个的匹配指示不表明匹配,则 输出处理器609着手反而在第一字段中提供用于第一位置参数的无效位置值。因而,在其 中海拔高度和距离值之中的至少一个与所存储的标称值不匹配的情形中,输出处理器609 着手使用相同的数据字段但是不输入描述方位的实际值的数据,它着手输入第一位置参数 无法获得的值,即,它着手包括无效方位值。因而,在这个案例中,输出处理器609着手在第 一字段中包括表示用于第一位置参数的无效位置值的数据。
[0102] 作为示例,第一字段可以被指定成包含数字值。此外,可能已预先分配可能值的范 围给第一位置参数。例如,可能已定义:方位值必须位于[0; 360° ]的间隔中。在这个案 例中,输出处理器609可以接收位于[0; 360° ]的范围(或被转换至这个范围)中的方位 值。如果海拔高度和距离值对应于标称值,则输出处理器609着手在第一字段中包括所接 收的方位值。相应地,第一字段将包含在〇与360° (包括二者在内)之间的值。然而,如 果这些匹配指示之一表明这些值之一与存储的标称值不匹配,则输出处理器609着手在第 一字段中输入在[0; 360° ]的范围之外的值。
[0103] 该方案在许多情形中可以允许非常有效的位置的表示。例如,可能需要编码多个 位置。输出数据流可以由许多连续的数据字段组成,这些数据字段可以具有相同的大小并 且实际上可以被规定为相同的。例如,输出数据流可以包括由一系列相同的数据字段组成 的部分,其中每一个数据字段包含根据给定表示的单个数字值(例如,被表示为简单的二进 制值、被表示为浮点有理数等等)。
[0104] 在该系统中,可以利用输出处理器609来接收这些位置,并且只要海拔高度和距 离与标称值是相同的,输出处理器609就将着手仅仅将下一个位置的方位值放置于下一个 数据字段中。因而,生成一系列的将接收的位置表示成一串值的连续数据字段,其中每一个 值对应于一个位置来生成。换句话说,对于每一个位置,只生成第一字段,并且这个第一字 段包括表示第一值即用于第一位置参数的值(在特定示例中,方位值)的数据。因而,可以表 示这些位置而没有任何附加的开销,并且实际上对于每个位置,只传送单个字段中的单个 值。如果假设接收机具有标称值的信息,则它能够复原(reinstate)遗漏的海拔高度和距 离值,以便生成原始的三维位置。
[0105] 因而,只要所接收的位置具有与标称值相对应的海拔高度和距离值(即,第二位置 参数的第二值对应于标称值),就实现完整的三维位置的非常有效的表示。实际上,这能够 利用只有单个值的通信来实现并且实际上可以实现而无论如何不引入任何的开销。
[0106] 然而,尽管在这些值之中的一些值与标称值相匹配时实现这样的位置的有效通 信,但是该方案不限于对其而言这些值确实与标称值相匹配的位置的通信。相反,如果接收 到对其而言第二和第三位置参数(变量)之中的至少一个的值不对应于标称值的位置,则输 出处理器609在第一字段中插入无效值。这向接收机提供当前数据不表示位置的方位的清 楚指示,并因而通知接收机:它不能使用第一字段的数据来基于所存储的本地标称值生成 位置。它因而提供在这种情形中应该采取不同方案的清楚指示。因而,在正常操作下,对于 下一个位置,接收机将解码第一字段的数据。如果这是用于第一位置参数(例如,方位)的有 效值,它将知道:用于第二和第一位置参数(例如,海拔高度和距离)的值与标称值相同。它 因此不需要任何进一步的信息,并且能够着手生成完整的三维位置。然而,如果从第一字段 中解码的值不是用于第一位置的有效值,则它知道:第二和第三位置参数的值之中的至少 一个不具有标称值。因而,第一字段用于在一些案例中提供完整的三维位置,并且清楚地表 明何时它不提供这样的完整的三维位置。因而,利用第一字段中的数据来通知接收机:是否 它能够着手基于所存储的标称值来生成位置,或者是否不同的操作是必要的。
[0107] 在其中第一字段包含用于第一位置参数的无效位置值的情形中,输出处理器609 可以着手在无效值的传送之后跟随着描述该位置的数据(的通信)。这个数据可以在进一步 的数据字段中进行传送,即,对于当前位置而言,可以由输出处理器609在比特流中包括第 二、第三等等数据字段。例如,在无效的第一参数值(其表明:对于第二和第三位置参数之中 的至少一个,当前位置具有与标称值不同的值)的传送之后,输出处理器609可以着手发送 所有三个位置参数的所有三个值。这些值可以具体地被包括在可能全部具有与第一数据字 段相同的特性的三个后续的数据字段中。因而,可以提供第一、第二、第三和第四字段。
[0108] 例如,定义多个位置的数据流的区段(section)可以仅仅包括一系列相同的数据 字段,其中每一个数据字段能够包含单个值。这些字段将包含用于具有标称距离和海拔高 度值的位置的方位值。因而,一系列这样的位置能够简单地在后续的数据字段(其将相应地 是用于这些位置的第一数据字段)中利用单个值(方位值)来表示。当传送对于距离或海拔 高度而言不具有标称值的位置时,输出处理器609着手首先在数据字段(用于该位置的第 一数据字段)中引入无效方位值,并随后在此之后继之以三个数据字段,其中例如,下一个 数据字段(其可以被视为用于该位置的第二、第三或第四数据字段)包含方位值,下一个数 据字段(其也可以被视为用于该位置的第二、第三或第四数据字段)包含海拔高度值,并且 下一个数据字段(其也可以被视为用于该位置的第二、第三或第四数据字段)包含距离值。
[0109] 因而,接收机将首先接收方位值,并使用存储的标称值来生成相应的位置。然而, 当它检测到无效方位例如在[0; 360° ]的范围之外的方位时,它着手抛弃这个值,并且它 反而确定下一个位置具有利用跟随在后面的数据字段的值所给定的方位、利用下一个字段 的值所给定的海拔高度以及利用下一个数据字段的值所给定的距离。
[0110] 输出处理器609并且实际上接收机随后回复到正常操作,即,假设:下一个字段包 含对于海拔高度和距离而言具有标称值的位置的方位值,除非该值是无效方位值,而在这 种情况中,它着手抛弃该值并读取接下来的三个字段来获得该位置。
[0111] 该方案因而对于具有的分量/参数具有标称值的位置而言可以提供极其有效的 通信,而同时不将该方案限于这样的位置。相反,它可以允许传送任何的位置。实际上,在 该示例中,对于具有标称的海拔高度和距离值的位置来说,只需要包含一个值的一个数据 字段,而对于其他位置而言,只使用四个数据字段。这尤其在其中具有高比例的位置具有标 称值的应用中导致非常显著的总体数据减少。
[0112] 在音频应用中非常频繁地发现这样的特性。例如,大多数的声源被视为在水平面 中,即,通常具有零仰角,并且被视为位于预定距离。
[0113] 例如,HRTF滤波器通常与特定的(虚拟的)能够利用距最有效点/收听位置的方 位角、仰角和距离来指示的源位置相关联。通常,但不一定,距离对于集合中的所有HRTF配 对而言是相同的。此外,HRTF集合中的HRTF配对通常以有限数量的仰角来组织,其中每一 个仰角具有多个方位,并且实际上,相比于其他的值,对于零的仰角而言,通常具有更多的 HRTF配对。在这样的情形中,所描述的方案能够提供数据率的非常显著的降低,同时仍允许 传送所有的位置。特别地,该方案能够利用通常与HRTF配对的位置信息的传输相关联的高 度冗余,同时仍允许完全灵活性用于表示任何位置。
[0114] 将意识到:在一些实施例中,用于第一位置参数(在该示例中,方位值)的无效值可 以在所生成的数据流中仅被包括一次。例如,这些位置可以被安排,以致首先传送与用于第 二和第二位置参数的标称值相对应的所有位置。在已传送所有这些位置时,输出处理器609 可以在用于下一个位置的第一字段中发送无效的第一参数值,以表明:下一个位置并且实 际上从现在开始的所有位置对于第二和第三参数而言不具有标称值。因而,从那时起,输出 处理器609可以针对每一个位置发送三个字段,即,此后对于每个位置,可以提供用于每一 个位置参数的字段。
[0115] 具体地,对于固定的标称距离和0°的标称值,发射机可以首先传送所有的位置。 对于每一个位置,只使用一个数据字段来发送这些位置,即对于每个位置,只包括第一字 段。在这些位置之后,可以插入对于方位而言具有无效值的数据字段。其后,对于每一个位 置,使用三个数据字段来传送剩余位置,第一字段提供方位,第二字段提供海拔高度,而第 三位置提供距离。
[0116] 在以前示例中,无效位置值是位于针对第一位置参数定义的范围之外的位置,并 且具体地,它是位于所定义的[0; 360° ]的方位角的范围之外的值。将意识到:可以使用 其他的标准来确定位置值是有效的还是无效的位置值。并且,只要所使用的无效位置值是 不可以用于表示第一位置参数的值,用于确定某个值是否是有效的标准就不必与在将第一 位置参数表示为值时所应用的标准相同。
[0117] 例如,如果第一位置参数是方位值,那么可以使用无效位置值是在[-180; 360° ]的范围之外的值的标准。这样的标准能够用于将方位值表示成在[-180; 180° ]的 范围中的角度的系统和用于将方位值表示成在[0; 360° ]的范围中的角度的系统二者。 因而,同一有效性标准能够独立于这两个表示之中的哪一个用于表示方位值的有效值来使 用。
[0118]图7举例说明根据本发明的一些实施例的用于接收位置信息的接收机的示例。在 该示例中,接收机被安排成接收音频数据以及相关联的位置信息。
[0119]图7的设备包括接收机701,其接收包括多个字段的输入数据。具体地,接收机701 从图6的发射机接收数据信号。
[0120] 接收机耦合到数据提取器703,其中数据提取器703被安排成从所接收的输入数 据中提取数据。数据提取器703能够提取音频数据并将其馈送至音频处理器705,而音频处 理器705被安排成生成音频输出信号。音频处理器705可以例如包括合适的音频解码器。
[0121] 数据提取器703还被安排成提取包含位置信息的数据字段序列的数据值。
[0122] 数据提取器703耦合到接收所提取的值的有效性处理器707。有效性处理器707 被安排成检查所接收的值是否表示用于第一位置参数的有效位置值。因而,
具体地,它能够 检查:给定的接收值是否对应于有效的方位。因而,有效性处理器707能够生成表明当前值 是否是有效方位值的有效性指示。
[0123] 将意识到:任何合适的标准或方案能够用于确定某值是否是有效值。在特定示 例中,用于方位的值的有效范围被预定义,并且有效性处理器707能够仅检测:当前值是 否落入这个范围之内。例如,它能够仅检查:当前值是否在[0; 360° ](或例如,[-180; 360° ])的间隔之内。
[0124] 图7的接收机进一步包括位置处理器709,其耦合到数据提取器703和有效性处理 器707并且接收所提取的值和相应的有效性指示。位置处理器709进一步耦合到其中存储 用于第二和第三位置参数的标称值的标称值储存器711。因而,在特定示例中,存储标称的 距离和海拔高度值。这些值可以(例如,初始地)是预定的或预定义的值,诸如0°的海拔高 度和1.5米的距离。
[0125] 位置处理器709被安排成从所接收的位置数据中重新创建原始位置。它通过一次 处理数据字段来这样做。实际上,初始地,它可以检索下一个位置的第一字段的值。如果来 自有效性处理器707的有效性指示表明这是用于第一位置参数的有效值,例如,它是有效 方位值,那么位置处理器709着手生成对于第一位置参数具有这个值的位置值,例如,该位 置的方位值被设置成所接收的(有效)方位值。它随后着手将其他的位置参数设置成标称 值,例如,它可以将海拔高度值设置成0°的标称海拔高度值并将距离值设置成1. 5米的标 称距离之。随后输出三维值。
[0126] 位置处理器709可以着手以这种方式来处理数据字段,以生成输出位置。
[0127] 然而,如果用于某位置的第一字段包括这样的数据值,其中针对其的有效性指示 表明该值不是用于第一位置参数的有效值例如不是有效的方位值,那么位置处理器709着 手忽略该值作为用于第一位置参数的值例如作为方位值。相反,它着手评估其他的字段来 确定这些位置。
[0128] 实际上,在这个案例中,它可以着手从一个字段中提取第一位置参数的值,并从另 一个字段中提取用于第二位置参数的值,而且通常也从再一个字段中提取用于第三位置参 数的值。因而,第二、第三和第四数据字段能够用于提取位置值。
[0129] 作为特定示例,在包括无效方位值的数据字段的后面可以跟随着分别包括正确的 方位值、海拔高度值和距离值的三个数据字段(这些字段之中的任一字段可以被视为用于 该位置的第二、第三和第四数据字段)。因而,在这个案例中,位置处理器709从后续字段中 实际接收的数据值中生成该位置。
[0130] 因而,图7的接收机可以解码来自图6的发射机的数据,以便重新创建原始位置。 这可以在通常允许许多值利用单个值来传送的同时、在仍允许能够传送的位置的特性的完 全灵活性的同时来实现。此外,能够使用包括一系列可能相同的字段的非常简单的数据结 构。
[0131] 由此产生的位置和音频信号可以被馈送至能够渲染音频的渲染器。例如,渲染器 可以基于从所提供的位置中选择的HRTF滤波器来执行双耳渲染。具体地,这些位置可以表 明利用音频数据所表示的声源所希望的位置,并且渲染器可以执行渲染,以致声源被感知 成源自所希望的位置。
[0132] 在以前的示例中,标称值被视为预定的或预定义的值。然而,在许多实施例中,可 以有利地使得标称值是可变的。具体地,图6的发射机的输出处理器609和图7的接收机 的位置处理器709二者可以被安排成更新(一个或多个)标称值。
[0133] 具体地,当来自匹配处理器605的匹配指示表明用于第二位置参数的值与标称值 不匹配时,输出处理器609可以着手如所描述的那样在第一字段中插入用于第一位置参数 的无效值。它随后可以着手在第二字段中发送用于第二位置的值至接收机。然而,另外,它 可以将存储的用于第二参数的标称值设置成这个值。因而,以这种方式,用于第二参数的标 称值被更新,并且另外,新的值被传送至接收机。
[0134] 当位置处理器709检测到有效性指示表明在第一字段中接收的值不是用于第一 位置参数的有效值时,它着手提取第二数据字段的值。这个值将对应于用于第二位置参数 的新的标称值,并且位置处理器709将着手将这个值存储为标称值。
[0135] 发射机的输出处理器609随后可以着手再次使用同一标准方案来处理当前位置。 然而,在这个迭代中,匹配指示将表明第二位置参数的值与存储的标称值的值相匹配(因为 它在以前迭代中已被设置成这个值)。相应地,它将着手在下一个数据字段中插入第一位置 参数的值。当这个值由接收机接收时,位置处理器709将着手从这个数据字段中但是使用 更新的标称值来生成位置。因而,原始位置将由接收机来生成。
[0136] 如果用于第三参数的值与用于第三参数的标称值不匹配,则可以使用同一方案。
[0137] 该方案可以允许许多优点。实际上,能够实现非常有效的许多位置集合的通信。 具体地,对于其中一个位置参数在位置之间频繁地变化而其他的位置参数不改变的集合来 说,能够非常有效地传送这样的集合。例如,缓慢变化的位置参数能够被设置成给定的标称 值,并且对于这个标称值,有可能通过只传送单个值,随后能够传送所有的位置。该标称值 随后可以被更新,并且随后可以传送针对新近更新的标称值的所有位置,等等。
[0138] 另外,该方案虑及低复杂度的方案。实际上,第一位置参数的所有值利用同一处理 来发送并利用同一处理来接收。这个处理不需要考虑任何其他的值。相反,该系统仅仅引 入导致标称值的更新的两个附加的数据字段。例如,接收机可以仅仅接收数据字段并按照 这个数据字段的值和存储的标称值来生成位置,其中唯一的例外是:偶尔提供特殊的无效 值来表明:该处理应该临时被中断,以接收在跟随在后面的数据字段中提供的新更新的标 称值。
[0139] 在其中具有多个利用标称值的位置参数的案例中,可以选择在数据字段中插入以 表明不同的值跟随在后面的无效值,以提供该数据涉及多个位置参数之中的哪一个位置参 数的指示。
[0140]例如,如果利用三个位置参数来给定位置,其中标称值用于第二和第三位置参数, 则用于第一位置参数的无效值可以表明:跟随在后面的值是用于第二位置参数还是用于第 三位置参数的新值。这可以提供有效的方案,并且在如何替换和/或更新标称值的方面提 供更多的灵活性,而且通常能够在不增加数据率的情况下实现。
[0141] 作为示例,在其中每一个位置利用方位、海拔高度和距离来给定的情形中,例如, 该系统可以利用发射机和接收机二者已知的预定的标称海拔高度和标称距离诸如0°的海 拔高度和1. 5米的距离来开始。例如,这些位置可以是用于与HRTF双耳处理一起使用的声 源位置。
[0142] 发射机随后可以通过传送针对其而言海拔高度为0°并且距离为1. 5米的所有位 置来开始。这些位置仅仅利用一系列的方位值来传送,其中每一个新值表示由接收机通过 插入所存储的用于海拔高度和距离的标称值来恢复的完整的三维位置。
[0143] 当已传送所有这些位置时,下一个位置将具有不同的海拔高度或距离。例如,发射 机可以着手传送具有10°海拔高度的许多位置。发射机仅仅通过插入为无效方位值(例如, 值"510")的值(在其后面跟随着表示新的海拔高度(即,表示"10° ")的值)来这样做。接 收机检测到无效方位值并且这表明下一个值是用于海拔高度参数的新的标称值。它随后读 取下一个值并且存储这个值作为海拔高度参数的标称值。发射机随后着手传送具有10°海 拔高度的位置的方位。
[0144] 如果距离值将要改变的话,发射机可以仅插入另一无效方位值(例如,值"511")来 表明:下一个值是距离值。在检测到这个值时,接收机将读取下一个值并且随后着手存储这 个值作为距离的标称值。
[0145] 因而,实现位置的非常有效的通信。实际上,除了偶尔针对或海拔高度或距离发送 新的标称值之外,仅仅发送方位值。发射机能够对于每一个方位值使用完全相同的方案,并 且只需要在需要改变海拔高度或距离的标称值时才添加额外的操作。该方案可以特别地在 相对于定位保持完全灵活性的同时利用通常受限的仰角和距离的可变性。
[0146] 在一些实施例中,用于第一位置参数诸如方位的无效值可以用于提供预定位置集 合的指示。响应于检测到无效的第一位置参数值的特定值,位置处理器709可以着手提取 位置处理器709已经知道的位置集合。
[0147]例如,发射机和接收机可以提前商定位置集合以及第一位置参数的相关联值。例 如,经由以前的数据交换或仅仅经由通用规范,可以商定在方位值具有特定值时应该提取 的特定位置集合。例如,"508"的值可以用于表明:应由接收机生成与标准5. 1扬声器配置 相对应的位置。
[0148] 作为另一示例,无效方位值的值可以表明:跟随在后面的数据字段将包含从多个 位置集合中选择一个位置集合的值。
[0149] 下面显示用于这样的数据的可能语法的非常特定的示例。
[0150]在一些实施例中,无效值可以表明:跟随在其后面的第二字段包括表明位置配对 之间的相对差的数据。例如,无效值可以表明:下一个数据字段包括位置之间的角度差。输 出处理器609随后可以着手生成全部具有给定值的方位差以及对应于标称值的海拔高度 和距离的位置的集合。在一些实施例中,该数据也可以包括偏移的指示,而在其他的实施例 中,对于第一值,可以假设默认偏移。
[0151]作为示例,比方说,如果无效值是"509",则这可以表明:跟随在后面的数据字段 将包括方位角差的指示。比方说,如果下一数据包括"20° "的值,那么位置处理器709可以 着手生成与用于海拔高度和距离的标称值相对应且具有0°、1〇°、20°、30°、……、340° 的方位的位置。
[0152]作为特定示例,以下语法可以用于利用图6的发射机所生成的比特流:
[0153] 在上面示例中,比特流元素bsPosVal对应于第一字段并且包含或方位角或表明 需要不同处理的无效方位值。在发送510的方位代码值时,后续的比特流元素bsElevation 对应于第二字段并且包含海拔高度的更新值。同一程序对于使用代码值511的距离和在这 个案例中对应于第二字段的比特流元素bsDistance适用(hold)。
[0154] 该语法通过描述一系列的利用间隔角度(spacing angle) (bsAziSpacing)等距 间隔开的方位角以及连续配对的数量(bsNumSpaced)也允许进一步优化。如果使用该语法 的话,位于2米距离和0°海拔高度上的72个扬声器的网格(grid)能够利用以下序列的 值来描述。
[0155] 这些值具体地表明在2米距离和0°海拔高度上具有5°间隔
的72个扬声器的网 格。
[0156] 具体地,比特流在这个示例中利用表明所提供的位置的数量的字段 bsNumPositions开始。该字段包含根据该语法表明正利用该比特流定义72个扬声器的位 置的数字72。随后,跟随着第一数据字段,即,可以为新位置提供数据的字段。根据该语法, 这个字段相应地提供bsPosVal数据。
[0157] 在目前案例中,该字段包含值511,即bsPosVal=511。这是无效的方位值并因而表 明:正在提供其他的数据,并且应该采取不同的方案而不是只将该数据用作方位值。如该语 法中所示的,bsPosVal=511表明:正在提供新的距离。特别地,它表明:下一个字段(对应于 第二字段)包括值bsDistance,其是用于距离的标称值。在目前案例中,下一个字段包含值 200,其对应于被设置成200厘米即2米的标称距离bsDistance。
[0158] 下一个字段是第一字段并包含值bsPosVal=-175。这个值是有效的方位值并且不 是保留值之一。相应地,用于下一个位置P (在这个案例中P=〇,因为它是第一位置)的方位 值被设置成这个值azimuth[p]=bSP〇SVal。另外,海拔高度和距离被设置成其标称值:
[0159] 因而,由于标称距离正好被设置成2米,所以用于该位置的距离被设置成2米。
[0160] 随后,跟随着新的第一字段。在这个案例中,该字段包含值509,即bsPosVal=509。 这是用于方位的无效值并因而表明:正在提供其他的数据,并且应采取不同的方案而不是 只将该数据用作方位值。如该语法中所示的,bsP 〇sVal=509表明:正在提供等距间隔开 的扬声器的集合的位置。特别地,它表明:下一个字段包括值bsAziSpacing,并且下一个 字段包括值bsNumSpaced。下一个字段包含值5,并且跟随在后面的字段包含值71,即, bsAziSpacing=5和bsNumSpaced=71。这表明:提供71个位置,其中每一个位置之间的方位 差是5°。这些位置被给定为:
即,每一个位置被给予标称的海拔高度和距离并且与以前的位置偏移5°。利用被设置 成具有-175°方位的以前位置来启动循环。因而,提供在2米距离和0°海拔高度上具有 5°间隔的72个扬声器的网格。
[0161] 将意识到:为了简洁起见,上面的描述参考不同的功能电路、单元和处理器描述了 本发明的实施例。然而,可以使用在不同的功能电路、单元或处理器之间功能的任何合适的 分布而不偏离本发明,这将是显而易见的。例如,被举例说明为利用单独的处理器或控制器 执行的功能可以利用相同的处理器或控制器来执行。因此,对于特定的功能单元或电路的 引用将仅被视为对于用于提供所描述的功能的合适装置的引用而非表明严格的逻辑或物 理结构或组织。
[0162] 本发明能够采用包括硬件、软件、固件或这些的任何组合的任何合适的形式来实 施。本发明可以选择地至少部分地作为在一个或多个数据处理器和/或数字信号处理器上 运行的计算机软件来实施。本发明的实施例的元素和组件可以物理地、功能地和逻辑地采 用任何合适的方式来实施。实际上,功能可以在单个单元中、在多个单元中或作为其他功能 单元的部分来实施。就此而论,本发明可以在单个单元中或可以物理地和功能地分布在不 同的单元、电路和处理器之间。
[0163] 虽然结合一些实施例描述了本发明,但是并不打算将本发明限于在本文陈述的特 定形式。相反,本发明的范围仅利用所附的权利要求书来限制。附加地,虽然某个特征可能 看起来结合特殊的实施例来描述,但是本领域技术人员将认识到:所描述的实施例的各种 各样的特征可以根据本发明来组合。在权利要求书中,术语包括并不排除其他元素或步骤 的存在。
[0164] 此外,虽然个别地列出,但是多个装置、元素、电路或方法步骤可以利用例如单个 电路、单元或处理器来实施。附加地,虽然个别特征可以被包括在不同的权利要求中,但是 这些特征或许可以有利地进行组合,并且在不同权利要求中的包括并不意味着:特征的组 合不是可行的和/或有益的。特征在一种类别的权利要求中的包括也并不意味着对于这种 类别的限制,而是表明该特征同样酌情可应用于其他的权利要求类别。此外,特征在这些权 利要求中的顺序并不意味着这些特征必须据此工作的任何特定顺序,并且特别地,个别步 骤在方法权利要求中的顺序并不意味着必须按照这个顺序来执行这些步骤。相反,这些步 骤可以按照任何合适的顺序来执行。另外,单数引用并不排除多个。因而,对于"一"、"一 个"、"第一"、"第二"等等的引用并不排除多个。这些权利要求中的参考符号仅仅作为澄清 示例来提供,而不应被解释为以任何方式来限制这些权利要求的范围。
【主权项】
1. 一种用于传送位置的设备,所述设备包括: 用于接收位置的接收机(603),所述位置具有至少第一值和第二值,第一值表示第一位 置参数,并且第二值表示第二位置参数; 匹配电路(605),用于确定第二值是否与用于第二位置参数的标称值相匹配; 用于生成输出数据的输出电路(609),所述输出电路(609)被安排成: 当第二值与标称值相匹配时,在所述输出数据的第一字段中包括表示第一值的第一数 据,但是在所述输出数据中不包括表示第二值的数据;以及 当第二值与标称值不匹配时,在第一字段中包括第二数据,第二数据表示用于第一位 置参数的无效位置值。2. 根据权利要求1所述的设备,其中所述输出电路(609)被安排成:当第二值与标称值 不匹配时,在所述输出数据的第二字段中包括表示第二值的数据。3. 根据权利要求1所述的设备,其中所述输出电路(609)被安排成:当第二值与标称值 不匹配时,将标称值设置成第二值。4. 根据权利要求1或2所述的设备,其中所述输出电路(609)被安排成:当第二值与标 称值不匹配时,在所述输出数据的第三字段中包括表示第一值的数据。5. -种用于接收利用至少第一值和第二值给定的位置的设备,第一值表示第一位置参 数,并且第二值表示第二位置参数,所述设备包括: 接收机(701),用于接收包括多个数据字段的输入数据; 数据提取器(703),用于从多个数据字段之中的第一字段中提取第一数据; 有效性电路(707),用于确定第一数据是否表示用于第一位置参数的有效位置值; 位置电路(709 ),用于确定所述位置,所述位置处理器(709 )被安排成: 当第一数据表示有效位置值时,将第一值确定为有效位置值,并将第二值确定为用于 第二位置参数的标称值;以及 当第一数据不表示有效位置值时,从所述输入数据的第二字段中确定第二值。6. 根据权利要求5所述的设备,其中所述位置电路(709)被安排成:当第一数据不表示 有效位置值时,将标称值设置成第二值。7. 根据权利要求5所述的设备,其中第一数据表明在所述输出数据的第二字段中提供 的数据的类型。8. 根据权利要求5所述的设备,其中当第一数据不表示有效位置值时,第一数据表明: 第二字段包括预定位置集合的指示;以及所述位置处理器被安排成确定至少第一值,以响 应所述预定位置集合。9. 根据权利要求5所述的设备,其中所述位置进一步利用表示第三位置参数的第三值 来给定,以及当第一数据不表示有效位置值时,第一数据表明第二字段包括用于第二位置 参数的位置值还是用于第三位置参数的位置值。10. 根据权利要求5所述的设备,其中当第一数据不表示有效位置值时,第一数据表 明:第二字段包括表明至少三个位置的配对之间的相对差的数据;以及所述位置处理器被 安排成:确定至少第一值,以响应至少三个位置的配对之间的相对差。11. 根据权利要求5所述的设备,其中第一位置参数与可能值的范围相关联,并且无效 位置值是在所述范围之外的值。12. 根据权利要求5所述的设备,其中第二位置参数是距离参数和海拔高度参数之一。13. 根据权利要求1所述的设备,其中所述位置是以下之中的至少一个: 扬声器位置; 声源位置;和 用于头部相关的传递函数的虚拟声源位置。14. 一种传送位置的方法,所述方法包括: 接收位置,所述位置具有至少第一值和第二值,第一值表示第一位置参数,并且第二值 表示第二位置参数; 确定第二值是否与用于第二位置参数的标称值相匹配; 生成输出数据; 其中生成输出数据包括: 当第二值与标称值相匹配时,在所述输出数据的第一字段中包括表示第一值的第一数 据,但是在所述输出数据中不包括表示第二值的数据;以及 当第二值与标称值不匹配时,在第一字段中包括第二数据,第二数据表示用于第一位 置参数的无效位置值。15. -种接收利用至少第一值和第二值给定的位置的方法,第一值表示第一位置参数, 并且第二值表示第二位置参数,所述方法包括: 接收包括多个数据字段的输入数据; 从多个数据字段之中的第一字段中提取第一数据; 确定第一数据是否表示用于第一位置参数的有效位置值; 确定所述位置; 其中确定所述位置包括: 当第一数据表示有效位置值时,将第一值确定为有效位置值,并且将第二值确定为用 于第二位置参数的标称值;以及 当第一数据不表示有效位置值时,从所述输入数据的第二字段中确定第二值。16. -种比特流,其包括利用至少第一值和第二值给定的位置的表示,第一值表示第一 位置参数,并且第二值表示第二位置参数,所述比特流包括第一数据字段,第一数据字段包 括表示以下之中任一的数据: 第一值;或 用于第一位置参数的无效位置值;以及 如果第一数据字段包括无效位置值,所述数据信号只包括表示第二值的数据。17. -种计算机程序产品,其包括被适配成当所述程序在计算机上运行时执行权利要 求14或15的所有步骤的计算机程序代码。
【专利摘要】接收机(603)接收利用表示第一位置参数的第一值和表示第二位置参数的第二值所给定的位置。匹配电路(605)确定第二值是否与标称值相匹配。如果是这样的话,输出电路(609)生成输出数据,其中在输出数据的字段中包括表示第一值的数据但是在输出数据中不包括表示第二值的数据。否则,输出电路(609)在该字段中包括表示用于第一位置参数的无效位置值的数据。接收机确定数据字段的数据是否表示用于第一位置参数的有效位置值。如果是这样的话,它确定其中第一值是有效位置值并且第二值是用于第二位置参数的标称值的位置。否则,它从输入数据的第二字段中确定第二值。
【IPC分类】G10L19/002, H04S3/00, G10L19/20, G10L19/008
【公开号】CN104903955
【申请号】CN201480004797
【发明人】J.G.H.科科彭斯, A.W.J.奥奥门, E.G.P.舒杰斯
【申请人】皇家飞利浦有限公司
【公开日】2015年9月9日
【申请日】2014年1月8日
【公告号】EP2943952A1, US20150340043, WO2014108834A1