用于视频译码扩展的时间运动向量预测的制作方法
【专利说明】用于视频语码扩展的时间运动向量预测
[0001] 本申请案主张2013年1月2日申请的美国临时申请案第61/748,424号的权利, 所述申请案的全部内容在此W引用的方式并入本文中。
技术领域
[0002] 本发明设及视频译码。
【背景技术】
[0003] 数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广 播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相 机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电 电话、所谓的"智能电话"、视频电话会议装置、视频流装置及其类似者。数字视频装置实施 视频写码技术,例如由MPEG-2、MPEG-4、ITU-TH. 263 或口U-TH. 264/MPEG-4 第 10 部分高 级视频译码(AVC)所定义的标准、目前正在开发的高效率视频译码(肥VC)标准及该些标准 的扩展中所描述的视频译码技术。视频装置可通过实施此类视频译码技术而更有效率地发 射、接收、编码、解码及/或存储数字视频信息。
[0004] 视频译码技术包含空间(图片内)预测及/或时间(图片间)预测W减少或去除 视频序列中固有的冗余。对于基于块的视频译码,视频切片(即,视频帖或视频帖的一部 分)可分割成视频块,所述视频块还可被称作树块、译码单元(CU)和/或译码节点。使用 相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帖内译码(I)切片中的 视频块进行编码。图片的经帖间译码(P或B)切片中的视频块可使用关于同一图片中的相 邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称 为帖,且参考图片可被称为参考帖。
[0005] 空间或时间预测产生用于待译码块的预测性块。残余数据表示待译码原始块与预 测性块之间的像素差。经帖间译码块是根据指向形成预测性块的参考样本块的运动向量及 指示经译码块与预测性块之间的差的残余数据编码的。经帖内译码块是根据帖内译码模式 及残余数据编码的。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余 变换系数,接着可W将残余变换系量化。可扫描最初布置成二维阵列的经量化变换系数,W 便产生变换系数的一维向量,且可应用滴译码W实现更多压缩。
【发明内容】
[0006] 一般来说,本发明描述用于在视频译码中使用运动向量预测对运动向量进行译码 的技术。视频译码包含对图片的个别区块进行译码(例如,编码或逻辑)。可对此类块进 行空间预测和译码、时间预测和译码,或层间或视图间预测和译码。时间和层间及/视图间 预测技术可利用运动向量。另外,视频译码器可经配置W译码运动向量。根据本发明的技 术,视频译码器可经配置W在执行时间运动向量预测时确定用于合并模式的候选运动向量 预测子的参考索引(其中候选运动向量预测子可指代视图间参考图片),且也经组态W确 定额外参考索引的值。例如,在针对块执行运动向量的合并模式译码时,可将额外参考索引 替代为候选运动向量预测子的实际参考索引。此外,可将额外参考索引值设定为预定值,例 如0或-1。一般来说,额外参考索引可指代长期参考图片,例如用于包含块的当前图片的视 图间参考图片。
[0007] 在一个实例中,译码视频数据的方法包含:确定第一目标参考索引,其表示当前运 动向量的候选运动向量预测子所指代的参考图片;针对候选运动向量预测子并在当前运动 向量的时间运动向量预测(TMV巧期间,确定等于预定值的额外目标参考索引值;及至少部 分地基于额外参考索引值对当前运动向量进行译码。
[000引在另一实例中,用于译码视频数据的装置包含视频译码器,其经配置W进行W下 操作;确定第一目标参考索引,所述第一目标参考索引表示当前运动向量的候选运动向量 预测子所指代的参考图片;针对候选运动向量预测子并在当前运动向量的时间运动向量预 测(TMV巧期间,确定额外目标参考索引值,其等于预定值;及至少部分地基于额外参考索 引值对当前运动向量进行译码。
[0009] 在另一个实例中,用于译码视频数据的装置包含;用于确定第一目标参考索引的 装置,所述第一目标参考索引表示当前运动向量的候选运动向量预测子所指代的参考图 片;用于针对候选运动向量预测子并在当前运动向量的时间运动向量预测(TMV巧期间确 定等于预定值的额外目标参考索引值的装置;及用于至少部分地基于额外参考索引值对当 前运动向量进行译码的装置。
[0010] 在另一个实例,计算机可读存储媒体在其上存储有在执行时使处理器进行W下操 作的指令:确定第一目标参考索引,其表示当前运动向量的候选运动向量预测子所指代的 参考图片;针对候选运动向量预测子并在当前运动向量的时间运动向量预测(TMV巧期间, 确定额外目标参考索引值,其等于预定值;及至少部分地基于额外参考索引值对当前运动 向量进行译码。
[0011] 在随附图式及W下描述中阐述一或多个实例的细节。其它特征、目标和优点将从 所述描述和图式W及权利要求书而显而易见。
【附图说明】
[0012] 图1是说明可利用用于译码运动向量的技术的实例视频编码及解码系统的框图。
[0013] 图2是说明可实施用于译码运动向量的技术的视频编码器的实例的框图。
[0014] 图3是说明可实施用于译码波前的技术的视频解码器的实例的框图。
[001引图4为说明实例多视图视频译码(MVC)预测模式的概念图。
[0016] 图5为说明用于译码图片块的实例图片集合和运动向量的概念图。
[0017] 图6为说明用于译码图片块的实例图片集合和运动向量的概念图。
[0018] 图7是说明根据本发明的技术的对视频数据块进行编码的实例方法的流程图。
[0019] 图8是说明根据本发明的技术的对视频数据块进行解码的实例方法的流程图。
【具体实施方式】
[0020] 一般来说,本发明描述可改进用于视频编码器/解码器(编解码器)扩展(例如, 多视图或可分级扩展)的时间运动向量预测同时使二维(2D)基层/视图解码性能保持不 变的技术。基本视频译码标准可包含(例如)高效视频译码(肥VC),且对肥VC的扩展可包 含对肥VC的多视图视频译码扩展(例如,MV-肥VC)及对肥VC的可分级视频译码扩展(例 如,甜VC)。
[002U 视频译码标准包含口U-TH. 261、ISO/IECMPEG-lVisual、口U-T比 262 或ISO/ IECMPEG-2Visual、ITU-TH. 263、IS0/IECMPEG-4Visual及口U-TH. 264(也被称为ISO/IECMPEG-4AVC),包含其可分级视频译码(SVC)及多视图视频译码(MVC)扩展。另外,存在 一种新的视频译码标准,即高效率视频译码(肥VC),其正由口U-T视频译码专家组(VCEG) 及IS0/IEC运动图片专家组(M阳G)的视频译码联合合作小组(JCT-VC)进行开发。后文 中被称为"肥VCWD9"或仅被称为"WD9"的肥VC的工作草案(WD)描述于2012年10月 10-19 日中国上海的第 11 次会议(JCTVC-K1003_vl3)的Bross等人的"HighEfficiency VideoCoding(肥VC)TextSpecificationDraft9"中,自 2013 年 1月 2 日起,该工作草 案可从http://phenix.int-evry.fr/jct/doc_end_user/documents/ll_Shanghai/wgll/ JCTVC-K1003-V13.zip获得。
[0022] 本发明描述如下文中参考图5及6在JCTVC-K0239中更详细描述的某些技术。已 确定JCTVC-K0239的提议还有更大的改进余地。举例来说,用于JCTVC-K0239的时间运动 预测的额外参考索引的导出过程可导致对于2D视频编码不必要的某种额外逻辑。为支持 如同在肥VC及MV-肥VC的变化最小的JCTVC-K0239中一样的解决方案,本发明描述各种技 术。
[0023] 举例来说,用于时间运动向量预测(TMVP)的额外参考索引值(即refIdxLOA及 refldxLlA)可W肥VC基本规范定义并始终设定为0。或者,refIdxLOA及/或refldxLlA 可设定为-1。refldxLOA表示索引到参考图片列表0 (例如,具有先于当前图片的显示顺序 的参考图片列表)的实例,而refldxLlA表示索引到参考图片列表1 (例如,具有迟于当前 图片的显示顺序的参考图片列表)的实例。
[0024] 另外或在替代方案中,用于TMVPbefldxLOA/refldxLlA)的额外目标参考索 引值的导出过程可仅定义于MV-HEVC或其它肥VC扩展中。或者,额外目标参考索引值 (refldxLOA/refldxLlA)可仅在MV-HEVC或其它肥VC扩展的切片标头中发信,例如在 layer_id(或viewldx)不等于0的条件下或作为切片标头扩展的部分。或者,额外目标参 考索引值(refIdxLOA/refIdxLlA)可在HVEC规范或肥VC扩展的图片参数集、序列参数集 或视频参数集中发信。或者,额外目标参考索引值(refIdxLOA/refIdxLlA)可在肥VC基本 规范的切片标头中发信。
[0025] 另外或在替代方案中,当将额外目标参考索引值发信为不等于0的值时,其可对 应于具有与由参考索引0所识别的参考图片的类型不同的类型的参考图片。举例来说, re巧icListX[0]及re巧icListX[refIdxLXA]可不受限制W便所述两者不为短期图片且所 述两者不为长期图片。
[0026] 图1是说明可利用用于译码运动向量的技术的实例视频编码及解码系统10的框 图。如图1中所展示,系统10包含源装置12,其提供待在稍后时间由目的地装置14解码 的经编码视频数据。具体地说,源装置12经由计算机可读媒体16将视频数据提供到目的 地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计 算机、笔记型(亦即,膝上型)计算机、平板计算机、机顶盒、例如所谓的"智能"电话的电话 手机、平板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频串流装置或类似 者。在一些情况下,可装备源装置12和目的地装置14W用于无线通信。
[0027]目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机 可读媒体16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的任一类 型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体W使源装置12能够 实时地将经编码的视频数据直接发射到目的地装置14。可根据通信标准(例如,无线通信 协定)调制经编码的视频数据,并将其发射到目的地装置14。通信媒体可包括任何无线或 有线通信媒体,例如射频(R巧频谱或一或多个实体发射线。通信媒体可形成分组网络(例 如,局域网、广域网或例如因特网的全球网络)的部分。通信媒体可包含路由器、交换器、基 站或任何其它可W用于促进从源装置12到目的地装置14的通信的设备。
[002引在一些实例中,经编码数据可W从输出接口 22输出到存储装置。类似地,可W通 过输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取式数据 存储媒体中的任一者,例如硬盘驱动器、藍光光盘、DVD、CD-ROM、快闪存储器、易失性或非易 失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中, 存储装置可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装 置。目的地装置14可从存储装置经由流式传输或下载来存取所存储的视频数据。文件服 务器可为能够存储经编码视频数据且将经编码视频数据发射到目的装置14的任何类型的 服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储 (NA巧装置或本地磁盘驱动器。目的地装置14可W通过任何标准数据连接(包含因特网连 接)来存取经编码的视频数据。此可包含适合于存取存储于文件服务器上的经编码的视频 数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,D化、电缆调制解调器等)或两者的 组合。经编码的视频数据从存储装置的发射可能是流式发射、下载发射或两者的组合。
[0029] 本发明的技术不一定限于无线应用或设定。所述技术可W应用于支持多种多媒体 应用中的任一者的视频译码,所述多媒体应用例如空中协议电视广播、有线电视发射、卫星 电视发射、因特网流式视频发射(例如,动态自适应HTTP流式传输值ASH))、经编码到数据 存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实 例中,系统10可经配置W支持单向或双向视频发射,W支持例如视频流式传输、视频重放、 视频广播及/或视频电话的应用。
[0030] 在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口 22。目的 地装置14包含输入接口 28、视频解码器30和显示装置32。根据本发明,源装置12的视频 编码器20可经配置W应用用于译码运动向量的技术。在其它实例中,源装置和目的地装置 可包含其它组件或布置。举例来说,源装置12可W从外部视频源18(例如外部相机)接收 视频数据。同样地,目的地装置14可W与外部显示装置介接,而不是包含集成显示装置。
[0031] 图1的所说明系统10只是一个实例。可W由任何数字视频编码和/或解码装置 来执行用于译码运动向量的技术。尽管本发明的技术一般通过视频编码装置来执行,但是 所述技术还可通过视频编码器/解码器(通常被称作"编码解码器")来执行。此外,本发 明的技术还可通过视频预处理器执行。源装置12及目的地装置14仅为源装置12产生经 译码视频数据用于发射至目的地装置14的所述译码装置的实例。在一些实例中,装置12、 14可W实质上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因 此,系统10可支持视频装置12、14之间的单向或双向视频发射w例如用于视频流式传输、 视频回放、视频广播或视频电话。
[0032] 源装置12的视频源18可包含视频俘获装置,例如相机、含有先前所俘获视频的视 频档案和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频 源18可产生基于计算机图形的数据作为源视频,或实况视频、所存档视频与计算机产生的 视频的组合。在一些情况下,如果视频源18为视频摄像机,那么源装置12及目的地装置14 可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上 适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,俘获、预先俘获或计算 机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出介面22输出到计算 机可读媒体16上。
[0033] 计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或存储媒体 (也就是说,非暂时存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、藍光光盘 或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可W从源装置12接收经编 码视频数据,并且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体 生产设施(例如光盘冲压设施)的计算装置可W从源装置12接收经编码的视频数据并且 生产容纳经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可W理解为 包含各种形式的一或多个计算机可读媒体。
[0034]目的地装置14的输入接口 28从计算机可读媒体16接收信息。计算机可读媒体 16的信息可包含由视频编码器20定义之语法信息,其亦由视频解码器30使用,其包含描述 区块及其它经译码单元(例如,GCP)之特性和/或处理的语法元素。显示装置32将经解 码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶 显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
[0035] 视频编码器20及视频解码器30可W根据视频译码标准(例如,目前正在开发的 高效率视频译码(肥VC)标准)操作,并且可W符合肥VC测试模型(HM)。或者,视频编码器 20和视频解码器30可W根据其它专有或业界标准操作,所述标准例如口U-TH. 264标准, 或者被称作MPEG-4第10部分高级视频译码(AVC),或此类标准的扩展。然而,本发明的技 术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和口U-TH. 263。尽管 图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解 码器集成,且可包含适当MUX-DEMW(单元或其它硬件及软件,W处置共同数据流或单独数 据流中的音频及视频两者的编码。若适用,则MUX-DEMUX单元可符合ITUH. 223复用器协 议或其它协议(例如,用户数据报协议扣D巧)。
[0036]ITU-T比264/MPEG-4(AVC)标准是作为被称为联合视频小组(JVT)的集体联盟的 产品而由口U-T视频译码专家组(VCEG)连同ISO/IEC运动图片专家组(MPEG)制定。在一 些方面中,本发明中所描述的技术可应用于通常符合H. 264标准的装置。ITU-T研究组在 2005年3月在ITU-T推荐H. 264 "用于通用音视频服务的高级视频译码(AdvancedVideo Codingforgenericaudiovisualservices)"中描述了H. 264 标准,其在本文中可被称作 比264标准或H. 264规范或H. 264/AVC标准或规范。联合视频小组(JVT)持续致力于扩展 比 264/M阳G-4AVC。
[0037] 视频编码器20及视频解码器30各自可实施为多种合适的编码器电路中的任一 者,例如一或多个微处理器、数字信号处理器值SP)、专用集成电路(ASIC)、现场可编程口 阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地W软件实施所述技术时, 装置可将用于所述软件的指令存储于合适的非暂时计算机可读媒体中且使用一或多个处 理器W硬件执行所述指令W执行本发明的技术。视频编码器20和视频解码器30中的每一 者可W包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可W集成为相 应装置中的组合编码器/解码器(编解码器)的一部分。
[0038] JCT-VC正在致力于开发肥VC标准。肥VC标准化努力是基于被称作肥VC测试模 型(HM)的视频译码装置的演进模型。歷假设视频译码装置根据例如ITU-TH.264/AVC相 对于现存装置的几个额外能力。举例来说,虽然H. 264提供了九种帖内预测编码模式,但HM 可提供多达=十立种帖内预测编码模式。
[0039] 一般来说,HM的工作模型描述视频帖或图片可W划分成包含明度及色度样本两者 的序列树块或最大译码单元(LCU)(还被称作"译码树单元")。位流内的语法数据可W界 定最大译码单位(LCU,其是就像素数目来说的最大译码单位)的大小。切片包含译码次序 的多个连续树块。视频帖或图片可W被分割成一或多个切片。每一树块可W根据四叉树而 分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU-个节点,其中一个根节点 对应于所述树块。如果CU分裂成4个子CU,那么对应于CU的节点包含四个叶节点,所述叶 节点中的每一者对应于所述子CU中的一者。
[0040] 四叉树数据结构的每一节点可W提供用于相对应的CU的语法数据。举例来说,四 叉树中的节点可包含分裂旗标,其表明对应于所述节点的所述CU是否分裂成子CU。用于CU 的语法元素可W递归式定义,且可W取决于CU是否分裂成子CU。如果CU不进一步分裂,那 么将其称为叶CU。在本发明中,叶CU的子CU也将被称作叶CU,即使不存在原始叶CU的明 确分裂时也是如此。举例来说,如果16X16大小的CU不进一步分裂,那么该四个8X8子 CU将也被称作叶CU,虽然16X16CU从未分裂。
[0041] CU具有类似于H. 264标准的宏块的用途,但是CU并不具有大小区别。举例来说, 树块可W分裂成四个子节点(还称为子CU),并且每一子节点又可W是父节点并且可W分 裂成另外四个子节点。最后的未经分裂子节点(被称作四叉树的叶节点)包括译码节点, 还被称作叶CU。与经译码位流相关联的语法数据可W定义树块可W分裂的最大次数(被称 作最大CU深度),并且还可定义译码节点的最小大小。所W,比特留还可定义最小译码单元 (SCU)。本发明使用术语"块"指代CU、PU或TU中的任一者(在肥VC的情况下)或类似数 据结构(在其它标准的情况下)(例如,在H. 264/AVC中的宏块及其子块)。
[0042] CU包含译码节点及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU 的大小对应于译码节点的大小且形状必须是正方形。CU的大小可W在从8X8像素直到具 有最大64X64像素或更大的树块的大小的范围内。每一CU可含有一或多个PU及一或多 个TU。举例来说,与CU相关联的语法数据可描述CU到一或多个PU的分割。划分模式可 W在CU被跳过或经直接模式编码、帖内预测模式编码或帖间预测模式编码之间有区别。PU 可分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据四叉树分割 成一或多个TU。TU可W是正方形或非正方形(例如,矩形)形状。
[0043] 肥VC标准允许根据TU变换,TU可针对不同CU而有所不同。TU的大小通常是基 于针对经分割LCU定义的给定CU内的PU的大小而确定,但情况可能并非始终如此。TU通 常与PU大小相同或小于PU。在
一些实例中,对应于cu的残余样本可W使用被称为"残余 四叉树"(RQT)的四叉树结构细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可 变换与TU相关联的像素差值W产生可经量化的变换系数。
[0044] 叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应CU的全部或 一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关 的数据。举例来说,当PU经帖内模式编码时,用于PU的数据可W包含在残余四叉树(RQT) 中,残余四叉树可包含描述用于对应于PU的TU的帖内预测模式的数据。作为另一实例,当 PU经帖间模式编码时,PU可包含定义PU的一或多个运动向量的数据。举例来说,定义PU 的运动向量的数据可W描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量 的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片及/ 或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
[0045] 具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可W使用 RQT(还被称作TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可W指示叶CU 是否分裂成四个变换单元。接着,每一变换单元可W进一步分裂成其它子TU。当TU未经进 一步分裂时,其可被称作叶TU。通常,对于帖内译码,所有属于叶CU的叶TU共享相同的帖 内预测模式。也就是说,一般应用相同帖内预测模式来计算叶CU的所有TU的预测值。对 于帖内译码,视频编码器可W使用帖内预测模式针对每一叶TU计算残余值,作为CU的对应 于TU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可大于或小于PU。对 于帖内译码,PU可W与相同CU的对应叶TU并置。在一些实例中,叶TU的最大大小可W对 应于对应的叶CU的大小。
[0046] 此外,叶CU的TU还可与相应四叉树数据结构(被称作残余四叉树(RQT))相关联。 也就是说,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点总体上对应 于叶CU,而CU四叉树的根节点总体上对应于树块(或LCU)。未分裂的RQT的TU被称作叶 TU。一般来说,除非另有陈述,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
[0047]视频序列通常包含一系列视频帖或图片。图片群组佑0巧一般包括一系列一或多 个视频图片。GOP可包含GOP的标头、一或多个图片的标头或其它地方中的语法数据,其描 述GOP中包含的图片的数目。图片的每一切片可包含描述用于相应切片的编码模式的切片 语法数据。视频编码器20通常对个别视频切片内的视频块操作W便编码视频数据。视频 块可对应于CU内的译码节点。所述视频块可具有固定的或变化的大小,且可根据指定的译 码标准而大小不同。
[0048] 作为实例,歷支持各种PU大小的预测。假设特定CU的大小为2化2N,那么歷支 持2化2N或化N的PU大小的帖内预测,及2化2N、2化N、化2N或化N的对称PU大小的帖间 预测。歷还支持用于2化nU、2化nD、nLx2N和nRx2N的PU大小的帖间预测的不对称划分。 在不对称分割中,不分割CU的一个方向,而将另一方向分割成25%及75%。CU的对应于 25%分割区的部分通过"n"后接续"上"、"下"、"左"或"右"指示来指示。因而,举例来说, "2化nU"是指水平地分割的2化2NCU,其中顶部为2化0. 5NPU,而底部为2化1. 5NPU。
[0049] 在本发明中,"NXN"与"N乘N"可互换地使用W依据垂直及水平尺寸来指代视频 块的像素尺寸,例如,16X16像素或16乘16像素。一般来说,16x16块将在垂直方向上具 有16个像素(y= 16),并且在水平方向上具有16个像素(X= 16)。同样,化N块大体上 在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。一块 中的像素可按行和列布置。此外,块未必需要在水平方向与垂直方向上具有相同数目的像 素。举例来说,块可包括NXM个像素,其中M未必等于N。
[0050] 在使用CU的PU进行帖内预测性或帖间预测性译码之后,视频编码器20可W计算 CU的TU的残余数据。PU可包括描述在空间域(还被称作像素域)中产生预测性像素数据 的方法或模式的语法数据,并且TU可包括在对残余视频数据应用变换(例如,离散余弦变 换值CT)、整数变换、小波变换或概念上类似的变换)之后在变换域中的系数。所述残余数 据可W对应于未编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形 成包含用于CU的残余数据的TU,且接着变换TUW产生用于CU的变换系数。
[0051] 在进行用于产生变换系数的任何变换之后,视频编码器20可执行变换系数的量 化。量化通常是指变换系数经量化W可能减少用于表示系数的数据量从而提供进一步压缩 的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,n位值可在 量化期间被舍入到m位值,其中n大于m。
[0化2] 在量化之后,视频编码器可W扫描变换系数,从包含经量化变换系数的二维矩阵 产生一维向量。扫描可W经设计W将较高能量(并且因此较低频率)的系数放置在阵列的 前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。在一些实例中,视 频编码器20可利用预定义扫描次序来扫描经量化的变换系数W产生可经滴编码的串行化 向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化的变换系数W 形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下 文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概 率区间分割滴(PIP巧译码或另一滴编码方法对所述一维向量进行滴编码。视频编码器20 还可滴编码与经编码视频数据相关联的语法元素W供视频解码器30在解码视频数据时使 用。
[0化3]为了执行CABAC,视频编码器20可W向待发射的符号指派上下文模型内的上下 文。所述上下文可(例如)与符号的相邻值是否为非零有关。为了执行CAVLC,视频编码器 20可选择用于待发射的符号的可变长度码。VLC中的码字可经建构使得相对较短码对应于 更有可能符号,而较长码对应于不太可能符号。W此方式,使用VLC可W实现(例如)优于 对待发射的每一符号使用等长码字的位节省。概率确定可基于指派给符号的上下文。
[0化4] 根据本发明的技术,视频编码器20及视频解码器30可实质上经配置W利用W下 修改执行JCTVC-K0239的技术。与JCTVC-K0239中所提议的相比,可进行W下变化。
[0化5]首先,可去除如在JCTVC-K0239的整个部分2. 1 (包含所含子条款8.3. 5)中的额 外目标参考索引导出,并可如下改变用于参考图片列表建构的解码过程(其中斜体文本表 示附加物且"去除"之前的括号内文本表示去除物)。
[0化6] 8. 3. 4用于参考图片列表建构的解码过程
[0化7]在用于每一P或B切片的解码过程的开始处调用此过程。
[0化引通过子条款8. 5. 3. 2. 1中所指定的参考索引定址参考图片。参考索引为到参考图 片列表中的索引。在解码P切片时,存在单一参考图片列表Re巧icListO。在解码B切片 时,存在除了Re巧icListO之外的第二独立参考图片列表Re巧icListl。
[0化9] 在用于每一切片的解码过程的开始处,将变量RefldxLOA及针对B切片将 RefldxLlA设置为等于0,且如下推导出参考图片列表Re巧icListO及针对B切片推导出 民efPicListl。
[0060] 其次,可用"RefldxLXA"替换JCTVC-K0239的整个部分2. 2 (包含所有所含子条 款)中的"refldxLXA"的所有实例。
[0061] 再次,可将约束条件插入到肥VC扩展中,阐述当RefldxLXA不等于0 时,Re巧icListX[RefIdxLXA]及Re巧icListX[0]应具有不同类型。举例来说, Re巧icListX[RefIdxLXA]可为长期图片且Re巧icListX[0]可为短期图片,或 Re巧icListX[RefIdxLXA]可为短期的且Re巧icListX[0]可为长期的。
[0062] 为达成该些变化,可根据W下关于肥VCWD9描述的高级语法变化来实施视频编码 器20及视频解码器30。使用斜体化来表示相对于肥VCWD9的添加的文本。
[0063] 8.3.4.用于参考图片列表建构的解码过程
[0064] 在用于每一P或B切片的解码过程的开始处调用此过程。
[00化]通过子条款8. 5. 3. 2. 1中所指定的参考索引定址参考图片。参考索引为到参考图 片列表中的索引。在解码P切片时,存在单一参考图片列表Re巧icListO。在解码B切片 时,存在除了Re巧icListO之外的第二独立参考图片列表Re巧icListl。
[0066] 在用于每一切片的解码过程的开始处,将变量RefldxLOA及针对B切片将 RefIdxLlA设置为等于0,且如下推导出参考图片列表Re巧icListO及针对B切片推导出 RefPicListl。
[0067] 可使用关于肥VCWD9所描述的W下技术实现时间运动向量预测。下文中,通过斜 体文本表示添加物,而通过"去除"之前的括号内文本来表示去除物。
[0068] 对于用于合并模式的TMVP调用的变化
[0069] 8. 5. 2. 1. 1用于合并模式的明度运动向量的导出过程
[0070]此过程仅在PredMode[X口[y口等于M0DE_SKIP或PredMode[X口[y口等于M0DE_ INT邸及merge_flag[x門[y門等于1时被调用,其中(xP,评)指定相对于当前图片的左上 方明度样本的当前明度预测块的左上方样本。
[0071] 该个过程的输入是
[0072]-当前明度译码块的左上方样本相对于当前图片的左上方明度样本的明度位置 (xC,yC),
[0073]-当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位置 (xP,yP),
[0074]-指定当前明度译码块的大小的变量nCS,
[007引-指定明度预测块的宽度及高度的变量nPbW及nP地,
[0076]-指定在当前译码单元内的当前预测单元的索引的变量partidx。
[0077] 该个过程的输出是
[007引-明度运动向量mvLO及mvLl,
[0079]-参考索引refldxLO及refldxLl,
[0080] -预测列表利用旗标predFlagLO及predFlagLl。
[OOSI] 如下导出变量singleM化Flag。
[008引-如果log2_parallel_merge_level_minus2 大于 0,且nCS等于 8,那么将 singleM化Flag设定成 1。
[008引-否则,将singleM化Flag设定成0。
[0084] 在singleM化Flag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPbW 及nP地两者设定成等于nCS。
[0085] 注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并 候选者列表,所述单个合并候选者列表等同于2化2N预测单元的合并候选者列表。
[0086] 导出运动向量mvLO及mvLl、参考索引refldxLO及refldxLlW及预测利用旗标 predFlagLO及predFlagLl,如由W下顺序的步骤指定:
[0087] 1.从子条款中的相邻预测单元分割区的针对合并候选者的导出过程……。
[008引 2.将时间合并候选者的参考索引refldxLX(其中X为0或1)设定为等于0。
[0089] 3.使用明度位置(xP,yP)、明度预测块的宽度及高度nPbW及nP地、[去除;"及"] refldxLXW及等于1的mergeTMVP作为输入来调用子条款8. 5. 3. 1.7中的时间明度运 动向量预测的导出过程,且其中输出为可用性旗标avai1油1eFlagLXCo1及时间运动向量 mvLXCol。如下文所指定导出变量avail油leFlagCol及predFlagLXCol(其中X分别为0 或1)。
[0090] 4.…
[0091] …
[0092] 对于用于AMVP模式的TMVP调用的变化
[0093] 8. 5. 3. 1. 5用于明度运动向量预测的导出过程
[0094] 到该个过程的输入是
[0095] -当前明度译码块的左上方样本相对于当前图片的左上方明度样本的明度位置 (xC,yC),
[0096] -指定当前明度译码块的大小的变量nCS,
[0097] -指定当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位 置(xP,y巧,
[009引-指定明度预测块的宽度及高度的变量nPbW及nP地,
[0099] -当前预测单元分割区的参考索引refldxLX(其中X为0或1),
[0100] -指定在当前译码单元内的当前预测单元的索引的变量partidx。
[0101] 该个过程的输出是
[010引-运动向量mvLX的预测mvpLX(其中X为0或1)。
[0103] 在W下顺序的步骤中导出运动向量预测子mvpLX。
[0104]1.使用明度译码块位置(xC,yC)、译码块大小nCS、明度预测块位置(xP,yP)、明度 预测块的宽度及高度nPbW及nP地、refIdxLX(其中X分别为0或1)及分割区索引partidx 作为输入来调用子条款8. 5. 3. 1. 6中的从相邻预测单元分割区的针对运动向量预测子候 选者的导出过程,且其中使用可用性旗标avai1油1eFlagLXN及运动向量mvLXN作为输出, 其中N由A、B替换。
[01化]2.如果avail油leFlagLXA及avail油leFlagLXB两者皆等于1,且mvLXA不等于mvLXB,那么将avail油leFlagLXCol设定为等于0,否则,使用明度位置(xP,yP)、明度预测 块的宽度及高度nPbW及nP地、[去除;"及"]refldxLX(其中X分别为0或1)化及等于0 的mergeTMVP作为输入来调用子条款8. 5. 3. 1. 7中的时间明度运动向量预测的导出过程, 且其中输出为可用性旗标avail油leFlagLXCol及时间运动向量预测子mvLXCol。
[0106] …
[0107] 针对TMVP导出的变化
[010引 8. 5. 3. 1. 7用于时间明度运动向量预测的导出过程
[0109] 到该个过程的输入是
[0110] -指定当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位 置(xP,y巧,
[011U -指定明度预测块的宽度及高度的变量nPbW及nP地,
[0112] -变量mergeTMVP,
[0113] -参考索引refldxLX(其中X为0或1)。
[0114] 该个过程的输出是
[0115] -运动向量预测mvLXCo1,
[0116] -可用性旗标avail油leFlagLXCol。
[0117] 变量currfb指定在明度位置(xP,y巧处的当前明度预测块。
[0118] 如下导出变量mvLXCol及avail油leFlagLXCol。
[0119] -如果slice_temporal_mvp_en油le_flag等于 0,那么将mvLXCol的两个分量设 定为等于0,且将avail油leFlagLXCol设定为等于0。
[0120] -否则,W下顺序的步骤适用。
[0121] 1.取决于slice_type、collocated_from_10_flag及collocated_ref_idx的值, 如下导出指定含有同位分割区的图片的变量colPic。
[0122] -如果slice_type等于B,且collocated_from_10_flag等于 0,那么变量colPic 指定含有同位分割区的图片,如由Re巧icListl[collocated_ref_idx]所指定。
[0123] -否则(slice_type等于B,且collocated_from_10_flag等于 1 或slice_type等 于巧,变量colPic指定含有同位分割区的图片,如由Re巧icListO[collocated_ref_idx] 所指定。
[0124] 2.如下导出右下方同位运动向量
[01 巧]xP化=xP+nPbW 巧-162)
[0126] yP化=yP+nPbH 巧-163)
[0127] -如果(yP>乂og2C忧SizeY)等于(yPI?b〉〉Log2abSizeY),且xP化小于pic_ wi化h_in_luma_samples,那么W下情形适用。
[0128] -变量colPb指定覆盖在由colPic指定的同位图片内部的由 ((xP化〉〉4)<<4,(yP化〉〉4)<<4)给定的经修改的位置的明度预测块。
[0129] -将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的同位图片的左上 方明度样本的由col化指定的同位明度预测块的左上方样本。
[0130] -使用currPb、colPic、colPb、(xPCol,yPCol)、mergeTMVP及refldxLX作为输入来 调用如子条款8. 5. 3. 1.8中所指定的同位运动向量的导出过程,且将输出指派给mvLXCol 及availableFlagLXCol。
[0131] -否则,将mvLXCol的两个分量设定为等于0,且将avail油leFlagLXCol设定为等 于0。
[0132] 3.在avail油leFlagLXCol等于0时,如下导出中屯、同位运动向量。
[0133] xPCtr=xP+(nPbW?l) 巧-164)
[0134] yPCtr=yP+(nP地〉〉1) 巧-165)
[01 巧]-变量colPb指定覆盖colPic内部的由((xPCtr〉〉4)<<4,(yPCtr〉〉4)<<
[0136] 4)给定的经修改的位置的明度预测块。
[0137] -将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的同位图片的左上 方明度样本的由col化指定的同位明度预测块的左上方样本。
[0138] -使用cu;rrPb、colPic、colPb、(xPCol,yPCol)、mergeTMVP及refIdxLX作为输入来 调用如子条款8. 5. 3. 1.8中所指定的同位运动向量的导出过程,且将输出指派给mvLXCol 及availableFlagLXCol。
[0139] 8. 5. 3. 1. 8用于同位运动向量的导出过程
[0140] 到该个过程的输入是
[0141] -指定当前预测块的curr化,
[0142] -指定同位图片的colPic,
[0143] -指定由colPic指定的同位图片内部的同位预测块的colPb,
[0144] -指定由colPb指定的同位明度预测块的左上方样本相对于由colPic指定的同位 图片的左上方明度样本的明度位置(xPCol,yPCol),
[0145] -变量me;rgeTMVP,
[0146] -参考索引refldxLX(其中X为0或1)。
[0147] 该个过程的输出是
[0148] -运动向量预测mvLXCo1,
[0149] -可用性旗标avail油leFlagLXCol。
[0150] 变量currPic指定当前图片。
[0151]分别将阵列predFlagLXCol[X] [y]、mvLXCol[X] [y]及refldxLXCol[X] [y]设定为 等于由colPic指定的同位图片的对应阵列PredFlagLX[x] [y]、MvLX[x] [y]及RefIdxLX[x] [y],其中X为该个过程所调用的X的值。
[0152] 如下导出变量mvLXCol及avail油leFlagLXCol。
[0153] -如果在帖内预测模式中译码colPb,那么将mvLXCol的两个分量设定为等于0,且 将avail油leFlagLXCol设定为等于0。
[0154] -否则,如下导出运动向量mvCol、参考索引refIdxCol及参考列表识别符 listCol。
[0 巧 5]-如果predFlagLOCol[xPCol] [yPCol]等于 0,那么分别将mvCol、refIdxCol及listCol设定为等于mvLlCol[xPCol] [yPCol]、refldxLlCol[xPCol] [yPCol]及LI。
[0156] -否则如果predFlagLOCol[xPCol] [yPCol]等于 1,且predFlagLlCol[xPCol] [yPCol]等于 0,那么分别将mvCol、refIdxCol及li
stCol设定为等于mvLOCol[xPCol] [yPCol]、refIdxLOCol[xPCol][yPCol]及LO。
[0157] -否则(predFlagLOCol[xPCol] [yPCol]等于 1,且predFlagLlCol[xPCol] [yPCol] 等于1),进行W下指派。
[015引-如果对于当前切片的每一参考图片列表中的每一图片pic,DifTPicOrderQit(currPic,pic)小于或等于 0,那么分别将mvCol、refIdxCol及listCol 设定为等于mvLXCol[xPCol] [yPCol]、refIdxLXCol[xPCol] [yPCol]及LX,其中X为该个过 程所调用的X的值。
[0159] -否贝!J,分别将mvCol、refIdxCol及listCol设定为等于mvLNCol[xPCol] [yPCol]、refldxLNCol[xPCol] [yPCol]及LN,其中N为collocated_fr〇m_10_flag的值。
[0160] 且如下导出mvLXCol及avail油leFlagLXCol。
[0161]-在[去除;"如果"化ongTermRe巧ic(州rrPic,州rrPb,refldxLX,LX)不等于Lo ngTermRe巧ickolPic,colPb,refIdxCol,listCol)时,W下情形适用
[0162]-如果refldxLXA大于0且mergeTMVP等于 1,那么将refldxLX设定为refldxLXA, 且将avail油leFlagLXCol设定为1。
[0163] -否则,将mvLXCol的两个分量设定为等于0,且将avail油leFlagLXCol设定为等 于0。
[0164]-[[去除;"否则"]在将变量avail油leFlagLXCol设定为等于1时,将 re巧icListCoUrefldxCol]设定成具有含有图片colPic中的预测块currfb的切片的参考 图片列表listCol中的参考索引refIdxCol的图片,且W下情形适用。
[01(55]colPocDiff=DiffPicOrderCnt(colPic,refPicListCol[refIdxCol]) (8-166)
[0166]州;rrPocDiff=DifTPicOrderQit(currPic,Re巧icListX[refldxLX]) 巧-167)
[0167] -如果Re巧icListX[refIdxLX]为长期参考图片,或colPocDiff等于 currfocDiff,那么mvLXCol经导出为;
[0168]mvLXCol=mvCol 巧-168)
[0169] -否则,mvLXCol经导出为运动向量mvCol的经按比例缩放版本,如
[0170] 下文所指定。
[0171]tx= (16384+(Abs(td)?l))/td 巧-169)
[0172]distScaleFactor=Clip3(-4096,4095, (tb*tx+32)〉〉6)巧-170)
[0173]mvLXCol=Clip3 (-32768, 32767,Si即(distScaleF'actor*mvCol) *
[0174] ((Abs(distScaleFactor*mvCol) +127) ?8)) 巧-171)
[0175] 其中td及忧经导出为
[0176]td=Clip3(-128, 127,colPocDiff) 巧-172)
[0177]忧=Clip3(-128, 127,currfocDiff) 巧-173)
[0178] 视频编码器20和视频解码器30各自可W经实施为可适用的多种合适的编码器 或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器值SP)、专用集成电路 (ASIC)、现场可编程口阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编 码器20及视频解码器30中的每一者可包括在一或多个编码器或解码器中,所述编码器或 解码器中的任一者可集成为组合式视频编码器/解码器(编解码器)的部分。包含视频编 码器20及/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置,例如 蜂窝式电话。
[0179] 图2是说明可实施用于译码运动向量的技术的视频编码器20的实例的框图。视 频编码器20可对视频切片内的视频块执行帖内及帖间译码。帖内译码依赖于空间预测来 减少或去除给定视频帖或图片内的视频中的空间冗余。帖间译码依赖于时间预测来减少或 移除视频序列的邻接帖或图片内的视频中的时间冗余。帖内模式(I模式)可W指若干基 于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测炬模式)的帖间模式 可W指若干基于时间的译码模式中的任一者。
[0180] 如图2中所示,视频编码器20接收待编码视频帖内的当前视频块。在图2的实例 中,视频编码器20包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、 量化单元54及滴编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、 帖内预测单元46及分割单元48。为了视频块重构,视频编码器20还包含逆量化单元58、 逆变换单元60及求和器62。还可包含解块滤波器(图2中未图示)W对块边界进行滤波, 从而从经重构视频移除成块假象。在需要时,解块滤波器将通常对求和器62的输出进行滤 波。除了解块滤波器外,还可使用额外滤波器(回路中或回路后)。为简洁起见未展示此类 滤波器,但在需要时,该些滤波器可W对求和器50的输出进行滤波(作为环路内滤波器)。
[0181] 在编码过程期间,视频编码器20接收待译码的视频帖或切片。所述帖或切片可被 划分成多个视频块。运动估计单元42及运动补偿单元44可相对于一或多个参考帖中的一 或多个块执行所接收视频块的帖间预测性译码W提供时间预测。帖内预测单元46可替代 地相对于与待译码块相同的帖或切片中的一或多个相邻块执行对所接收视频块的帖内预 测性译码W提供空间预测。视频编码器20可W执行多个译码遍次,例如,W针对每一视频 数据块选择适当的译码模式。
[0182] 此外,分割单元48可W基于前述译码遍次中的前述划分方案的评估将视频数据 块分割成子块。举例来说,分割单元48最初可W将帖或切片分割成LCU,并且基于速率失真 分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可W进一步 产生指示LCU划分成子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和 一或多个TU。
[0183] 模式选择单元40可W(例如)基于误差结果选择译码模式中的一者(帖内或帖 间),并且将所得的经帖内译码或经帖间译码块提供到求和器50W便产生残余块数据,并 且提供到求和器62W便重新构造经编码块W用作参考帖。模式选择单元40还将语法元素 (例如运动向量、帖内模式指示符、分割信息和其它该些语法信息)提供到滴编码单元56。
[0184] 运动估计单元42与运动补偿单元44可高度集成,但出于概念目的而分别加W说 明。由运动估计单元42执行的运动估计是产生运动向量的过程,所述运动向量估计视频块 的运动。举例来说,运动向量可W指示当前视频帖或图片内的视频块的PU相对于参考帖 (或其它经译码单元)内的预测性块相对于当前帖(或其它经译码单元)内正被译码的当 前块的位移。预测性块是被发现在像素差方面与待译码块紧密匹配的块,像素差可通过绝 对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。在一些实例中,视频编码器20可 计算存储于参考图片存储器64中的参考图片的次整数像素位置的值。举例来说,视频编码 器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。 因此,运动估计单元42可W相对于全像素位置及分数像素位置执行运动捜索并且输出具 有分数像素精度的运动向量。
[0185] 运动估计单元42通过比较PU的位置与参考图片的预测性块的位置来计算用于经 帖间译码切片中的视频块的PU的运动向量。参考图片可W选自第一参考图片列表(列表 0)或第二参考图片列表(列表1),其中的每一个识别存储在参考图片存储器64中的一或 多个参考图片。运动估计单元42向滴编码单元56和运动补偿单元44发送计算出的运动 向量。
[0186] 由运动补偿单元44执行的运动补偿可设及基于由运动估计单元42确定的运动 向量来揃取或产生预测性区块。再次,在一些实例中,运动估计单元42与运动补偿单元44 可在功能上整合。在接收到当前视频块的PU的运动向量后,运动补偿单元44可W在参考 图片列表中的一者中定位所述运动向量指向的预测性块。求和器50通过从经译码的当前 视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块,如下文所论 述。一般来说,运动估计单元42相对于明度分量执行运动估计,并且运动补偿单元44针对 色度分量及明度分量两者使用基于明度分量计算的运动向量。模式选择单元40还可产生 与视频块及视频切片相关联的语法元素W供视频解码器30在解码视频切片的视频块时使 用。
[0187] 作为如上文所描述由运动估计单元42及运动补偿单元44执行的帖间预测的替代 方案,帖内预测单元46可对当前块进行帖内预测。明确地说,帖内预测单元46可W确定用 来编码当前块的帖内预测模式。在一些实例中,帖内预测单元46可W例如在单独编码遍次 期间使用各种帖内预测模式对当前块进行编码,并且帖内预测单元46(或在一些实例中为 模式选择单元40)可W从所述测试模式中选择适当帖内预测模式来使用。
[0188] 举例来说,帖内预测单元46可W使用速率失真分析计算用于各种所测试帖内预 测模式的速率失真值,并且从所述所测试模式当中选择具有最佳速率失真特性的帖内预测 模式。速率失真分析一般确定经编码块与经编码W产生所述经编码块的原始的未经编码块 之间的失真(或误差)的量,W及用于产生经编码块的位速率(也就是说,位数目)。帖内 预测单元46可根据用于各种经编码块的失真和速率计算比率,W确定哪个帖内预测模式 对于所述块展现最佳速率失真值。
[0189] 在选择用于块的帖内预测模式后,帖内预测单元46可将指示用于块的所选帖内 预测模式的信息提供到滴编码单元56。滴编码单元56可编码指示所选帖内预测模式的信 息。视频编码器20在发射的位流中可包含配置数据,其可包含多个帖内预测模式索引表和 多个修改的帖内预测模式索引表(也称为码字映射表),对用于各种块的上下文进行编码 的定义,和对最可能帖内预测模式、帖内预测模式索引表和修改的帖内预测模式索引表的 指示W用于所述上下文中的每一者。
[0190] 视频编码器20通过从经译码的原始视频块减去来自模式选择单元40的预测数据 形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例 如离散余弦变换值CT)或概念上类似的变换等变换应用于残余块,从而产生包括残余变换 系数值的视频块。变换处理单元52可W执行概念上类似于DCT的其它变换。还可使用小 波变换、整数变换、子频带变换或其它类型的变换。
[0191] 在任何情况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数 块。所述变换可将残余信息从像素值域转换到变换域(例如,频域)。变换处理单元52可 将所得变换系数发送到量化单元54。量化单元54可量化所述变换系数W进一步减小位率。 量化过程可减少与变换系数中的一些或全部相关联的位深度。量化过程也可被称作"缩放" 过程,且因此经量化的变换系数也可被称作"经缩放的变换系数"。量化程度(或缩放)可 通过调整量化参数来修改。在一些实例中,滴编码单元56可W接着执行对包含经量化的变 换系数的矩阵的扫描。
[0192] 在量化之后,滴编码单元56滴译码经扫描的经量化的变换系数。举例来说,滴编 码单元56可W执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码 (CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割滴(PIP巧译码 或另一滴译码技术。在基于上下文的滴译码的情况下,上下文可W基于相邻块。在滴编码 单元56的滴译码之后,可W将经编码位流发射到另一装置(例如视频解码器30),或者将所 述经编码位流存档用于W后发射或检索。
[0193] 逆量化单元58及逆变换单元60分别应用逆量化和逆变换W在像素域中重构残余 块,例如W供稍后用作参考块。运动补偿单元44可通过将残余块添加到参考图片存储器64 的一个帖的预测性区块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用 于经重建构的残余块来计算用于在运动估计中使用的次整数像素值。求和器62将经重建 构的残余块添加到由运动补偿单元44产生的经运动补偿的预测块,W产生经重建构的视 频块W用于存储于参考图片存储器64中。经重建构的视频块可由运动估计单元42及运动 补偿单元44用作参考块W对后续视频帖中的块进行帖间译码。
[0194] 模式选择单元40可执行各种编码遍次,如上文所论述。在一些所述遍次中,模式 选择单元40可确定当前视频数据块的特定编码模式。举例来说,模式选择单元40可确定 应基于来自所述遍次的所得速率失真度量使用帖间预测来预测当前块。同样,模式选择单 元40可确定是否应使用高级运动向量预测(AMV巧或合并模式编码当前块的运动向量。一 般来说,在AMVP中,相对于AMVP候选者的运动向量编码运动向量,其中在当前运动向量与 AMVP候选者的运动向量之间计算运动向量差。另外,还针对当前运动向量编码参考图片列 表识别符及参考索引。
[01巧]另一方面,在合并模式中,从运动向量预测子承袭几乎所有运动参数,且仅编码运 动向量预测子索引,W指示将候选运动向量预测子集合中的哪一运动向量预测子用于编码 运动向量。然而,根据本发明的技术,视频编码器20可在执行合并模式时使用额外参考索 引。
[0196] 模式选择单元40可确定应对当前块进行视图间预测。此外,模式选择单元40可 确定同位块的运动向量足W用于定义识别当前块的视图间参考图片的参考块的运动向量。 因此,模式选择单元40可选择使用合并模式(即使用时间运动向量预测子(TMV巧的合并 模式)来编码当前块的运动向量。然而,在常规合并模式中,当前块的运动向量将承袭同位 块(即TMVP)的参考索引,其将指代图片次序计数(POC)值与包含当前块的当前图片不同 的参考图片。因此,为确保视图间参考图片具有与当前图片相同的POC,所W视频编码器20 可使用与TMVP的参考索引分离的额外参考索引从参考图片列表中选择视图间参考图片。
[0197] 明确地说,视频编码器20可确定额外参考索引的预定值。预定值可为0、-1或另一 值。在一些实例中,视频编码器20可在包含当前块的切片的切片标头、包含当前块的图片 的图片参数集(PPS)、包含图片的序列的序列参数(SP巧及/或视频参数集(VP巧中对表示 预定值的数据进行编码。滴编码单元56可滴编码此数据。在任何情况下,通过使用额外参 考索引,视频编码器20可确保当前图片的当前块的视图间参考图片具有与当前图片的POC 值相同的POC值。
[0198] 因此,当运动补偿单元44建构当前块的经预测块时,运动补偿单元44可使用来自 不同图片中的同位块的水平运动分量、垂直运动分量及参考图片列表,而且使用额外参考 索引的预定值来确定参考图片中的参考块的位置,接着根据参考块计算经预测块。参考图 片可对应于由应用于参考图片列表的额外参考索引所识别的参考图片,而参考块可在由当 前块的位置所定义的参考图片中的位置所识别,所述当前块偏移TMVP的水平运动分量和 垂直运动分量。
[0199] W此方式,视频编码器20表示视频编码器的实例,所述视频编码器经配置W进行 W下操作:确定第一目标参考索引,其表示当前运动向量的候选运动向量预测子所指代的 参考图片;针对候选运动向量预测子并在当前运动向量的时间运动向量预测(TMV巧期间, 确定等于预定值的额外目标参考索引值;及至少部分地基于额外参考索引值对当前运动向 量进行译码(即在此实例中进行编码)。
[0200] 图2的视频编码器20还表示视频编码器的实例,所述视频编码器可经配置W在当 前运动向量的时间运动向量预测(TMV巧期间将额外参考索引值设定为预定值,并至少部 分地基于额外参考索引值译码当前运动向量。另外或替代性地,视频编码器20可经配置W 确定待译码的视频数据是否符合基础视频译码标准或基础视频译码标准的扩展;在视频数 据符合基础视频译码标准时,根据基础视频译码标准对视频数据进行译码;及在视频数据 符合基础视频译码标准的扩展时,在对视频数据的图片块的运动向量进行译码时,针对运 动向量的时间运动向量预测(TMV巧导出额外目标参考索引值的值,并至少部分地基于额 外目标参考索引值的值对运动向量进行译码。
[0201] 图3是说明可实施用于译码运动向量的技术的视频解码器30的实例的框图。在 图3的实例中,视频解码器30包含滴解码单元70、运动补偿单元72、帖内预测单元74、逆 量化单元76、逆变换单元78、参考图片存储器82及求和器80。在一些实例中,视频解码器 30可执行总体上与关于视频编码器20 (图2)描述的编码遍次互逆的解码遍次。运动补偿 单元72可基于从滴解码单元70接收的运动向量产生预测数据,而帖内预测单元74可基于 从滴解码单元70接收的帖内预测模式指示符产生预测数据。
[0202] 在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频块的视频 块及相关联的语法元素的经编码视频位流。视频解码器30的滴解码单元70滴解码位流W 产生经量化系数、运动向量或帖内预测模式指示符及其它语法元素。滴解码单元70将运动 向量及其它语法元素转发到运动补偿单元72。视频解码器30可在视频切片层级及/或视 频块层级接收语法元素。
[0203] 当视频切片经译码为经帖内译码(I)切片时,帖内预测单元74可W基于经发信的 帖内预测模式及来自当前帖或图片的先前经解码块的数据产生用于当前视频切片的视频 块的预测数据。当视频帖被译码为经帖间译码(即,B、P或GPB)切片时,运动补偿单元72 基于从滴解码单元70接收的运动向量及其它语法元素产生用于当前视频切片的视频块的 预测性块。可从参考图片列表中的一者内的参考图片中的一者产生所述预测性块。视频解 码器30可W基于存储在参考图片存储器82中的参考图片使用默认建构技术建构参考帖列 表,即列表0及列表1。
[0204] 运动补偿单元72通过剖析运动向量和其它语法元素确定用于当前视频切片的视 频块的预测信息,并且使用所述预测信息产生用于正被解码的当前视频块的预测性块。举 例来说,运动补偿单元72使用所接收语法元素中的一些语法元素确定用于译码视频切片 的视频块的预测模式(例如,帖内预测或帖间预测)、帖间预测切片类型(例如,B切片、P 切片或GPB切片)、切片的参考图片列表中的一或多者的建构信息、切片的每一经帖间编码 的视频块的运动向量、切片的每一经帖间译码的视频块的帖间预测状态,及用W解码当前 视频切片中的视频块的其它信息。
[0205] 运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用由视频 编码器20在视频块的编码期间使用的内插滤波器来计算参考块的次整数像素的内插值。 在此情况下,运动补偿单元72可根据接收的语法元素而确定由视频编码器20使用的内插 滤波器并使用所述内插滤波器来产生预测性块。
[0206] 逆量化单元76将在位流中提供且由滴解码单元70解码的经量化变换系数逆量 化,即解量化。逆量化过程可包含使用视频解码器30针对视频切片中的每一视频块计算W 确定应应用的量化程度和同样逆量化程度的量化参数QPy。
[0207] 逆变换单元78对变换系数应用逆变换(例如,逆DCT、逆整数变换,或概念上类似 的逆变换过程),W便产生像素域中的残余块。
[020引在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块 后,视频解码器30通过对来自逆变换处理单元78的残余块与由运动补偿单元72产生的对 应预测性块求和而形成经解码的视频块。求和器80表示执行此求和运算的一或多个组件。 必要时,还可应用解块滤波器W对经解码块进行滤波W便去除成块效应假象。其它环路滤 波器(在译码环路中或在译码环路之后)也可用于使像素转变平滑或者W其它方式改善视 频质量。接着将给定帖或图片中的经解码视频块存储在参考图片存储器82中,所述参考图 片存储器存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频W用 于稍后呈现在显示装置(例如,图1的显示装置32)上。
[0209] 根据本发明的技术,视频解码器30可接收指示当前块待使用帖间预测解码的数 据。此外,所述数据可指示当前块的运动向量待使用合并模式解码,且时间运动向量预测子 (TMV巧可供在合并模式期间使用。此外,视频解码器30可确定待用于额外参考索引的预定 值。举例来说,可在包含当前块的切片的切片标头、包含当前块的图片的图片参数集(PPS)、 包含图片的序列的序列参数集(SP巧和/或视频参数集(VP巧中定义预定值。
[0210] 在一些实例中,视频解码器30可对运动向量预测子(MV巧索引进行解码,所述运 动向量预测子(MV巧索引指示当前块的合并候选者为同位块(即TMV巧的运动向量。视频 解码器30可因此确定TMVP(例如,参考索引、参考图片列表、水平运动分量及垂直运动分 量)的运动参数。然而,视频解码器30还可确定额外参考索引,其具有如上文所论述的预 定值。
[0211]
视频解码器30的滴解码单元70或另一单元(例如运动补偿单元72)可使用合并 模式及TMVP建构当前块的运动向量。明确地说,视频解码器30可建构当前块的运动向量 W具有TMVP的水平运动分量、垂直运动分量和参考图片列表识别符。然而,当前块的运动 向量可使用额外参考索引而不是TMVP的参考索引。因此,运动补偿单元72可使用由TMVP 的参考图片列表及额外参考索引所识别的参考图片计算当前块的经预测块,并基于水平运 动分量和垂直运动分量计算参考图片中的参考块的位置。
[0212] W此方式,视频解码器30表示视频解码器的实例,所述视频解码器经配置W进行 W下操作:确定第一目标参考索引,其表示当前运动向量的候选运动向量预测子所指代的 参考图片;针对候选运动向量预测子并在当前运动向量的时间运动向量预测(TMV巧期间, 确定等于预定值的额外目标参考索引值;及至少部分地基于额外参考索引值对当前运动向 量进行译码(即在此实例中进行解码)。
[0213] 图3的视频解码器30还表示视频解码器的实例,所述视频解码器可经配置W在当 前运动向量的时间运动向量预测(TMV巧期间将额外参考索引值设定为预定值,并至少部 分地基于额外参考索引值译码当前运动向量。另外或替代性地,视频解码器30可经配置W 确定待译码的视频数据是否符合基础视频译码标准或基础视频译码标准的扩展;在视频数 据符合基础视频译码标准时,根据基础视频译码标准对视频数据进行译码;及在视频数据 符合基础视频译码标准的扩展时,在对视频数据的图片块的运动向量进行译码时,针对运 动向量的时间运动向量预测(TMV巧导出额外目标参考索引值的值,并至少部分地基于额 外目标参考索引值的值对运动向量进行译码。
[0214] 图4为说明实例MVC预测模式的概念图。多视图视频译码(MVC)为ITU-TH. 264/ AVC的扩展。可将类似技术应用于肥VC。在图4的实例中,说明八个视图(具有视图irSO" 到"S7"),且对于每一视图说明十二个时间位置("TO"到"Til")。也就是说,图4中的每 一行对应于一视图,而每一列指示一时间位置。图4说明用于多视图视频译码的典型MVC 预测结构(包含每一视图内的帖间图片预测和视图之间的视图间预测)。 悦巧]尽管MVC具有可通过H. 264/AVC解码器解码的所谓的基础视图且MVC还可支持立 体声视图对,但MVC的一个优点是:其可支持使用两个W上视图作为3D视频输入且解码通 过多个视图表示的此3D视频的实例。具有MVC解码器的客户端的擅染器(renderer)可预 期具有多个视图的3D视频内容。
[0216] 典型MVC解码次序布置被称作时间优先译码。存取单元可包含针对一个输出时间 例子的所有视图的经译码图片。举例来说,时间TO的图片中的每一者可包含在共同存取单 元中,时间T1的图片中的每一者可包含在第二共同存取单元中,等等。解码次序未必与输 出或显示次序相同。在MVC中,允许在相同存取单元(即,具有相同时间例子)中的图片当 中进行视图间预测。当译码非基础视图中的一者中的图片时,如果图片处于不同视图中但 具有相同时间例子,那么可将所述图片添加到参考图片列表中。视图间预测参考图片可放 置在参考图像列表的任何位置中,正如任何帖间预测参考图片一般。
[0217] 在图4中的每一行及每一列的交叉点处使用包含字母的阴影块指示图4中的帖, 所述字母指定对应帖是经帖内译码(即,I帖),还是在一个方向上经帖间译码(即,作为P 帖)还是在多个方向上经帖间译码(即,作为B帖)。一般来说,预测由箭头指示,其中箭头 指向的帖使用箭头出发的对象用于预测参考。举例来说,时间位置TO处的视图S2的P帖 是从时间位置TO处的视图SO的I帖预测。
[0218] 如同单个视图视频编码,多视图视频译码视频序列的帖可相对于不同时间位置处 的帖来预测性地编码。举例来说,时间位置T1处的视图SO的b帖具有从时间位置TO处的 视图SO的I帖指向其的箭头,从而指示b帖是从I帖预测的。然而,另外,在多视图视频编 码的上下文中,帖可经视图间预测。目P,视图分量可使用其它视图中的视图分量用于参考。 举例来说,在MVC中,如同另一视图中的视图分量为帖间预测参考而实现视图间预巧U。潜在 视图间参考物在序列参数集(SP巧MVC扩展中用信号通知且可通过参考图片列表建构过程 加W修改,所述参考图片列表建构过程实现帖间预测或视图间预测参考物的灵活排序。
[0219] 在H.264/AVC的MVC扩展中,作为实例,视差运动补偿支持视图间预测,所述视差 运动补偿使用H. 264/AVC运动补偿的语法,但允许将不同视图中的图片用作参考图片。MVC 可支持对两个视图的译码,所述视图一般被称作立体视图。MVC的优点中的一个优点是: MVC编码器可将两个W上视图视为3D视频输入且MVC解码器可解码此类多视图表示。因 此,具有MVC解码器的任何擅染装置可预期具有两个W上视图的3D视频内容。
[0220] 通常,B图片的第一或第二参考图片列表的参考图片列表建构包含两个步骤;参 考图片列表初始化及参考图片列表重排(修改)。参考图片列表初始化是基于图片次序计 数(POC)值的次序(其可与图片的显示次序对准)将参考图片存储器(也被称作经解码图 片缓冲器)中的参考图片放到列表中的显式机构。
[0221] 视频译码器可使用参考图片列表重排机构来将在参考图片列表初始化期间放置 在列表中的图片的位置修改为任何新位置,或即使在图片不属于初始化列表的情况下将参 考图片存储器中的任何参考图片放置在任何位置。可将参考图片列表重排(修改)后的一 些图片放置在列表中的另一位置。然而,如果图片的位置超过列表的有效参考图片的数目, 则不将所述图片视为最终参考图片列表的条目。可在每一列表的切片标头中传信有效参考 图片的数目。在建构参考图片列表(即Re巧icListO和Re巧icListl,如果可用)之后,可 使用到参考图片列表的参考索引来识别参考图片列表中包含的任何参考图片。
[0222] 为得到时间运动向量预测子(TMVP),首先将识别同位的图片。如果当前图片 为B切片,那么在切片标头中传信collocate^化om_10_flagW指示同位的图片是来自 Re巧icListO还是来自Re巧icListl。在识别参考图片列表后,使用在切片标头中传信的 collocated_ref_idxW在列表中的图片中识别图片。接着通过检查同位的图片来识别同位 的PU。使用含有此PU的CU的右下方PU的运动或含有此PU的CU的中屯、PU内的右下方 PU的运动。当通过W上程序识别的运动向量用于产生AMVP或合并模式的运动候选者时,其 需要基于时间位置(由P0C反映)来加W缩放。
[0223] 在肥VC中,序列参数集(SP巧包含旗标sps_temporal_mvp_en油le_flag,且在 sps_temporal_mvp_en油le_flag等于 1 时,切片标头包含旗标pic_temporal_mvp_en油le_ flag。在对于特定图片,pic_temporal_mvp_en油le_flag及temporal_id两者等于 0 时, 来自按解码次序在特定图片之前的图片的运动向量将不在对特定图片或按解码次序在特 定图片之后的图片进行解码时被用作时间运动向量预测子。
[0224] 当前,运动图片专家组(M阳G)正基于肥VC开发3DV标准,其中标准化努力的部分 还包含基于肥VC对多视图视频编解码器进行标准化。应注意,类似地,在基于肥VC的3DV 中,启用基于来自不同视图的经重构视图分量的视图间预测。
[0225]AVC是通过多视图扩展W所述扩展实际上满足"化S-only"(仅高层次语法)要求 的方式进行扩展的。"仅化S"要求保证在多视图视频译码(MVC)中仅存在高级语法化L巧 变更,W使得不需要重新设计AVC中的宏模块层级的模块且可完全再用于MVC。有可能的 是,如果多回路解码被认为是可接受的,那么可针对肥VC的MVC/3DV扩展并还针对肥VC的 可缩放视频译码(SVC)扩展来满足"仅化S"要求。
[0226] 为了启用视图间预测,可出于W下目的作出化S改变;图片识别一一参考图片列 表建构及标记需要能够识别特定视图中的图片。
[0227] 在进行其它约束、假设W使得低层级译码模块从未遇到例如处理零运动相关按比 例缩放的情形时,化S改变不足W满足H. 264/MVC中的"仅化S"要求。所述约束、修改及假 设为:
[022引 ?如果同位图片为视图间(仅)参考图片,那么停用时间直接模式。
[0229] ?将视图间(仅)参考图片视为非短期的;与空间直接相关。
[0230] ?停用隐式加权预测
[0231] 为满足"仅化S"要求,扩展的此类修改必须仅在高层级语法中。因此,应不存在 对于切片标头下的语法元素的修改,且没有针对扩展规范的CU层级解码过程改变;例如, 肥VC扩展规范的运动向量预测应与肥V基础规范中的运动向量预测完全相同。化S改变是 扩展规范的规范性解码器改变;然而,从基础规范观点来看,此类改变不必为已知的且可为 信息性的。
[0232] 为了启用例如高效视图间预测的功能性,可实施肥VC扩展及基础规范中的两类 修改。将不影响基础肥VC解码器的典型解码过程或译码效率而影响扩展规范中的目标启 用功能性的基础规范改变称为挂钩。在大多数情况下,利用基础规范中的两个挂钩和扩展 规范中的化S改变实现"仅化S"要求。如果基础规范中的挂钩未经明确定义,那么某些所 要功能性可能不在扩展规范中启用或需要扩展规范中的大量修改。
[0233] 在仅化SSVC中,可能在上取样和/或过滤之后,可将基层表示放置在当前层的当 前图片的参考图片列表中。此类图片被称为层间参考图片。
[0234] 在JCT-3V及JCT-VC中,肥VC扩展处于开发中。在JCT-3V中,正开发两个 肥VC扩展;多视图扩展(MV-HEVC)和3D视频扩展(3D-HEVC)。另外,正开发两个AVC扩展;MVC+D和3D-AVC。进行中的标准的实例描述包含JCT3V-B1001,"StudyText ofIS0/IEC14496-10:2012/DAM2MVCextensionforinclusionofdepthmaps" (M. Hannuksela(诺基亚)、Y.Qien(高通)、G.Sullivan(微软)、T.Suzuki、S.Hattori(索 巧)), ^http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/2_ Sian曲ai/wgll/JCT3V-B1001-vl.zip处获得JCT3V-B1002,"3D-AVC化afttext4,,(M.M.Hannuksela、Y.Chen、T.Suzuki、J. -R.Ohm、G.J.Sullivan),其可在http://phenix. it-sudparis.eu/jct2/doc_end_user/documents/2_Shanghai/wgl1/JCT3V-B1002-V1. zip处获得JCT3V-B1004, "MV-HEVCDraftText2" (G.Tech,K.We即er、Y.Chen、 M.Hannuksela), 其可在http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/2_Shan曲ai/wgll/JCT3V-B1004-vl.zip处获得;及JCT3V-B1005,"3D-HEVC TestModel2" (G.Tech,K.Wegner、Y.Chen、S.Yea)化ttp://phenix.it-sudparis.eu/ jct2/doc_end_user/do州ments/2_^an曲ai/wgll/JCT3V-B1005-vl.zip)。同时,肥VC之 可缩放扩展正由JCT-VC开发。
[0235] 在各种版本的译码扩展标准中,可存在多个视图或层。此外,不同层、纹理或深度 视图可具有不同空间分辨率。一般来说,当此文档指代"层"时,术语层可同样适用于SVC层 或MVC视图。也就是说,可将不同视图视为位流的不同"层"。MV肥V规范经设计为仅使用 化S改变达成。
[0236] 图5为说明用于译码图片块的实例图片集合和运动向量的概念图。图5的实例说 明当前图片100、同位图片106、短期(ST)参考图片122及参考图片124,在放置于当前图片 100的参考图片列表中时具有参考索引0。图片1〇〇、1〇6、122及124中的每一者出现在同 一视图中,即此实例中的非基础视图。图5还描绘视图间参考图片120,其出现在不同于非 基础视图的基础视图内。
[0237] 在此实例中,当前图片100包含块102、104。使用时间运动向量114相对于图片 124预测块102。在此实例中,同位图片106包含块108、110。同样,在此实例中,使用时间 运动向量112相对于短期参考图片122对块108进行时间预测,而使用视差运动向量116 相对于视图间参考图片120对块110进行视图间预测。
[023引视频译码器(例如视频编码器20或视频解码器30)可使用运动向量预测译码运 动向量114。运动向量预测模式包含合并模式及高级运动向量预测(AMVP)。WD9指定,当运 动向量预测模式为合并模式时,将目标参考索引设定成0。因此,按比例调整同位PU中的运 动向量(如果参考短期参考图片)W形成当前PU的合并候选者。在图5的实例中,为对时 间运动向量114进行译码,视频译码器将按比例调整时间运动向量112W形成时间运动向 量114的合并候选者,其中块102表示当前PU。
[0239] 然而,WD9又指定,如果同位PU具有参考长期参考图片(对应于视图间参考图片) 的运动向量,那么参考视图间参考图片的运动向量将不用于预测当前运动向量。举例来说, 在图5中,WD9将指定块110的视差运动向量116将不用于对块104的运动向量进行译码 (图5不展示此运动向量)。
[0240] 在MV-HEVC中,由于没有引入译码单元或更低层级的修改,所W时间运动向量预 测过程与在HEVC中一样。然而,可存在大量同位PU(在同位图片中),其含有参考视图间参 考图片的运动向量,而目标参考索引(等于0)指示短期参考图片。因此,停用根据如WD9 所指定的所述运动向量的预测使得合并模式效率较低。
[0241] 图6为说明用于译码图片块的实例图片集合和运动向量的概念图。明确地说,图 6 说明来自Qien等人的"TemporalMotionVectorPredictionHookforMV-肥VC"的提 议(JCTVC-K0239,中国上海,2012 年 10月 10至 19 日),其可在ht1:p: //phenix.int-ev;ry. fr/jct/doc_end_use;r/documents/ll_^an曲ai/wgll/JCTVC-K0239-v2.zip处获得。此文 档还作为本发明的附件A而部分随附。在JCTVC-K0239中,提出启用额外目标参考索引。对 于图5的实例,参考短期参考图片的运动向量仍可朝向具有等于0的参考索引的参考图片 缩放,如在肥VCWD9中一样。
[0242] 然而,对于长期参考图片,视频译码器(例如,视频编码器20及视频解码器30)可 导出新的额外参考索引(ref_idxAdd.),使得参考长期参考图片的运动向量可用于形成合 并候选者并不被认为是不可供使用的。如图6中所示,当前图片的同位块110到块104的 视差运动向量116可用于形成视差运动向量候选者,W用于预测视差运动向量118。根据本 发明的技术,可例如通过可适用的视频译码标准(例如肥VC)、对此类标准的扩展(例如,多 视图视频译码或可缩放视频译码)或通过例如视频编码器20的视频编码器(图1及2)来 预定额外参考索引值。在一些实例中,视频编码器可编码(例如)切片标头、PPS、SPS和/ 或VPS中的预定值。
[0243] 一般来说,当等于0的参考索引表示短期参考图片时,新添加的目标参考索引可 用于表示长期参考图片。当等于0的参考索引表示长期参考图片时,新添加的目标参考索 引可用于表示短期参考图片。因此,视频译码器(例如,视频编码器20及视频解码器30) 可经配置W确定,当等于0的参考索引表示短期参考图片时,新添加的目标参考索引表示 长期参考图片,且反之亦然。
[0244] 类似于肥VCWD9,如果目标参考索引对应于长期参考图片,那么在被认为是可用 的时,同位块中的运动向量可不需要缩放。
[0245] 随着高层级语法变化,已针对肥VC基本规范提出W下语法及语义作为用于导 出额外目标参考索引的技术。在切片层级中,在可供使用时,可针对Re巧icListO及 Re巧icListl中的每一者导出额外目标参考索引(refldxLXA)的值。
[0246] 8. 3. 5用于TMVP的额外目标参考索引的导出过程
[0247] 在当前切片为P或B切片时调用该个过程。导出额外目标参考索引refIdxLOA及 refIdxLlA。
[0248] 将变量refldxLOA及refldxLlA皆设定为-1。
[0249] W下情形适用于导出refldxLOA。
[0巧0]
[0巧1] 在切片为B切片时,W下情形适用于导出refldxLlA。
[0巧2]
[0巧4] 出于比较的目的呈现如由JCTVC-K0239所提出及上文所论述的肥VC的章节 8. 3. 5。根据本发明的技术,可使用JCTVC-K0239的某些大体技术(例如,合并模式的额外参 考索引的使用),但可省略章节8. 3. 5。代替章节8. 3. 5,根据本发明的技术,可将额外参考 索引设定成预定值,例如〇、-1或另一预定值。因此,本发明的技术可实现超过JCTVC-K0239 的可观益处,因为可减少复杂度使得处理效率可得W改善。因此,代替使用如JCTVC-K0239 所提出的章节8. 3. 5来确定额外参考索引(例如RefldxLOA)(及针对B切片为RefldxLlA) 的值,本发明提出将变量RefldxLOa及RefldxLlA设定为等于预定值(例如,0或-1)。通 常可例如根据肥VC、MV-肥VC、JCTVC-K0239或其它来导出参考图片列表(Re巧icListX,其 中X可等于0或1)。
[0255] 下文中,描述用于执行时间运动向量预测的技术。在时间运动向量预测期间,当当 前模式为合并时,可将目标参考索引0变为refldxLXA(其中X等于0或1)。不改变AMVP 模式。所提出的规范文本变化如下;其中新添加/修改的文本斜体化且删除的文本加上括 号并在前面加上"去除"。
[0256] 对于合并模式的TMVP调用的变化
[0巧7] 8. 5. 2. 1. 1用于合并模式的明度运动向量的导出过程
[0258]此过程仅在PredMode[X口[y口等于M0DE_SKIP或PredMode[X口[y口等于M0DE_ INT邸及merge_flag[x門[y門等于1时被调用,其中(xP,评)指定相对于当前图片的左上 方明度样本的当前明度预测块的左上方样本。
[0259] 该个过程的输入是
[0260]-当前明度译码块的左上方样本相对于当前图片的左上方明度样本的明度位置 (xC,yC),
[0%1]-当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位置 (xP,yP), 悦6引-指定当前明度译码块的大小的变量nCS,
[0263] -指定明度预测块的宽度及高度的变量nPbW及nP地,
[0264] -指定在当前译码单元内的当前预测单元的索引的变量partidx。
[02化]该个过程的输出是 悦66]-明度运动向量mvLO及mvLl,
[0267]-参考索引refldxLO及refldxLl,
[0268]-预测列表利用旗标predFlagLO及predFlagLl。
[0269] 如下导出变量singleM化Flag。
[0270]-如果log2_parallel_merge_level_minus2 大于0,且nCS等于8,那么将 singleM化Flag设定成 1。
[027"1]-否贝Ij,将singleM化Flag设定成 0。
[0272] 在singleM化Flag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPbW 及nP地两者设定成等于nCS。
[027引注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并 候选者列表,所述单个合并候选者列表等同于2化2N预测单元的合并候选者列表。
[0274] 导出运动向量mvLO及mvLl、参考索引refldxLO及refldxLlW及预测利用旗标 predFlagLO及predFlagLl,如由W下顺序的步骤指定:
[0275] 1.从子条款中的相邻预测单元分割区的针对合并候选者的导出过程……。
[0276] 2.将时间合并候选者的参考索引refldxLX(其中X为0或1)设定为等于0。
[0277]3.使用明度位置(xP,yP)、明度预测块的宽度及高度nPbW及nP地、[去除;"及"] refldxLXW及等于1的mergeTMVP作为输入来调用子条款8. 5. 3. 1.7中的时间明度运 动向量预测的导出过程,且其中输出为可用性旗标avai1油1eFlagLXCo1及时间运动向量 mvLXCol。如下文所指定导出变量avail油leFlagCol及predFlagLXC
ol(其中X分别为0 或1)。
[027引 4.…
[0279] …
[0280] 对于AMVP模式的TMVP调用的变化
[0281] 8. 5. 3. 1. 5用于明度运动向量预测的导出过程
[0282] 到该个过程的输入是
[0283] -当前明度译码块的左上方样本相对于当前图片的左上方明度样本的明度位置 (xC,yC),
[0284] -指定当前明度译码块的大小的变量nCS,
[0285]-指定当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位 置(xP,y巧,
[0286] -指定明度预测块的宽度及高度的变量nPbW及nPbH,
[0287]-当前预测单元分割区的参考索引refldxLX(其中X为0或1),
[028引-指定在当前译码单元内的当前预测单元的索引的变量partidx。
[0289] 该个过程的输出是
[0290] -运动向量mvLX的预测mvpLX(其中X为0或1)。
[029U 在W下顺序的步骤中导出运动向量预测子mvpLX。 悦巧3.使用明度译码块位置(xC,yC)、译码块大小nCS、明度预测块位置(xP,yP)、明度 预测块的宽度及高度nPbW及nP地、refIdxLX(其中X分别为0或1)及分割区索引partidx 作为输入来调用子条款8. 5. 3. 1. 6中的从相邻预测单元分割区的针对运动向量预测子候 选者的导出过程,且其中使用可用性旗标avai1油1eFlagLXN及运动向量mvLXN作为输出, 其中N由A、B替换。
[029引 4.如果avail油leFlagLXA及avail油leFlagLXB两者皆等于1,且mvLXA不等于 mvLXB,那么将avail油leFlagLXCol设定为等于0,否则,使用明度位置(xP,yP)、明度预测 块的宽度及高度nPbW及nP地、[去除;"及"]refldxLX(其中X分别为0或1)化及等于0 的mergeTMVP作为输入来调用子条款8.5. 3. 1. 7中的时间明度运动向量预测的导出过程, 且其中输出为可用性旗标avai1油1eFlagLXCo1及时间运动向量预测子mvLXCo1。
[0294] …
[0295]TMVP的变化
[0296] 8. 5. 3. 1. 7用于时间明度运动向量预测的导出过程
[0297] 到该个过程的输入是
[029引-指定当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位 置(xP,y巧,
[0299] -指定明度预测块的宽度及高度的变量nPbW及nP地,
[0300] -参考索引refldxLX(其中X为0或1)[去除;"。"],
[0301 ]-变量me;rgeTMVP。
[030引该个过程的输出是 [030引-运动向量预测mvLXCo1,
[0304] -可用性旗标avail油leFlagLXCol。
[0305] 函数Re巧icOrderQit(picX,refIdx,LX)传回来自图片picX的参考图片列表LX 的具有索引refldx的参考图片的图片次序计数Pic化derhtVal,且如下指定。
[0306] RefPicOrderCnt(picX,refIdx,LX) =PicOrderCnt(图片picX的 Re巧icListX[refIdx]) 巧 141)
[0307] 取决于slice_type、collocated_from_10_flag及collocated_ref_idx的值,如 下导出指定含有同位分割区的图片的变量colPic。
[0308] -如果slice_type等于B,且collocated_from_10_flag等于 0,那么变量colPic 指定含有同位分割区的图片,如由Re巧icListl[collocated_ref_idx]所指定。
[0309] -否则klice_type等于B,且collocated_from_10_flag等于 1 或slice_type等 于巧,变量colPic指定含有同位分割区的图片,如由Re巧icListO[collocated_ref_idx] 所指定。
[0310] 在W下顺序的步骤中导出变量colPb及其位置(xPCol,yPCol);
[0311] 1.如下导出变量colPb
[0312] yP化=yP+nP地 (2-1)
[0313] -如果(yP>乂og2C忧Size巧等于(yPI?b〉〉Log2C忧SizeY),那么当前明度预测块的 右下方明度位置的水平分量由下式定义
[0314] xP化=xP+nPbW (2-2)
[0315] 且将变量colPb设定为覆盖colPic内部的由((xP化〉〉4)<<4,(yP化〉〉4)<<4)给 定的经修改的位置的明度预测块。
[0316] -否则((yP>乂ogSC忧SizeY)不等于打?化〉乂〇肖2(:忧5126¥)),将(3〇1?6标记为 "不可用"。
[0317] 2.在帖内预测模式中译码colPb或将colPb标记为"不可用"时,W下情形适用。 [031引-当前预测块的中屯、明度位置由下式定义
[0319] xPCtr= (xP+(nPbW?l) (2-3)
[0320] yPCtr= (yP+(nPbH?l) (2-4)
[032U -将变量colPb设定为覆盖colPic内部的由((xPCtr〉〉4)<<4,(yPCtr〉〉4)<<4)给 定的经修改的位置的明度预测块。
[032引 3.将(xPCol,yPCol)设定为等于相对于colPic的左上方明度样本的colPb的左 上方样本。
[0323] 如果所有W下条件为真,那么将refldxLX设定成refldxLXA。
[0324] -mergeTMVP等于 1。
[0325] -LongTermRe巧ic(州rrPic,refIdxLX,List)〇 不等于LongTermRe巧ic(colPic,r efIdxCol,listCol)。
[0326]-refIdxLXA大于0。
[0327]如下导出变量mvLXCol及avail油leFlagLXCol。
[0328]-如果W下条件中的一或多者为真,那么将mvLXCol的两个分量设定为等于0,且 将avail油leFlagLXCol设定为等于0。
[0329]-在帖内预测模式中译码colPb。
[0330]-将colPb标记为"不可用"。
[033*1] -slice_temporal_mvp_en油le_flag等于0。
[033引-LongTermRe巧ic(州rrPic,refIdxLX,List)0 不等于LongTermRe巧ic(colPic,r efIdxCol,listCol)。
[033引-否贝Ij,如下导出运动向量mvCol、参考索引refldxCol及参考列表识别符listCol。
[0334]-如果PredFlagLO[xPCol] [yPCol]等于0,那么分别将mvCol、refIdxCol及 listCol设定为等于MvLl[xPCol] [yPCol]、RefIdxLl[xPCol] [yPCol]及L1。
[0335] -否则(PredFlagLO[xPCol] [yPCol]等于 1),W下情形适用。
[0336]-如果PredFlagLl[xPCol] [yPCol]等于0,那么分别将mvCol、refldxCol及 listCol设定为等于MvLO[xPCol] [yPCol]、RefIdxL0 [xPCol] [yPCol]及LO。
[0337] -否则(PredFlagLl[xPCoU[yPCoU等于 1),进行W下指派。
[033引-如果每一参考图片列表中的每一图片pic的Pic化der化t(pic)小于或等 于PicOrderQitVal,那么分别将mvCol、refldxCol及listCol设定为等于MvLX[xPCol] [yPCol]、RefIdxLX[xPCol] [yPCol]及LX,其中X为该个过程所调用的X的值。
[0339]-否则(至少一个参考图片列表中的至少一个图片pic的Pic化der化t(pic)大于 PicOrderQitVal,且分别将mvCol、refIdxCol及listCol设定为等于MvLN[xPCol] [yPCol]、 RefIdxLN[xPCol] [yPCol]及LN,其中N为collocated_from_10_flag的值。
[0340] 且将变量avail油leFlagLXCol设定为等于1,且W下情形适用。
[0341]-如果Re巧icListX[refldxLX]为长期参考图片,或PicOrderCnt(colPic) -Re巧i cOrderQit(colPic,refldxCol,listCol)等于PicOrderQitVal-PicOrderQit(Re巧icList X[refIdxLX]),
[034引 mvLXCol=mvCol (2-5)
[0343]-否则,mvLXCol经导出为运动向量mvCol的经缩放版本,如下文所指定
[0344] tx= (16384+(Abs(td)?l))/td (2-6)
[0345]distScaleFactor=Clip3 (-4096, 4095, (tb*tx+32)〉〉6)
[0346] (2-7)mvL
[0347]XCol=Clip3(-32768, 32767,Si即2(distScaleFactor*mvCol)*((Abs(distScal e化ctor*mvCol)+127)〉〉8)) (2-8)
[0348] 其中td及忧经导出为
[0349]td=Clip3 (-128, 127,PicOrderQit(colPic) -RefPicOrderQit(colPic,refidx Col,listCol)) (2-9)
[0巧0]忧=Clip3 (-128, 127,PicOrderQitVal-PicOrderQit(Re巧icListX[refIdxLX] )) (2-10)
[0巧^ 1. 1. 1W肥VCWD9进行应用的替代实施
[0352] 可如W上实例中所描述导出或W其它方式传信/设定refldxLXA(其中X等于0 或1)。对于添加物,修改为斜体化,或对于去除物,修改加有括号并在前面加有"去除的"。W下实例类似于上文所描述的实例,其中一些更新的文本用于时间运动向量预测。
[0巧3] 8. 5. 3. 1. 7用于时间明度运动向量预测的导出过程
[0354] 到该个过程的输入是
[0355]-指定当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位 置(xP,y巧,
[0356]-指定明度预测块的宽度及高度的变量nPbW及nPbH,
[0巧7]-变量mergeTMVP,
[0巧引-参考索引refldxLX(其中X为0或1)。
[0巧9] 该个过程的输出是
[0360] -运动向量预测mvLXCo1,
[0361] -可用性旗标avail油leFlagLXCol。
[0362] 变量currfb指定在明度位置(xP,y巧处的当前明度预测块。
[0363] 如下导出变量mvLXCol及avail油leFlagLXCol。
[0364] -如果slice_temporal_mvp_en油le_flag等于 0,那么将mvLXCol的两个分量设 定为等于0,且将avail油leFlagLXCol设定为等于0。
[0365]-否则,W下顺序的步骤适用。
[0366] 1.取决于slice_type、collocated_from_10_flag及collocated_ref_idx的值, 如下导出指定含有同位分割区的图片的变量colPic。
[0367]-如果slice_type等于B,且collocated_from_10_flag等于 0,那么变量colPic 指定含有同位分割区的图片,如由Re巧icListl[collocated_ref_idx]所指定。
[0368]-否则(slice_type等于B,且collocated_from_10_flag等于 1 或slice_type等 于巧,变量colPic指定含有同位分割区的图片,如由Re巧icListO[collocated_ref_idx] 所指定。
[0369] 2.如下导出右下方同位运动向量
[0370]xP化=xP+nPbW 巧-162)
[0371]yP化=yP+nPbH (8-163)
[0372]-如果(yP>乂og2C忧SizeY)等于(yPI?b〉〉Log2abSizeY),且xP化小于pic_ wi化h_in_luma_samples,那么W下情形适用。
[037引-变量colPb指定覆盖在由colPic指定的同位图片内部的由 ((xP化〉〉4)<<4,(yP化〉〉4)<<4)给定的经修改的位置的明度预测块。
[0374]-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的同位图片的左上 方明度样本的由col化指定的同位明度预测块的左上方样本。
[03巧]-使用currPb、colPic、colPb、(xPCol,yPCol)、mergeTMVP及refldxLX作为输入来 调用如子条款8. 5. 3. 1.8中所指定的同位运动向量的导出过程,且将输出指派给mvLXCol 及availableFlagLXCol。
[0376]-否则,将mvLXCol的两个分量设定为等于0,且将avail油leFlagLXCol设定为等 于0。
[0377] 3.在avail油leFlagLXCol等于0时,如下导出中屯、同位运动向量。
[0378] xPCtr=xP+(nPbW?l) 巧-164)
[0379] yPCtr=yP+(nP地〉〉1) 巧-165)
[0380] -变量colPb指定覆盖colPic内部的由((xPCtr〉〉4) <<4,(yPCtr〉〉4) <<
[0381] 4)给定的经修改的位置的明度预测块。
[038引-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的同位图片的左上 方明度样本的由col化指定的同位明度预测块的左上方样本。
[0383] -使用cu;rrPb、colPic、colPb、(xPCol,yPCol)、mergeTMVP及refIdxLX作为输入来 调用如子条款8. 5. 3. 1.8中所指定的同位运动向量的导出过程,且将输出指派给mvLXCol 及availableFlagLXCol。
[0384] 8. 5. 3. 1. 8用于同位运动向量的导出过程 [03化]到该个过程的输入是
[0386] -指定当前预测块的currPb,
[0387] -指定同位图片的colPic,
[038引-指定由colPic指定的同位图片内部的同位预测块的colPb,
[0389] -指定相对于由colPic指定的同位图片的左上方明度样本的由col化指定的同位 明度预测块的左上方样本的明度位置(xPCol,yPCol),
[0390] -变量me;rgeTMVP,
[0391] -参考索引refldxLX(其中X为0或1)。
[039引该个过程的输出是
[039引-运动向量预测mvLXCo1,
[0394] -可用性旗标avail油leFlagLXCol。
[0395] 变量州rrPic指定当前图片。
[0396] 分别将阵列predFlagLXCol[X][y]、mvLXCol[X][y]及refldxLXCol[X][y]设定为 等于由colPic指定的同位图片的对应阵列PredFlagLX[x] [y]、MvLX[x] [y]及RefIdxLX[x] [y],其中X为该个过程所调用的X的值。
[0397] 如下导出变量mvLXCol及avail油leFlagLXCol。
[039引-如果在帖内预测模式中译码colPb,那么将mvLXCol的两个分量设定为等于0,且 将avail油leFlagLXCol设定为等于0。
[0399] -否贝IJ,如下导出运动向量mvCol、参考索引refIdxCol及参考列表识别符 listCol。
[0400] -如果predFlagLOCol[xPCol] [yPCol]等于 0,那么分别将mvCol、refIdxCol及 listCol设定为等于mvLlCol[xPCol] [yPCol]、refldxLlCol[xPCol] [yPCol]及LI。
[0401] -否则如果predFlagLOCol[xPCol] [yPCol]等于 1,且predFlagLlCol[xPCol] [yPCol]等于 0,那么分别将mvCol、refIdxCol及listCol设定为等于mvLOCol[xPCol] [yPCol]、refIdxLOCol[xPCol][yPCol]及LO。
[0402] -否则(predFlagLOCol[xPCol] [yPCol]等于 1,且predFlagLlCol[xPCol] [yPCol] 等于1),进行W下指派。
[0403] -如果对于当前切片的每一参考图片列表中的每一图片pic, DifTPicOrderQit(currPic,pic)小于或等于 0,那么分别将mvCol、refIdxCol及listCol 设定为等于mvLXCol[xPCol] [yPCol]、refIdxLXCol[xPCol] [yPCol]及LX,其中X为该个过 程所调用的X的值。
[0404]-否贝!J,分别将mvCol、refIdxCol及listCol设定为等于mvLNCol[xPCol] [yPCol]、refldxLNCol[xPCol] [yPCol]及LN,其中N为collocated_fr〇m_10_flag的值。 [04化]且如下导出mvLXCol及avail油leFlagLXCol。
[0406]-在[去除;"如果"化ongTermRe巧ic(州rrPic,州rrPb,refldxLX,LX)不等于Lo ngTermRe巧ickolPic,colPb,refIdxCol,listCol)时,W下情形适用
[0407]-如果refldxLXA大于0且mergeTMVP等于 1,那么将refldxLX设定为refldxLXA, 且将avail油leFlagLXCol设定为1。
[0408] -否则,将mvLXCol的两个分量设定为等于0,且将avail油leFlagLXCol设定为等 于0。
[0409]-[去除;"否则"]在将变量avail油leFlagLXCol设定为等于1时,将 re巧icListCoUrefldxCol]设定成具有含有图片colPic中的预测块currfb的切片的参考 图片列表listCol中的参考索引refIdxCol的图片,且W下情形适用。
[0410]colPocDiff=DiffPicOrderQit(colPic,refPicListCol[refIdxCol])巧-166)
[0411]州rrPocDiff=DifTPicOrderQit(currPic,Re巧icListX[refIdxLX])巧-167)
[0412] -如果Re巧icListX[refIdxLX]为长期参考图片,或colPocDiff等于 curr化cDiff,那么mvLXCol经导出为;
[0413]mvLXCol=mvCol 巧-168)
[0414] -否则,mvLXCol经导出为运动向量mvCol的经缩放版本,如下文所指定。
[04巧]tx= (16384+(Abs(td)〉〉1))/td (8-169)
[0416] distScaleFactor=Clip3(-4096, 4095,(tb*tx+32)〉〉6)
[0417] (8-170)mvLXCol=Clip3 (-32768, 32767,Sign(distScaleF'actor*mvCol) *((Abs (distScale化ctor*mvCol)+127)〉〉8)) 巧-171)
[041引其中td及忧经导出为
[0419]td=Clip3(-128, 127,colPocDiff) 巧-172)
[0420]忧=Clip3(-128, 127,currfocDiff) 巧-173)
[0421] 下文描述所提出的方法与用于3视图清理中的纹理视图译码的错相比的译码增 益。表1展示所
提出方法关于HTM4.0错的平均译码增益。由"仅视频"指示的列列出所有 S个纹理视图的译码增益,其中位率表示含有S个纹理视图的位流的总位率且PSNR值为 S个所表示纹理视图的平均PSNR值。也在此表中列出对于"视频1"和"视频2"的位率节 省。应注意,"视频0"对应于基础视图,而"视频1"及"视频2"指示非基础视图(仅纹理)。
[0422] 如表1中所示,对于所有纹理视图,总平均位率节省大约为0.94%,且非基础视图 的节省约2. 5%。
[0423] 表1-关于HTM4.0错的译码增益
[0424]
[04 巧]
[04%] 图7是说明根据本发明的技术的对视频数据块进行编码的实例方法的流程图。出 于解释的目的,关于图1及2的视频编码器20描述图7。然而,应理解,图7的方法可通过 用于编码视频数据的其它装置执行。同样,图7的方法的某些步骤可W不同次序或并行地 执行。
[0427] 虽然图7的实例中未展示,但视频编码器20最初可确定当前块的运动向量待使用 合并模式编码。视频编码器20可建构候选运动向量预测子集合,其表示空间上相邻块到当 前块W及另一图片中同位块到当前块的运动向量。同位块的运动向量表示时间运动向量预 测子(TMVP)的实例。举例来说,如图6中所示,当前块可对应于块104,同位块可对应于块 110,且运动向量116可表示块104的TMVP的实例。假定在图7的实例中,在使用合并模式 对当前块的运动向量进行编码时,视频编码器20选择TMVPW用于当前块。
[0428] 因此,视频编码器20可确定当前块的同位块(150)。视频编码器20可进一步确 定同位块的运动向量的参考索引(152)。同位块的运动向量的参考索引对应于同位块的运 动向量所指向的参考图片。在此实例中,假定同位块的运动向量为视差运动向量(即,视图 间运动向量),使得运动向量所指向的参考图片为视图间参考图片,其可表征为长期参考图 片。因此,同位块的运动向量的参考索引可对应于具有与包含同位块的图片相同的图片次 序计数(POC)值的参考图片。
[0429] 由于在具有相同POC值的图片之间启用视图间预测,所W在缺少本发明的技术的 情况下,同位块的运动向量将总体上被视为不可用于合并模式运动向量译码。也就是说,如 果同位块的运动向量用于严格合并模式中作为当前块的运动向量,那么当前块的运动向量 将指代参考图片的参考块,所述参考图片具有与包含当前块的当前图片不同的POC值。
[0430] 然而,使用本发明的技术,视频编码器20可获得额外参考索引的预定值(154)。举 例来说,视频编码器20可基于视频译码标准或对视频译码标准的扩展确定预定值,指派所 述值,从用户接收所述值,或W其它方式确定预定值。视频编码器20可随后确定额外参考 索引值(156),即等于预定值。举例来说,预定值可等于0(零)或-1(负一)。在一些实例 中,视频编码器20可在例如包含当前块的切片的切片标头、包含当前块的图片的图片参数 集(PPS)、包含图片的序列的序列参数集(SP巧及/或视频参数集(VP巧中对表示预定值的 数据进行编码。
[0431] 视频编码器20可随后使用额外参考索引建构当前块的运动向量(MV) (158)。在一 个实例中,视频编码器20可是当前块的运动向量承袭TMVP(例如,参考图片列表、水平运动 分量和垂直运动分量)的运动参数。一般来说,可通过水平运动分量和垂直运动分量来定 义运动向量,其中水平运动分量定义参考块相对于当前块的位置的水平位置,且垂直运动 分量定义参考块相对于当前块的位置的垂直位置。
[0432] 同样,参考图片列表为潜在参考图片的列表。参考索引标识待用于参考图片列表 中的实际参考图片。在常规合并模式中,参考索引及参考图片列表将承袭自运动向量预测 子。然而,根据本发明的技术,参考图片列表可承袭自运动向量预测子,但具有等于预定值 的值的额外参考索引可用于建构当前块的运动向量。因此,当前块的经建构运动向量可 具有等于TMVP的参考图片列表识别符的参考图片列表识别符、等于TMVP的水平运动分量 的水平运动分量、等于TMVP的垂直运动分量的垂直运动分量,及等于预定值的参考索引 ((即,额外参考索引)。
[0433] 视频编码器20可使用经建构的运动向量计算当前块的经预测块(160)。举例来 说,视频编码器20可使用经建构运动向量的参考图片列表和经建构运动向量的参考索引 识别参考图片,所述参考索引可等于预定值及额外参考索引。视频编码器20可随后将参考 图片中的参考块识别为处于当前块的位置处、水平地移位经建构运动向量的水平运动分量 并垂直地移位经建构运动向量的垂直运动分量。计算经预测块可进一步包含在运动向量具 有分数像素精确度时进行内插。
[0434] 视频编码器20可随后使用经预测块编码当前块(162)。举例来说,视频编码器20 可使用当前块的原始块与经预测块之间的逐像素差来计算残余块。视频编码器20可进一 步变换及量化残余块,随后对所得经量化变换系数进行滴编码。视频编码器20可进一步对 当前块的运动向量预测子(MV巧进行编码(164)。在此实例中,MVP索引对应于运动向量预 测子候选者集合中的TMVP候选者。同样,视频编码器20可对数据进行编码,所述数据指示 合并模式待用于译码当前块的运动向量且针对合并模式启用TMVP。
[04巧]W此方式,图7的方法表示一方法的实例,所述方法包含;确定第一目标参考索 弓I,其表示当前运动向量的候选运动向量预测子所指代的参考图片;针对候选运动向量预 测子并在当前运动向量的时间运动向量预测(TMVP)期间,确定等于预定值的额外目标参 考索引值;及至少部分地基于额外参考索引值对当前运动向量进行译码(即在此实例中进 行编码)。明确地说,第一目标参考索引可对应于TMVP的参考索引,所述TMVP对应于同位 块的运动向量。候选运动向量预测子可对应于TMVP。当前运动向量可对应于当前块的运动 向量。
[0436] 图8是说明根据本发明的技术的对视频数据块进行解码的实例方法的流程图。出 于解释的目的,关于图1及3的视频解码器30描述图8。然而,应理解,图8的方法可通过 用于解码视频数据的其它装置执行。同样,图8的方法的某些步骤可W不同次序或并行地 执行。
[0437] 最初,视频解码器30可对当前块的运动向量预测子(MV巧索引进行解码(180)。 另外,视频解码器30可对数据进行解码,所述数据指示合当前块的运动向量待使用合并模 式解码且针对合并模式启用时间运动向量预测。视频解码器30可随后确定经解码MVP索 引对应于同位块到当前块(182),所述同位块即具有与当前块相同或实质上相同的位置但 处于不同图片中的块。换句话说,MVP索引可对应于时间运动向量预测子(TMVP)。
[043引视频解码器30可随后确定同位块的运动向量的参考索引(184)。视频解码器30 还可获得额外参考索引的预定值(186)。举例来说,视频解码器30可根据包含当前块的切 片的切片标头、PPS、SPS、VI^S或其它此类传信数据确定预定值。视频解码器30可随后确定 额外参考索引值等于预定值(188)。
[0439]视频解码器30可随后使用额外参考索引建构当前块的运动向量(MV) (190)。如关 于图7所解释,视频解码器30可使当前块的运动向量从TMVP承袭参考图片列表识别符、水 平运动分量及垂直运动分量,但使用额外参考索引作为到由参考图片列表识别符所识别的 参考图片列表中,W确定其中发现当前块的参考块的参考图片。
[0440]因此,视频解码器30可使用经建构运动向量W使用经建构运动向量计算当前块 的经预测块(192)。举例来说,又如上文所解释,水平及垂直运动分量可定义参考图片中的 参考块相对于当前块位置的位置。此外,视频解码器30可在运动向量具有亚像素精确度时 执行像素内插。
[0441]视频解码器30可随后使用经预测块解码当前块(194)。举例来说,视频解码器30 可对来自位流的经量化变换系数进行解码。视频解码器30可随后对系数进行逆量化及逆 变换W再现当前块的残余块。接下来,视频解码器30可在逐像素基础上组合经预测块与残 余块来重构当前块。
[0442] W此方式,图8的方法表示一方法的实例,所述方法包含;确定第一目标参考索 弓I,其表示当前运动向量的候选运动向量预测子所指代的参考图片;针对候选运动向量预 测子并在当前运动向量的时间运动向量预测(TMV巧期间,确定等于预定值的额外目标参 考索引值;及至少部分地基于额外参考索引值对当前运动向量进行译码(即在此实例中进 行解码)。
[0443] 应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用 不同序列执行,可添加、合并或全部省略(例如,实践所述技术并不需要所有的所描述动作 或事件)。此外,在某些实施例中,可同时(例如,通过多线程处理、中断处理或多个处理器) 而非顺序地执行动作或事件。
[0444] 在一或多个实例中,所描述的功能可W用硬件、软件、固件或其任何组合来实施。 如果用软件实施,那么所述功能可W作为一或多个指令或代码在计算机可读媒体上存储或 传输,并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对 应于有形媒体,例如数据存储媒体,或包含任何促进将计算机程序从一处传送到另一处的 媒体(例如,根据通信协议)的通信媒体。W此方式,计算机可读媒体一般可W对应于(1) 有形计算机可读存储媒体,其为非暂时性的,或(2)通信媒体,例如信号或载波。数据存储 媒体可W是可由一或多个计算机或一或多个处理器存取W检索用于实施本发明中描述的 技术的指令、代码和/或数据结构的任何可用的媒体。计算机程序产品可包含计算机可读 媒体。
[0445]W实例说明而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用W存储呈指 令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。而且,任何连接被 恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线 值SL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那 么同轴电缆、光纤缆线、双绞线、D化或例如红外线、无线电和微波等无线技术包含在媒体的 定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号 或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用,磁盘和光盘 包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘值VD)、软性磁盘和藍光光盘,其 中磁盘通常W磁性方式再现数据,而光盘用激光W光学方式再现数据。上述各者的组合也 应包含在计算机可读媒体的范围内。
[0446] 指令可由一个或多个处理器执行,所述一或多个处理器例如是一或多个数字信号 处理器值SP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA),或其它 等效的集成或离散逻辑电路。因此,如本文中所使用的术语"处理器"可指上述结构或适合 于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文所描述 的功能性可W在经配置用于编码及解码的专用硬件及/或软件模块内提供,或者并入于组 合编码解码器中。而且,可将所述技术完全实施于一或多个电路或逻辑元件中。
[0447] 本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(1C) 或一组1C(例如,巧片组)。本发明中描述各种组件、模块或单元是为了强调经配置W执行 所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描 述,各种单元可W配合合适的软件和/或固件组合在一个编解码器硬件单元中,或者通过 互操作硬件单元的集合来提供,所述硬件单元包括如上文所描述的一或多个处理器。
[0448] 已描述各种实例。该些及其它实例在W下权利要求书的范围内。
【主权项】
1. 一种对视频数据进行译码的方法,所述方法包括: 确定第一目标参考索引,其表示当前运动向量的候选运动向量预测子所指代的参考图 片; 针对所述候选运动向量预测子并在所述当前运动向量的时间运动向量预测TMVP期 间,确定等于预定值的额外目标参考索引的值;及 至少部分地基于所述额外参考索引的所述值对所述当前运动向量进行译码。2. 根据权利要求1所述的方法,其中确定所述额外目标参考索引的所述值进一步包括 至少部分地基于所述预定值确定所述额外目标参考索引是否为可用的。3. 根据权利要求1所述的方法,其中所述额外参考索引包括到参考图片列表O的参考 索引值(refldxLOA)及到参考图片列表1的参考索引值(refldxLlA)中的一者。4. 根据权利要求1所述的方法, 其中译码包括使用合并模式译码所述当前运动向量,其包括: 从所述候选运动向量预测子承袭所述当前运动向量的运动参数,其中所述承袭的运动 参数包含参考图片列表识别符、水平运动分量及垂直运动分量;及 使用所述额外目标参考索引的所述值来识别所述当前运动向量在所述参考图片列表 中所指代的参考图片, 所述方法进一步包括使用所述水平运动分量、所述垂直运动分量及由所述额外目标参 考索引在所述参考图片列表中所识别的所述参考图片来译码当前块。5. 根据权利要求1所述的方法,其中确定所述额外目标参考索引的所述值包括仅在包 含所述当前运动向量的视频数据符合基础视频译码标准的扩展时确定所述额外目标参考 索引的所述值。6. 根据权利要求5所述的方法,其中所述基础视频译码标准包括高效视频译码HEVC, 并且其中所述扩展包括HEVC的多视图视频译码扩展MV-HEVC及HEVC的可缩放视频译码扩 展SHVC中的一者。7. 根据权利要求1所述的方法,其进一步包括:译码表示所述预定值的数据,其中所述 数据包括切片的数据,所述切片包含对应于所述当前运动向量的块。8. 根据权利要求7所述的方法,其中译码表示所述预定值的所述数据包含以下步骤中 的至少一者: 译码确认基础视频译码标准的扩展的所述切片的切片标头的一部分中的所述数据;及 译码符合所述基础视频译码标准的所述切片的所述切片标头的一部分中的所述数据。9. 根据权利要求1所述的方法,其进一步包括:在包含对应于所述当前运动向量的块 的图片的图片参数集PPS、包含所述图片的序列的序列参数集SPS及视频参数集VPS中的至 少一者中译码表示所述预定值的数据。10. 根据权利要求1所述的方法,其进一步包括:当所述预定值为非零值时,确定所述 额外目标参考索引值对应于参考图片,所述参考图片的类型不同于由参考索引〇所识别的 参考图片的类型。11. 根据权利要求1所述的方法,其中译码所述运动向量包括解码所述运动向量,所述 方法进一步包括使用所述运动向量解码当前块。12. 根据权利要求1所述的方法,其中译码所述运动向量包括编码所述运动向量,所述 方法进一步包括使用所述运动向量编码当前块。13. -种用于译码视频数据的装置,所述装置包括视频译码器,其经配置以进行以下操 作:确定第一目标参考索引,所述第一目标参考索引表示当前运动向量的候选运动向量预 测子所指代的参考图片;针对所述候选运动向量预测子并在所述当前运动向量的时间运动 向量预测TMVP期间,确定等于预定值的额外目标参考索引的值;及至少部分地基于所述额 外参考索引的所述值对所述当前运动向量进行译码。14. 根据权利要求13所述的装置,其中所述视频编译码器经配置以使用其中所述当前 运动向量从所述候选运动向量预测子承袭运动参数的合并模式来译码所述当前运动向量, 其中所述承袭的运动参数包含参考图片列表识别符、水平运动分量及垂直运动分量,且其 中所述视频译码器经配置以使用所述额外目标参考索引的所述值来识别所述当前运动向 量在所述参考图片列表中所指代的参考图片并使用所述水平运动分量、所述垂直运动分量 及由所述额外目标参考索引在所述参考图片列表中识别的所述参考图片来译码当前运动 块。15. 根据权利要求13所述的装置,其中所述视频译码器经配置以仅在包含所述当前运 动向量的视频数据符合基础视频译码标准的扩展时确定所述额外目标参考索引的所述值。16. 根据权利要求13所述的装置,其中所述视频译码器经配置以对表示所述预定值的 数据进行译码,其中所述数据包括包含对应于所述当前运动向量的块的切片的数据、包含 所述块的图片的图片参数集PPS、包含所述图片的序列的序列参数集SPS及视频参数集VPS 的数据中的至少一者。17. 根据权利要求13所述的装置,其中所述视频译码器经配置以在所述预定值为非零 值时确定所述额外目标参考索引值对应于参考图片,所述参考图片的类型不同于由参考索 引〇所识别的参考图片的类型。18. 根据权利要求13所述的装置,其中所述视频译码器包括视频解码器和视频编码器 中的至少一者。19. 一种用于对视频数据进行译码的装置,所述装置包括: 用于确定第一目标参考索引的装置,所述第一目标参考索引表示当前运动向量的候选 运动向量预测子所指代的参考图片; 用于针对所述候选运动向量预测子并在所述当前运动向量的时间运动向量预测TMVP期间确定等于预定值的额外目标参考索引的值的装置;及 用于至少部分地基于所述额外参考索引的所述值对所述当前运动向量进行译码的装 置。20. 根据权利要求19所述的装置,其中所述用于译码的装置包括用于使用合并模式译 码所述当前运动向量的装置,其包括: 用于从所述候选运动向量预测子承袭所述当前运动向量的运动参数的装置,其中所述 承袭的运动参数包含参考图片列表识别符、水平运动分量及垂直运动分量;及 用于使用所述额外目标参考索引的所述值来识别所述当前运动向量在所述参考图片 列表中所指代的参考图片的装置, 所述装置进一步包括用于使用所述水平运动分量、所述垂直运动分量及由所述额外目 标参考索引在所述参考图片列表中所识别的所述参考图片来译码当前块的装置。21. 根据权利要求19所述的装置,其中用于确定所述额外目标参考索引的所述值的所 述装置包括用于仅在包含所述当前运动向量的视频数据符合基础视频译码标准的扩展时 确定所述额外目标参考索引的所述值的装置。22. 根据权利要求19所述的装置,其进一步包括用于对表示所述预定值的数据进行译 码的装置,其中所述数据包括包含对应于所述当前运动向量的块的切片的数据、包含所述 块的图片的图片参数集PPS、包含所述图片的序列的序列参数集SPS及视频参数集VPS的数 据中的至少一者。23. 根据权利要求19所述的装置,其进一步包括用于在所述预定值为非零值时确定所 述额外目标参考索引值对应于参考图片的装置,所述参考图片的类型不同于由参考索引〇 所识别的参考图片的类型。24. 根据权利要求19所述的装置,其中所述用于译码的装置包括用于解码所述当前运 动向量的装置及用于编码所述当前运动向量的装置中的至少一者。25. -种其上存储有指令的计算机可读存储媒体,所述指令在执行时致使处理器执行 以下操作: 确定第一目标参考索引,其表示当前运动向量的候选运动向量预测子所指代的参考图 片; 针对所述候选运动向量预测子并在所述当前运动向量的时间运动向量预测TMVP期 间,确定等于预定值的额外目标参考索引的值;及 至少部分地基于所述额外参考索引的所述值对所述当前运动向量进行译码。26. 根据权利要求25所述的计算机可读存储媒体,其中使所述处理器进行译码的所述 指令包括使所述处理器使用合并模式译码所述当前运动向量的指令,其包括使所述处理器 进行以下操作的指令: 从所述候选运动向量预测子承袭所述当前运动向量的运动参数,其中所述承袭的运动 参数包含参考图片列表识别符、水平运动分量及垂直运动分量;及 使用所述额外目标参考索引的所述值来识别所述当前运动向量在所述参考图片列表 中所指代的参考图片, 所述指令进一步包括使所述处理器进行以下操作的指令:使用所述水平运动分量、所 述垂直运动分量及由所述额外目标参考索引在所述参考图片列表中所识别的所述参考图 片来译码当前块。27. 根据权利要求25所述的计算机可读存储媒体,其中使所述处理器确定所述额外目 标参考索引的所述值的所述指令包括使所述处理器仅在包含所述当前运动向量的视频数 据符合基础视频译码标准的扩展时确定所述额外目标参考索引的所述值的指令。28. 根据权利要求25所述的计算机可读存储媒体,其进一步包括使所述处理器对表 示所述预定值的数据进行译码的指令,其中所述数据包括包含对应于所述当前运动向量的 块的切片的数据、包含所述块的图片的图片参数集PPS、包含所述图片的序列的序列参数集 SPS及视频参数集VPS的数据中的至少一者。29. 根据权利要求25所述的计算机可读存储媒体,其进一步包含使处理器在所述预定 值为非零值时确定所述额外目标参考索引值对应于参考图片的指令,所述参考图片的类型 不同于由参考索引〇所识别的参考图片的类型。
【专利摘要】在一实例中,一种用于译码视频数据的装置包含视频译码器,其经配置以进行以下操作:确定第一目标参考索引,所述第一目标参考索引表示当前运动向量的候选运动向量预测子所指代的参考图片;针对所述候选运动向量预测子并在所述当前运动向量的时间运动向量预测TMVP期间,确定等于预定值的额外目标参考索引的值;及至少部分地基于所述额外参考索引的所述值对所述当前运动向量进行译码。
【IPC分类】H04N19/46, H04N19/597, H04N19/51, H04N19/583
【公开号】CN104904217
【申请号】CN201380069438
【发明人】陈颖, 王益魁
【申请人】高通股份有限公司
【公开日】2015年9月9日
【申请日】2013年12月31日
【公告号】EP2941881A1, US20140185682, WO2014107454A1