浅析音频视频编码标准(AVS3)的块分割方法和编码单元树形状

电子说

1.3w人已加入

描述

在本文中,我将回顾第三代音频视频编码标准(AVS3)的块分割方法和编码单元树形状。

编码单元树

AVS3是在其前身AVS2的基础上开发的,其目标之一是适应对超高清内容(4K、8K)不断增长的需求。

  音频编码

Audio Video Standard 是一个基于块的视频编码框架。对于块分区,AVS2仅使用四叉树方案(图1),这对于8k 视频效率不高。为了解决这个问题,AVS3开发了一种更灵活的分区方案:四叉树(QT)、二叉树(BT) 和扩展四叉树(EQT)(图 2)。

  音频编码

对于每个最大的编码单元,首先使用一个比特来指示大编码单元(LCU)是否被划分为QT。如果不是,则再使用一位来表示LCU 是分为EQT 还是 BT(图3)。一旦编码单元被划分为BT或EQT,QT就不能用于后续的划分过程。

  音频编码

内部派生树

AVS3 具有将帧内编码单元拆分为更小的预测单元的附加模式。它只分割亮度分量。CU可以垂直或水平分成4个PU。有六种拆分模式;您可以在图4 中看到它们。就对称性而言,派生模式可以细分为两类:

对称模式:2N×hN和hN×2N,旨在提高边信息的信令效率

非对称模式:2N×nU、2N×nD、nL×2N和nR×2N,旨在提高分区结构对非对称纹理的灵活性

对于非对称模式(2MxnD、2MxnU、nLx2N、nRx2N),应该提到一件事——它们最初被分成2 个PU:大的和小的。然后将大PU拆分为三个具有相同参数的子PU;结果,有3+1 个PU。这样,由于预测样本和参考样本之间的相关性更强,可以提高预测精度。

此外,当使用 DT时,变换单元被迫根据预测单元进行拆分。

  音频编码

DT 内标志在 CU级别发出信号。当内部DT 标志为真时,随后传输拆分方向和拆分类型。

Intra DT 仅适用于 luma分量,因此色度没有被分割,色度PU 保持与 CU相同的大小。这是图 5中的示例。

  音频编码

色度树拆分限制

AVS3对分割色度分量有特殊限制-色度两侧在色度下采样分辨率下至少应为4个像素(在亮度分辨率下为8个像素)。如果分区可以创建更小的色度块,则不执行色度拆分。因此色度编码块仍然大于分割的亮度块(图5、图6)。

  音频编码

非矩形块分裂

对于帧间块有特殊的角加权预测(AWP) 模式,对于帧内块有空间角加权预测(SAWP) 的特殊模式,其作用类似于通过斜线将CU 分成两个PU。最初,每个部分都使用不同的预测参数进行预测;然后使用由平滑过渡的斜线生成的权重掩码将它们组合起来(图7)。对这些模式的更详细的回顾在单独的文章中给出。

  音频编码



审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分