浅析音频视频编码标准（AVS3）的块分割方法和编码单元树形状

工程师邓生 2022-09-02 4050

电子说

1.4w人已加入

在本文中，我将回顾第三代音频视频编码标准（AVS3）的块分割方法和编码单元树形状。

编码单元树

AVS3是在其前身AVS2的基础上开发的，其目标之一是适应对超高清内容（4K、8K）不断增长的需求。

视频编码

Audio Video Standard 是一个基于块的视频编码框架。对于块分区，AVS2仅使用四叉树方案（图1），这对于8k 视频效率不高。为了解决这个问题，AVS3开发了一种更灵活的分区方案：四叉树(QT)、二叉树(BT) 和扩展四叉树(EQT)（图 2）。

视频编码

对于每个最大的编码单元，首先使用一个比特来指示大编码单元（LCU）是否被划分为QT。如果不是，则再使用一位来表示LCU 是分为EQT 还是 BT（图3）。一旦编码单元被划分为BT或EQT，QT就不能用于后续的划分过程。

视频编码

内部派生树

AVS3 具有将帧内编码单元拆分为更小的预测单元的附加模式。它只分割亮度分量。CU可以垂直或水平分成4个PU。有六种拆分模式；您可以在图4 中看到它们。就对称性而言，派生模式可以细分为两类：

对称模式：2N×hN和hN×2N，旨在提高边信息的信令效率

非对称模式：2N×nU、2N×nD、nL×2N和nR×2N，旨在提高分区结构对非对称纹理的灵活性

对于非对称模式（2MxnD、2MxnU、nLx2N、nRx2N），应该提到一件事——它们最初被分成2 个PU：大的和小的。然后将大PU拆分为三个具有相同参数的子PU；结果，有3+1 个PU。这样，由于预测样本和参考样本之间的相关性更强，可以提高预测精度。

此外，当使用 DT时，变换单元被迫根据预测单元进行拆分。

视频编码

DT 内标志在 CU级别发出信号。当内部DT 标志为真时，随后传输拆分方向和拆分类型。

Intra DT 仅适用于 luma分量，因此色度没有被分割，色度PU 保持与 CU相同的大小。这是图 5中的示例。

视频编码

色度树拆分限制

AVS3对分割色度分量有特殊限制-色度两侧在色度下采样分辨率下至少应为4个像素（在亮度分辨率下为8个像素）。如果分区可以创建更小的色度块，则不执行色度拆分。因此色度编码块仍然大于分割的亮度块（图5、图6）。

视频编码

非矩形块分裂

对于帧间块有特殊的角加权预测(AWP) 模式，对于帧内块有空间角加权预测(SAWP) 的特殊模式，其作用类似于通过斜线将CU 分成两个PU。最初，每个部分都使用不同的预测参数进行预测；然后使用由平滑过渡的斜线生成的权重掩码将它们组合起来（图7）。对这些模式的更详细的回顾在单独的文章中给出。

视频编码

审核编辑：刘清

打开APP阅读更多精彩内容