数字音视频压缩编码标准及H.265的编码优势

温少龙 2020-05-02 2767

今日头条

1194人已加入

描述

在制定数字音视频压缩编码标准的过程中，联合图像专家组(Joint Photographic Experts Group, JPEG)、动态图像专家组(Moving Pictures Experts Group, MPEG)和视频编码专家组(Video Coding ExpertGroup, VCEG)发挥了至关重要的推动作用。下面介绍下数字音视频压缩编码都有哪些标准。

1、MJPEG和MJPEG2000系列

JPEG是在国际标准化组织(International Organization for Standardization, ISO)和国际电话电报咨询委员会(Consultation Committee of the International Telephone and Telegraph,CCITT)内运作的一个工作组。在视频压缩方面,JPEG先后编制了MJPEG和MJPEG2000。MJPEG是在JPEG基础发展起来的动态图像压缩技术,它只单独地对某一帧进行压缩。而基本不考虑视频流中不同帧之间的变化。使用该技术可获取清晰度很高的视频图像,而且可灵活设置每路的视频清晰度和压缩帧数。其压缩后的画面还可被任意剪接。同样格式的MJPEG视频压缩不同于帧间压缩,因为压缩比特率比较低,所以编码与解码相对比较容易,并不需要过多的运算能力,也使得软件或者芯片可以十分容易地对MJPEG进行编辑。正因为此,一些移动设备,如数码相机使用MJPEG来进行短片的编码。但其缺陷也非常明显:其一,丢帧现象严重、实时性差,在保证每路都必须是高清晰的前提下,很难完成实时压缩;其二,压缩效率低,占用存储空间较大。

MJPEG 2000是JPEG 2000标准中的第三部分,它是在标准中第一部分的基础上对运动图像进行编解码的压缩标准。MJPEG 2000是一种针对图像序列的标准,在一个单独编解码器中同时支持无损和有损压缩。它允许一个或多个JPEG 2000压缩图像序列与声音、元数据同步后,存储为MJ2的文件格式。

2.MPEG系列

MPEG-1是MPEG制定的第一个视频和音频有损压缩标准，也是最早推出及应用在市场上的MPEG技术,其原来的主要目标是在CD光盘上记录影像，后来被广泛应用在VCD光盘中。1992年年底，MPEG-1正式被批准成为国际标准。MPEG-1可针对标准图像格式(Standard Image Format,SIF)的标准分辨率(对于NTSC制式为352x240;对于PAL制式为352x288)的图像进行压缩,传输速率为1.5Mb/s,每秒播放30帧,具有CD音质,质量级别基本与家用录像系统(Video Home System,VHS)相当。MPEG-1的编码速率最高可达4~5Mb/s,但随着速率的提高,其解码后的图像质量有所降低。

MPEG-2制定于1994年，其设计目标是提供高级工业标准的图像以及更高的传输率。它是为HDTV和DVD等制定的3~10Mb/s的运动图像及其伴音的编码标准。MPEG-2技术的主要特点包括:同时支持隔行扫描输入和逐行扫描输入;提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量以及带宽的要求。MPEG-2根据视频编码技术的复杂度,将各类应用划分为不同的档次(profile)和级别(level),档次和级别的概念解决了比特流的可交换性和国际性。MPEG-2增加了可分级编码特性,允许从一个编码数据流中得到不同质量等级或不同时空分辨率的视频信号。

MPEG-4于2000年年初正式成为国际标准。MPEG-4的设计目标就是提供低比特率下的多媒体通信。MPEG-4与之前的标准相比更适于交互AVS服务以及远程监控,更加注重多媒体系统的交互性和灵活性。MPEG-4的压缩方法可以根据应用需求选取合适的算法进行系统裁剪。

MPEG-7设计的目的就是解决海量的图像和声音信息与快速检索之间的矛盾。MPEG-7被称为多媒体内容描述接口,其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推拉应用的需求。MPEG-7扩展了现有标识内容的专用方案及相关功能，包含了更多的多媒体数据类型。

MPEG-21设计的目标是将不同的协议、标准和技术等有机地融合在一起,同时制定新的标准。MPEG-21致力于为多媒体传输和使用定义一个标准化的、可互操作的和高度自动化的开放框架。MPEG-21的基本框架要素包括数字项目的识别和描述、内容表示、数字项目说明、内容管理与使用、知识产权管理和保护、终端、网络和事件报告等部分。

3.H.26x系列

H.261是VCEG制定的一个视频编码标准,属于视频编解码器部分。H.261是第一个实用的数字视频编码标准。其设计的目的是在带宽为64Kb/s的综合业务数字网上传输质量可靠的视频信号。H.261使用了混合编码框架。H.261仅对与兼容性有关的码元语法、码元复用、解码过程等做了严格的限制性规定,而对复原图像质量指标有重要影响但不影响兼容性的部分未做限制性规定，给开发者、厂商和用户提供了很大的应用空间。

H.263是VC++EG的一个标准草案,是为低码流通信而设计的。它提供了4种可选的编码算法:无限制的运动矢量模式、先进预测模式、PB帧模式和基于语义的算术预测模式。H.263+是H.263的第二个版本。H.263+提供了12个新的可协商模式和其他功能,如高级帧内编码、去块效应滤波、参考帧选择、SNR/时域/空域可分级性等，进一步提高了压缩编码性能。H.263+允许使用更多的源格式，对于图像时钟频率也有多种选择，拓宽了应用范围;另-重要的改进是可扩展性,它允许多设置速率及多分辨率,增强了视频信息在易误码、易包异构网络环境下的传输,并且还允许在码流内加入许多附加的信息，大大方便了用户的操作。H.263C++是H.263的第三版本,H.263C++在视频流的抗误码方面增加了不少功能,增加了可逆VLC编码和基于数据分类的抗误码组合,同时扩展了参考帧选择模式;增强了抗误码系统的健壮性。

H.26L设计目的是对多种图像信源实现低比特率、实时和低延迟的视频编码。H.26L是H.264的雏形。H.264同时也是MPEG-4中的第十部分。H.264作为新一代视频压缩算法，吸收了以往各种编码方案特别是MPEG-2和H.263C++的优点，并在语法结构、编码预测算法、数据变换输出方式等方面进行了很多改进,其性能得到了很大的提高。其编解码流程主要包括5个部分:帧间和帧内预测、变换和反交换、量化和反量化、环路滤波、熵编码。H.264具有低码流、高质量的图像、容错能力强、网络适应性强等特点。

作为新一代视频编码标准，HEVC(H.265)仍然属于 "预测加变换"的混合编码框架。然而，相对于H.264, H.265 在很多方面有了革命性的变化。

灵活的编码结构

在H.265中，将宏块的大小从H.264的16X16扩展到了64X64,以便于对高分辨率视频格式的压缩。同时，采用了更加灵活的编码结构来提高编码效率，包括编码单元、预测单元何变换单元。

灵活的块结构—RQT

RQT(Residual Quad-tree Transform)是一种自适应的变换技术，这种思想是对H.264/AVC中ABT(Adaptive Block-size Transform)技术的延伸和扩展。对于帧间编码来说，它允许变换块的大小根据运动补偿块的大小进行自适应的调整；对于帧内编码来说，它允许变换块的大小根据帧内预测残差的特性进行自适应地调整。

大块的变换相对于小块的变换，一方面能够提供更好的能量集中效果，并能在量化后保存更多的图像细节，但是另一方面在量化后却会带来更多的振铃效应。因此，根据当前块信号的特性，自适应地选择变换块大小。

采样点自适应偏移

SAO(Sample Adaptive Offset)在编解码环路内，位于Deblock 之后，通过对重建图像的分类，对每一类图像像素值加减一个偏移，达到减少失真的目的，从而提高压缩率、减少码流。采用SAO后，平均可以减少2%~6%的码流，而编码器和解码器的性能消耗仅增加了约2%。

自适应环路滤波

ALF(Adaptive Loop Filter)在编解码环路内，位于Deblock和SAO之后，用于恢复重建图像以达到重建图像与原始图像之间的均方差(MSE)最小。ALF 的系数是在帧级计算和传输的，可以整帧应用ALF,也可以对于基于块或基于量化树（Quadtree)的部分区域进行ALF,如果是基于部分区域的ALF,还必须传递指示区域信息的附加信息。

并行化设计

当前芯片架构已经从单核性能逐渐往多核并行方向发展，因此为了适应并行化程度非常高的芯片实现，HEVC/H265引入了很多并行运算的优化思路，克服了H.264的缺陷。

打开APP阅读更多精彩内容