一文搞懂图像RGB和YUV编码及相互转换

硬件花园 2023-06-28 13512

描述

1 色彩空间和色彩模型

色彩是人眼对于不同频率的光线的不同感受。色彩既是客观存在的，但又是主观感知的，所以不同人对色彩的感知会存在差异。为了规范色彩的表述，引入了色彩空间一词。 “色彩空间”源于西方的“Color Space”，又称作“色域”，色彩学中，人们建立了多种色彩模型，以一维、二维、三维甚至四维空间坐标来表示某一色彩，这种坐标系统所能定义的色彩范围即色彩空间。我们经常用到的色彩空间主要有RGB、CMYK、Lab等。

色彩空间

色彩模型是描述使用一组值（通常使用三个、四个值或者颜色成分）表示颜色方法的抽象数学模型。例如三原色光模式(RGB) 和印刷四分色模式(CMYK) 都是色彩模型。

不同的色彩模型的差异和优劣不在本文讨论范围之内。本文主要讨论YUV和RGB两种色彩模型的相关知识。

2 RGB色彩模型

我们知道， “色彩” 是人类大脑对事物的一种主观感觉，为了将这种 “感性” 进行 “理性” 描述，数学家们创建了 RGB 模型的概念：通过三个数的组合（色值）来表述某一种特定的颜色，从而人类可以将这种感性的色彩感受进行理性地表达和传递。

2.1 RGB三原色

RGB和CMY

rgb(255, 0, 0) 代表纯红色，rgb(0, 255, 0) 代表纯绿色，rgb(0, 0, 255) 代表纯蓝色，而 rgb(255, 255, 0) 代表纯黄色（光学中红色和绿色加法混合会呈现黄色）。

RGB三原色通过 RGB 色彩模型，我们最多能表示出256x256x256=16777216种不同的色值，也就是我们常说的1600万色。

如果我们创建一个三维坐标系，三个轴的代表字母由X、Y、Z换成 R、G 和 B，即用 Red 代表X轴，Green代表Y轴，Blue代表Z轴，采用光学加法混色的方式构建这个立方空间的话，就形成了一个基于RGB模型的色彩空间了。

RGB三原色立体空间

我们知道通过 rgb(x, y, z) 这种方式构建的每一个颜色点，都对应于这个立方体中的某一个点，也就是说每一种颜色都被包含在我们的色彩空间之内。

2.2 RGB颜色模型存在的问题

因为在自然环境下获取的图像容易受自然光照、遮挡和阴影等情况的影响，即对亮度比较敏感，而RGB 颜色空间的三个分量都与亮度密切相关，即只要亮度改变，三个分量都会随之相应地改变。

另外，RGB 颜色空间是一种均匀性较差的颜色空间，人眼对于这三种颜色分量的敏感程度是不一样的，在单色中，人眼对红色最不敏感，蓝色最敏感，如果颜色的相似性直接用欧氏距离来度量，其结果与人眼视觉会有较大的偏差。对于某一种颜色，我们很难推测出较为精确的三个分量数值来表示。

而且，在视频领域如果使用RGB存储的话，视频数据会非常大。

比如有一个1080p（1920*1080）分辨率、帧率为30帧的视频，如果使用RGB进行存储的话，仅仅一分钟的视频就能达到 (1920*1080*8*30*60）bit（约等于27G）。这明显是不现实的，所以我们需要对视频数据进行压缩。

基于以上两点，所以我们需要一种数据相关性没那么强的颜色编码系统或色彩空间，而YUV正好就是这样，从下面的介绍中我们就会明白。YUV能够方便地编码和传输，并且减少带宽占用和信息出错。

3 YUV色彩模型

我们先回到人类刚拥有彩色电视的时候，在那段从黑白电视向彩色电视的过渡期，电视系统需要提供对黑白电视的兼容性（在一文搞懂HDMI/DP/DVI/VGA显示器接口历史演进提到过），另外还要考虑到电视广播系统那有限的带宽，如果使用RGB颜色模型，那么传输带宽就是原来的三倍。

所以能够兼容黑白电视系统和更为节省带宽的YUV色彩模型就被发明了出来，它与RGB之间是无损转换的。第4节，会介绍不同标准下YUV与RGB如何相互转换。

因为相较于色彩，人眼对于亮度信息更为敏感，所以可以在色彩信息上面进行取舍来达到节约大小的目的，通过引入色度二次采样（subsampling）的方式，YUV对原始的RGB信息进行重编码。

亮度信息与色彩信息相分离的设计使得YUV可以减少一些色彩信息以达到节省传输带宽和保存体积的目的。这也是YUV颜色模型相比于RGB颜色模型的优势所在。

YUV同样使用三个分量来存储数据，他们分别是

Y：用于表示明亮度（Luminance或Luma）；

U：用于表示色度（Chrominance或Chroma）；

V：用于表示色度（Chrominance或Chroma）；

Y其实就是我们常说的灰度值，是图片的总体轮廓，而U和V则用于描述色彩颜色和颜色饱和度。

一张色彩艳丽的图片如果存储成YUV格式的话，Y就是这张图的黑白照、UV就是涂上颜色。

3.1 YUV图像处理流水线pipeline

YUV图像处理流水线

3.2 YUV色度抽样方式

常见的YUV图像色度抽样方式有如下三种：YUV 444、YUV 422、YUV420。

不同类型之间的主要区别是使用了不同的方式进行U、V分量的采样。

YUV采样方式

如上图所示，其中实心黑点表示像素点的Y分量，空心圆圈表示采用该像素点的UV分量。

可见：

YUV 444：每个Y分量分别对应一个U分量和一个V分量

YUV 422：每两个Y分量共用一个U分量和一个V分量

YUV 420：每四个Y分量共用一个U分量和一个V分量

YUV色度抽样方式

YUV444和RGB颜色模型的图像大小是一样的，并没有节省存储空间。当RGB图像转换为YUV图像时，也是先转换为YUV444采样方式的图像。

YUV42和RGB颜色模型图像大小相比，节省了三分之一的存储空间，在传输时占用的带宽也会随之减少。

YUV420采样方式，Y平面的信息完全保留，而UV这两个色度平面的信息交错保留，并且精度只有Y平面的一半，最终图像、视频的体积也就少了很多，而画质损失实际是被控制在一个合理的范围内。

由此，可得出对于一张1280*720大小的图片，采用YUV420采样比YUV 422、YUV444、RGB采样的图像节省的空间最大，所以现在最常见的就是YUV420采样方式。

3.3 YUV的存储方式

YUV有packed（打包）和 planar（平面）两种存储方式。

packed ：packed格式是先连续存储所有的Y分量，然后依次交叉储存U、V分量；

planar：planar格式也会先连续存储所有的Y分量，但planar会先连续存储U分量的数据，再连续存储V分量的数据，或者先连续存储V分量的数据，再连续存储U分量的数据；将YUV分量分别存储到矩阵，每一个分量矩阵称为一个平面。

3.4 YUV颜色编码格式

由于色度抽样方式和存储方式的不同，YUV衍生出很多种格式。

注意下文中所述，YUV和YCbCr对应关系，Y对应Y，U对应Cb，V对应Cr。

3.4.1基于YUV422采样的格式

YUYV格式和UYVY格式采用打包packed存储方式。

YVUV格式

YVUV为YUV422采样的存储格式，相邻的两个Y共用其相邻的两个Cb、Cr。对于像素点Y’00、Y’01而言，其Cb、Cr的值均为Cb00、Cr00,其他的像素点YUV取值依此类推。

UYVY格式

UYVY格式与YVUV不同的是，UV即Cb、Cr排列顺序不一样，还原其每个像素点的YUV值的方法与上面一样。

YUV422P格式

YUV422P格式，又叫做I422，采用的是平面格式进行存储，先存储所有的Y分量，再存储所有的U分量，再存储所有的V分量。

3.4.2.基于YUV420采样的格式

YUV420是以平面方式(planar)存储，色度抽样为40的色彩编码格式。其中YUV420P为三平面存储，YUV420SP为两平面存储。

常见的yuv格式列表如下:

I420: YYYYYYYY UU VV =>YUV420P，主要用来远程传输

YV12: YYYYYYYY VV UU =>YUV420P，先Y再V再UYU12: YYYYYYYY UU VV =>YUV420P，先Y再U再V

YV12和YU12，分别将Y、U、V打包，依次存储。其中每一个像素点的YUV数据提取遵循YUV420格式的提取方式，即4个Y分量共用一组UV。注意，上图中，Y’00、Y’01、 Y’10、Y’11共用Cb00、Cr00，其他依此类推。

NV12: YYYYYYYY UVUV =>YUV420SP //IOS中有的模式

NV21: YYYYYYYY VUVU =>YUV420SP //安卓Camera默认格式

NV12和UV21是一种两平面存储方式，Y为一个平面，交错的UV为另一个平面。提取方式与YU12和YV12类似，即Y’00、Y’01、 Y’10、Y’11共用Cb00、Cr00，其他依此类推。

4 YUV与RGB之间的转换

YUV与RGB之间的转换是存在标准的，常见的标准有：

ITU-R BT.601（标清）

ITU-R BT.709（高清）

ITU-R BT.2020（超高清）

不同的标准有不同的转换公式，同时还要区分不同的Color Range。Color Range用于指定RGB分量的取值范围，可分为Full Range（取值范围为0255）和Limited Range（取值范围为16235）。

BT.601, LimitedRange, which is the standard for SDTV（标清数字电视）

RGB —> YUV

Y = 0.299R+0.587G+0.114B

V = 0.713(R−Y)=0.500R−0.419G−0.081B

U = 0.564(B−Y)=−0.169R−0.331G+0.500B

YUV —> RGB

R = 1.164Y+1.596V-0.871;

G = 1.164Y-0.813V-0.391U+0.529;

B = 1.164Y+2.018U-1.0729;

BT.601, Full Range

RGB —> YUV

Y = 0.299 * R + 0.587 * G + 0.114 * B 　　　

V = -0.169 * R - 0.331 * G + 0.500 * B

U = 0.500 * R - 0.439 * G - 0.081 * B

YUV —> RGB

R = Y + 1.400V - 0.7

G = Y - 0.343U - 0.711V + 0.526

B = Y + 1.765U - 0.883

BT.709, which isthe standard for HDTV（高清电视）

RGB —> YUV

Y = 0.0627 + 0.183 * R + 0.614 * g + 0.062 * b

U = 0.5 - 0.101 * R - 0.339 * g + 0.439 * b

V = 0.5 + 0.439 * R - 0.399 * g - 0.040 * b

YUV —> RGB

R = 1.164Y + 1.739V - 0.97

G = 1.164Y - 0.213U - 0.533V + 0.301

B = 1.164Y + 2.112U - 1.129

接下来，以图像处理课程里面经常会出现的一张图片，作为示例，演示YUV与RGB之间的转换。

1. 从YUV420P图像中提取Y、U、V分量

YUV420P图像

从左往右依次为Y、U、V分量

2. 将YUV420P图像转换为RGBA8888图像

YUV 图像

YUV转换为RGBA8888

《一文搞懂》系列文章一文搞懂HDMI/DP/DVI/VGA显示器接口历史演进一文搞懂USB各个版本的历史演进一文搞懂高速TIA跨阻放大器设计一文搞懂电阻，这篇讲得很全面，建议收藏一文搞懂共模电感原理一文搞懂MLCC电容的特性及生产工艺流程一文搞懂电感Isat、Irms以及测量方法

本号对所有文章陈述的观点均保持中立，文章仅供读者交流学习。资讯、图片来源网络，版权归原作者所有，侵权请联系删除。

审核编辑黄宇

打开APP阅读更多精彩内容