数据压缩的重要性

Shirleykwan 2018-02-28 15532

电子说

1.4w人已加入

描述

数据压缩是指在不丢失有用信息的前提下，缩减数据量以减少存储空间，提高其传输、存储和处理效率，或按照一定的算法对数据进行重新组织，减少数据的冗余和存储的空间的一种技术方法。数据压缩包括有损压缩和无损压缩。

在计算机科学和信息论中，数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元（或者其它信息相关的单位）表示信息的过程。例如，如果我们将“compression”编码为“comp”那么这篇文章可以用较少的数据位表示。一种流行的压缩实例是许多计算机都在使用的ZIP 文件格式，它不仅仅提供了压缩的功能，而且还作为归档工具（Archiver）使用，能够将许多文件存储到同一个文件中。

对于任何形式的通信来说，只有当信息的发送方和接受方都能够理解编码机制的时候压缩数据通信才能够工作。例如，只有当接受方知道这篇文章需要用英语字符解释的时候这篇文章才有意义。同样，只有当接受方知道编码方法的时候他才能够理解压缩数据。一些压缩算法利用了这个特性，在压缩过程中对数据进行加密，例如利用密码加密，以保证只有得到授权的一方才能正确地得到数据。

数据压缩能够实现是因为多数现实世界的数据都有统计冗余。例如，字母“e”在英语中比字母“z”更加常用，字母“q”后面是“z”的可能性非常小。无损压缩算法通常利用了统计冗余，这样就能更加简练地、但仍然是完整地表示发送方的数据。

如果允许一定程度的保真度损失，那么还可以实现进一步的压缩。例如，人们看图画或者电视画面的时候可能并不会注意到一些细节并不完善。同样，两个音频录音采样序列可能听起来一样，但实际上并不完全一样。有损压缩算法在带来微小差别的情况下使用较少的位数表示图像、视频或者音频。

由于可以帮助减少如硬盘空间与连接带宽这样的昂贵资源的消耗，所以压缩非常重要，然而压缩需要消耗信息处理资源，这也可能是费用昂贵的。所以数据压缩机制的设计需要在压缩能力、失真度、所需计算资源以及其它需要考虑的不同因素之间进行折衷。

一些机制是可逆的，这样就可以恢复原始的数据，这种机制称为无损数据压缩；另外一些机制为了实现更高的压缩率允许一定程度的数据损失，这种机制称为有损数据压缩。

然而，经常有一些文件不能被无损数据压缩算法压缩，实际上对于不含可以辨别样式的数据任何压缩算法都不能压缩。试图压缩已经经过压缩的数据通常得到的结果实际上是扩展数据，试图压缩经过加密的数据通常也会得到这种结果。

实际上，有损数据压缩也会最终达到不能工作的地步。我们来举一个极端的例子，压缩算法每次去掉文件最后一个字节，那么经过这个算法不断的压缩直至文件变空，压缩算法将不能继续工作。

多媒体数据压缩的必要性

信息时代的重要特征是信息的数字化，巾数字化后的视频和各频等媒体信息具有媒体海量性，这与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距。这样，就对多媒体信息的存储和传输造成丁很大困难，成为阻碍人们有效获取和利用信息的一个瓶颈问题。不能对多媒体数据进行有效的压缩，就难以保证通信的顺利进行。数宁化丁的视频和音频信号的数据虽是非常惊人的。下面举例来说明。

对于音频信息来说，人在正常说话时的音频一般为200 Hz一3．4kHz，即人类语各的宽度约为3．4kH：。同样依据采样定理，并没数字化精度为8btt，则每秒的数据量为3．4×2×8＝54．4kb即在上述采样条件下讲1分钟话的数据量约为400 kb。

以一般彩色电视信号为例，设代表光强、色彩和色饱和度的YIQ空间中各分量的带宽分别为4MHz、I．3MH s和o．5MHz。根据采样定理，仅当采样频率大于或等于2倍的原始信号的频率时．刁‘能保证采样后的信号可被无失真地恢复为原始信号。再设各样点均被数宁化为8bit．从而1秒钟的电视信号的数据量为（4十1．3十o．5）×2×8＝92．8Mb张640 MB容量的cD—R（）M能够存放的原始电视数据（铅字行附有2伦校验位）为丽黑黑万—dd s

也就是说， “张普通光锹只能存放44s的原始数据。支持语音、图像、视频等多媒体信号高质量存储和传输所必需的末爪缩速率以及信号持件。

打开APP阅读更多精彩内容