基于Facebook开发的实时数据压缩程序

嵌入式技术

1330人已加入

描述

Zstandard(又叫Zstd)是一款免费开源的快速实时数据压缩程序,具有更高的压缩比,由Facebook开发。它是用C语言编写的无损压缩算法,因此它是一个原生的Linux程序。

需要的话,它可以牺牲压缩速度,换取更高的压缩比(压缩速度与压缩比这个组合可以逐级配置),反之亦然。它有一种用于小数据压缩的特殊模式,名为字典压缩,可以用提供的任何样本集来构建字典。它带有一个命令行实用程序,用于创建和解码.zst、.gz、.xz和.lz4等文件。

重要的是, Zstandard有一套丰富的API,支持几乎所有流行的编程语言,包括Python、Java、JavaScript、Nodejs、Perl、Ruby、C#、Go、Rust、PHP和Swift等语言。

它在Facebook积极用于压缩多种格式的大量数据,支持多种使用场景,适用于亚马逊Redshift数据仓库等服务、Hadoop和Redis等数据库、Tor网络以及包括游戏在内的其他许多应用。

通过使用lzbench这种开源的内存基准测试工具,在一台运行Linux Debian的服务器上执行几项快速压缩算法测试,获得了以下结果:

Facebook

Zstandard压缩测试

如何在Linux中安装Zstandard压缩工具?

想在Linux发行版上安装Zstandard,你需要用源代码来编译,不过在此之前,需要使用发行版软件包管理器在系统上安装必要的开发工具,如下所示:

$ sudo apt update && sudo apt install build-essential #Ubuntu/Debian # yum group install “Development Tools” #CentOS/REHL # dnf groupinstall “C Development Tools and Libraries” #Fedora 22+

一旦安装了所有需要的开发工具,可以下载源代码软件包,进入到本地仓库目录,构建二进制文件并安装,所下所示:

$ cd ~/Downloads $ git clone https://github.com/facebook/zstd.git $ cd zstd $ make $ sudo make install

一旦Zstandard安装完毕,现在我们可以进一步学习下面部分中Zstd命令示例的一些基本用法。

学习Linux中10个Zstd命令使用示例

Zstd的命令行语法通常与gzip和xz工具类似,不过有几个差异。

1.想创建.zst压缩文件,只需提供一个压缩文件名即可,或者使用-z标志也意味着压缩,这是默认操作。

$ zstd etcher-1.3.1-x86_64.AppImage

或者

$ zstd -z etcher-1.3.1-x86_64.AppImage

2.想解压缩.zst压缩文件,使用-d标志或unzstd实用程序,如下所示:

$ zstd -d etcher-1.3.1-x86_64.AppImage

或者

$ unzstd etcher-1.3.1-x86_64.AppImage

3.想在压缩操作和后删除源文件,默认情况下,源文件在成功压缩或解压缩后不会被删除;想删除它,使用--rm选项。

$ ls etcher-1.3.1-x86_64.AppImage $ zstd --rm etcher-1.3.1-x86_64.AppImage $ ls etcher-1.3.1-x86_64.AppImage

4.想设置压缩级别,Zstd有许多操作修改符,比如你可以指定压缩级别为-6 (数值1-19,默认值为3),如下所示:

$ zstd -6 --rm etcher-1.3.1-x86_64.AppImage

5.想设置压缩速度,Zstd的压缩速度比为1-10,默认压缩速度为1。可以使用--fast选项,牺牲压缩比,换取更高的压缩速度;数值越大,压缩速度越快。

$ zstd --fast=10 etcher-1.3.1-x86_64.AppImage

6.想显示有关压缩文件的信息,使用-l标志,这可以用来显示有关压缩文件的信息。

$ zstd -l etcher-1.3.1-x86_64.AppImage.zst

7.想测试压缩文件的完整性,使用-t标志,如下所示:

$ zstd -t etcher-1.3.1-x86_64.AppImage.zst

8.想启用详细模式,使用-v选项。

$ zstd -v -5 etcher-1.3.1-x86_64.AppImage

9.想使用其他文件压缩或解压缩格式,比如gzip、xz、lzma和lz4,使用--format=FORMAT,如下所示:

$ zstd -v --format=gzip etcher-1.3.1-x86_64.AppImage $ zstd -v --format=xz etcher-1.3.1-x86_64.AppImage

10.想将Zstd进程优先级设置为实时,可以使用选项-priority = rt,如下所示:

$zstd --priority=rt etcher-1.3.1-x86_64.AppImage

-r标志指令Zstd对字典执行递归操作。只要查阅Zstd参考手册页,你就可以找到许多实用的高级选项,以及如何阅读或创建字典。

$ man zstd Zstandard Github仓库:https://github.com/facebook/zstd

Zstandard是一种快速的实时无损数据压缩算法和压缩工具,提供了高压缩比。尝试一下,分享你的想法,也可以通过下面的反馈表来提问。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分