基于Facebook开发的实时数据压缩程序

Zstandard(又叫Zstd)是一款免费开源的快速实时数据压缩程序,具有更高的压缩比,由Facebook开发。它是用C语言编写的无损压缩算法,因此它是一个原生的Linux程序。

需要的话,它可以牺牲压缩速度,换取更高的压缩比(压缩速度与压缩比这个组合可以逐级配置),反之亦然。它有一种用于小数据压缩的特殊模式,名为字典压缩,可以用提供的任何样本集来构建字典。它带有一个命令行实用程序,用于创建和解码.zst、.gz、.xz和.lz4等文件。

重要的是, Zstandard有一套丰富的API,支持几乎所有流行的编程语言,包括Python、Java、JavaScript、Nodejs、Perl、Ruby、C#、Go、Rust、PHP和Swift等语言。

它在Facebook积极用于压缩多种格式的大量数据,支持多种使用场景,适用于亚马逊Redshift数据仓库等服务、Hadoop和Redis等数据库、Tor网络以及包括游戏在内的其他许多应用。

通过使用lzbench这种开源的内存基准测试工具,在一台运行Linux Debian的服务器上执行几项快速压缩算法测试,获得了以下结果:

 基于Facebook开发的实时数据压缩程序_设计制作_测量仪表

Zstandard压缩测试

如何在Linux中安装Zstandard压缩工具?

想在Linux发行版上安装Zstandard,你需要用源代码来编译,不过在此之前,需要使用发行版软件包管理器在系统上安装必要的开发工具,如下所示:

$ sudo apt update && sudo apt install build-essen  TI al #Ubuntu/Debian # yum group install “Development Tools” #CentOS/REHL # dnf groupinstall “C Development Tools and Libraries” #Fedora 22+

一旦安装了所有需要的开发工具,可以下载源代码软件包,进入到本地仓库目录,构建二进制文件并安装,所下所示:

$ cd ~/Downloads $ git clone https://github.com/facebook/zstd.git $ cd zstd $ make $ sudo make install

一旦Zstandard安装完毕,现在我们可以进一步学习下面部分中Zstd命令示例的一些基本用法。

学习Linux中10个Zstd命令使用示例

Zstd的命令行语法通常与gzip和xz工具类似,不过有几个差异。

1.想创建.zst压缩文件,只需提供一个压缩文件名即可,或者使用-z标志也意味着压缩,这是默认操作。

$ zstd etcher-1.3.1-x86_64.AppImage

或者

$ zstd -z etcher-1.3.1-x86_64.AppImage

2.想解压缩.zst压缩文件,使用-d标志或unzstd实用程序,如下所示:

$ zstd -d etcher-1.3.1-x86_64.AppImage

或者

$ unzstd etcher-1.3.1-x86_64.AppImage

3.想在压缩操作和后删除源文件,默认情况下,源文件在成功压缩或解压缩后不会被删除;想删除它,使用--rm选项。

$ ls etcher-1.3.1-x86_64.AppImage $ zstd --rm etcher-1.3.1-x86_64.AppImage $ ls etcher-1.3.1-x86_64.AppImage

4.想设置压缩级别,Zstd有许多操作修改符,比如你可以指定压缩级别为-6 (数值1-19,默认值为3),如下所示:

$ zstd -6 --rm etcher-1.3.1-x86_64.AppImage

5.想设置压缩速度,Zstd的压缩速度比为1-10,默认压缩速度为1。可以使用--fast选项,牺牲压缩比,换取更高的压缩速度;数值越大,压缩速度越快。

$ zstd --fast=10 etcher-1.3.1-x86_64.AppImage

6.想显示有关压缩文件的信息,使用-l标志,这可以用来显示有关压缩文件的信息。

$ zstd -l etcher-1.3.1-x86_64.AppImage.zst

7.想测试压缩文件的完整性,使用-t标志,如下所示:

$ zstd -t etcher-1.3.1-x86_64.AppImage.zst

8.想启用详细模式,使用-v选项。

$ zstd -v -5 etcher-1.3.1-x86_64.AppImage

9.想使用其他文件压缩或解压缩格式,比如gzip、xz、lzma和lz4,使用--format=FORMAT,如下所示:

$ zstd -v --format=gzip etcher-1.3.1-x86_64.AppImage $ zstd -v --format=xz etcher-1.3.1-x86_64.AppImage

10.想将Zstd进程优先级设置为实时,可以使用选项-priority = rt,如下所示:

$zstd --priority=rt etcher-1.3.1-x86_64.AppImage

-r标志指令Zstd对字典执行递归操作。只要查阅Zstd参考手册页,你就可以找到许多实用的高级选项,以及如何阅读或创建字典。

$ man zstd Zstandard Github仓库:https://github.com/facebook/zstd

Zstandard是一种快速的实时无损数据压缩算法和压缩工具,提供了高压缩比。尝试一下,分享你的想法,也可以通过下面的反馈表来提问。

60
116
0
31

相关资讯

  1. 1、流量也能正能量,央视点名六部好剧,肖战上榜数量最多4694
  2. 2、主角都不认识,配角多是影帝影后,观众:导演,捧儿子不带这样的2418
  3. 3、阿娇《非常静距离》曝辛酸童年回应不雅照事件2644
  4. 4、司珂华盛装亮相红毯展活力青春向电影致敬2990
  5. 5、他是《我不是药神》中的黄毛,被王传君尊称哥,真实年龄大得吓人1412
  6. 6、吴孟达受访时感谢周星驰的提携?周星驰:达叔待我如亲哥哥!1425
  7. 7、《倚天》最美赵敏外公与金庸同天陨落,微博:两位老人,一路走好2130
  8. 8、老公被女星坐大腿引热议,朱丹晒女儿照高情商回应3931
  9. 9、长歌行开播,网友评价两极分化,迪丽热巴依旧演不出一部爆款剧2702
  10. 10、电影《夜守》好评飙升年度国产惊悚佳作黑马预定4204
全部评论(0)
我也有话说
0
收藏
点赞
顶部