HADOOP相关
-
压缩格式gzip/snappy/lzo/bzip2 比较与总结
1 压缩介绍 常用的几种压缩格式:lzo,gzip,snappy,bzip2,我们简单做一下对比,方便我们在实际场景中选择不同的压缩格式。 支持特性对比: 压缩格式 codec类 …
-
聊聊ZooKeeper的点
1. ZooKeeper 是什么? ZooKeeper 是一个开源的分布式协调服务。它是一个为分布式应用提供一致性服务的软件,分布式应用程序可以基于 ZooKeeper 实现诸如数…
-
HDFS 2.x 升级 3.x 在车好多的实践
背景 HDFS 集群作为大数据最核心的组件,在公司承载了DW、AI、Growth 等重要业务数据的存储重任。随着业务的高速发展,数据的成倍增加,HDFS 集群出现了爆炸式的增长,使…
-
Azkaban-3.x 页面操作手册
1. 创建Flow 使用Azkaban Flow 2.0 来创建任务流,Flow 1.0 将被废弃 创建一个名为flow20.project的文本文件,添加如下内容用以说明这是一个…
-
kylin的总体概述及总结汇总
Apache Kylin 是什么 Apache Kylin是一个开源的、基于Hadoop生态系统的OLAP引擎(OLAP查询引擎、OLAP多维分析引擎),能够通过SQL接口对十亿、…