ClickHouse 是俄罗斯Yandex在2016年开源的一个单进程多线程分析型列式存储数据库,主要面向OLAP场景。
Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。
MinIO 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从几kb到最大5T不等。
版本控制(Revision control)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。
Spring Boot(英文中是“引导”的意思),是用来简化Spring应用的搭建到开发的过程。应用开箱即用,只要通过 “just run”(可能是 java -jar 或 tomcat 或 maven插件run 或 shell脚本),就可以启动项目。二者,Spring Boot 只要很少的Spring配置文件(例如那些xml,property)。
Docker 是世界领先的软件容器平台。开发人员利用 Docker 可以消除协作编码时“在我的机器上可正常工作”的问题。
Hive的索引目的是提高Hive表指定列的查询速度。Hive只有有限的索引功能,但是还是可以对一些字段建立索引来加速某些操作的。一张表的索引数据存储在另外一张表中。
Hive 提供了一个被称为Hive 查询语言(简称 HiveQL或HQL)的SQL方言,来查询存储在Hadoop集群中的数据。
Kafka Eagle是开源的可视化和管理软件。它使您可以查询,可视化,警告和浏览指标,无论它们存储在哪里。