Zeppelin

什么是ApacheZeppelin?

Apache Zeppelin 是一个可以进行大数据可视化分析的交互式开发系统,可以承担数据接入、数据发现、数据分析、数据可视化、数据协作等任务,其前端提供丰富的可视化图形库,不限于SparkSQL,后端支持HBase、Flink 等大数据系统以插件扩展的方式,并支持Spark、Python、JDBC、Markdown、Shell 等各种常用Interpreter,这使得开发者可以方便地使用SQL 在 Zeppelin 中做数据开发。在 Zeppelin 中还可以完成机器学习的数据预处理、算法开发和调试、算法作业调度的工作,同时,Zeppelin 还提供了单机 Docker、分布式、K8s、Yarn 四种系统运行模式,以适应各类团队的需求。

多功能笔记本

1)数据摄取
2)数据发现
3)数据可视化与协作
图片说明

多语言后端

Apache Zeppelin解释器概念允许将任何语言数据/数据处理后端插入Zeppelin。当前,Apache Zeppelin支持许多解释器,例如Apache Spark,Python,JDBC,Markdown和Shell。

Apache Spark集成

特别是,Apache Zeppelin提供了内置的Apache Spark集成。不需要为其构建单独的模块,插件或库。
图片说明
Apache Zeppelin与Spark集成提供
Apache Zeppelin与Spark集成提供
自动SparkContext和SQLContext注入
从本地文件系统或Maven存储库加载运行时jar依赖项。
取消作业并显示其进度

数据可视化

Apache Zeppelin中已经包含一些基本图表,可视化不仅限于SparkSQL查询,任何语言后端的任何输出都可以被识别和可视化
图片说明

枢轴图表

Apache Zeppelin 汇总值并通过简单的拖放将其显示在数据透视图中。您可以轻松地创建具有多个汇总值的图表,包括综合,计数,平均值,最小值,最大值。
图片说明
在Apache Zeppelin中了解有关基本显示系统和Angular API(frontend,backend)的更多信息。

动态表格

图片说明

通过共享您的笔记本和段落进行协作

您的笔记本URL可以在协作者之间共享。然后,Apache Zeppelin将实时广播所有更改,就像Google文档中的协作一样。
图片说明

文章目录
  1. 1. 什么是ApacheZeppelin?
  2. 2. 多功能笔记本
  3. 3. 多语言后端
  4. 4. Apache Spark集成
  5. 5. 数据可视化
    1. 5.1. 枢轴图表
  6. 6. 动态表格
  7. 7. 通过共享您的笔记本和段落进行协作
,