小言_互联网的博客

【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析

370人阅读  评论(0)

【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析

如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么?
如果还可以执行PySpark代码和Spark代码呢?心动了吗?
如果还可以写Hive-SQL,Spark-SQL呢?
如果还可以把这些代码保存起来,并形成文档,支持Markdown语法,如何?
如果还可以将SQL的结果在Web界面上可视化出来呢?
如果还支持R语言,还支持Kylin呢?还支持Angular呢?还支持PostgreSQL呢?不信你不心动。

Zeppelin简介

http://zeppelin.apache.org/

Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。

Core feature:

  • Web based notebook style editor.
  • Built-in Apache Spark support

To know more about Zeppelin, visit our web site https://zeppelin.apache.org

Zeppelin提供数据可视化的框架。

多用途笔记本

可实现你所需要的:

  • 数据采集
  • 数据发现
  • 数据分析
  • 数据可视化和协作

支持多种语言,默认是scala(背后是Spark shell),SparkSQL, Markdown 和 Shell。可以添加自己的语言支持。

Apache Spark 集成

Zeppelin 提供了内置的 Apache Spark 集成。你不需要单独构建一个模块、插件或者库。
Zeppelin的Spark集成提供了:

  • 自动引入SparkContext 和 SQLContext
  • 从本地文件系统或maven库载入运行时依赖的jar包。
  • 可取消job 和 展示job进度

环境安装

下载:http://zeppelin.apache.org/download.html

快速开始

http://zeppelin.apache.org/docs/0.8.2/quickstart/install.html

Starting Apache Zeppelin

Starting Apache Zeppelin from the Command Line

On all unix like platforms:


  
  1. bin/zeppelin-daemon.sh start

If you are on Windows:


  
  1. bin\ zeppelin .cmd

After Zeppelin has started successfully, go to http://localhost:8080 with your web browser.

Stopping Zeppelin

bin/zeppelin-daemon.sh stop

http://zeppelin.apache.org/docs/0.8.2/quickstart/explore_ui.html


Kotlin 开发者社区

国内第一Kotlin 开发者社区公众号,主要分享、交流 Kotlin 编程语言、Spring Boot、Android、React.js/Node.js、函数式编程、编程思想等相关主题。

越是喧嚣的世界,越需要宁静的思考。


转载:https://blog.csdn.net/universsky2015/article/details/103642362
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场