【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析
如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么?
如果还可以执行PySpark代码和Spark代码呢?心动了吗?
如果还可以写Hive-SQL,Spark-SQL呢?
如果还可以把这些代码保存起来,并形成文档,支持Markdown语法,如何?
如果还可以将SQL的结果在Web界面上可视化出来呢?
如果还支持R语言,还支持Kylin呢?还支持Angular呢?还支持PostgreSQL呢?不信你不心动。
Zeppelin简介
Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。
Core feature:
- Web based notebook style editor.
- Built-in Apache Spark support
To know more about Zeppelin, visit our web site https://zeppelin.apache.org
Zeppelin提供数据可视化的框架。
多用途笔记本
可实现你所需要的:
- 数据采集
- 数据发现
- 数据分析
- 数据可视化和协作
支持多种语言,默认是scala(背后是Spark shell),SparkSQL, Markdown 和 Shell。可以添加自己的语言支持。
Apache Spark 集成
Zeppelin 提供了内置的 Apache Spark 集成。你不需要单独构建一个模块、插件或者库。
Zeppelin的Spark集成提供了:
- 自动引入SparkContext 和 SQLContext
- 从本地文件系统或maven库载入运行时依赖的jar包。
- 可取消job 和 展示job进度
环境安装
下载:http://zeppelin.apache.org/download.html
快速开始
http://zeppelin.apache.org/docs/0.8.2/quickstart/install.html
Starting Apache Zeppelin
Starting Apache Zeppelin from the Command Line
On all unix like platforms:
-
bin/zeppelin-daemon.sh
start
-
If you are on Windows:
-
bin\
zeppelin
.cmd
-
After Zeppelin has started successfully, go to http://localhost:8080 with your web browser.
Stopping Zeppelin
bin/zeppelin-daemon.sh stop
http://zeppelin.apache.org/docs/0.8.2/quickstart/explore_ui.html
Kotlin 开发者社区
国内第一Kotlin 开发者社区公众号,主要分享、交流 Kotlin 编程语言、Spring Boot、Android、React.js/Node.js、函数式编程、编程思想等相关主题。
越是喧嚣的世界,越需要宁静的思考。
转载:https://blog.csdn.net/universsky2015/article/details/103642362