- Zeppelin简介
Apache Zeppelin是一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook,可以直接在浏览器中写代码、笔记并共享),可实现的主要有以下功能:数据采集、数据发现、数据分析和数据可视化和协作。
- Zeppelin安装
安装前准备
- 在Vmware上安装linux环境
- 在linux上安装JDK1.8
下载Zeppelin安装包
可以在官网(http://zeppelin.apache.org/download.html)下载Zeppelin的安装包,也可以在国内的一些镜像源上下载(https://mirrors.tuna.tsinghua.edu.cn/apache/zeppelin/zeppelin-0.8.0/)下载的是0.8版本的zeppelin-0.8.0-bin-all.tgz。
解压安装包,重命名相应的文件
解压安装包到/usr/local目录,在conf/目录下重命名两个文件,如代码 15所示。
root@node200:/opt# tar -zxvf zeppelin-0.8.0-bin-all.tgz -C /usr/local/ root@node200:/opt# cd /usr/local/zeppelin-0.8.0-bin-all/conf/ root@node200:/usr/local/zeppelin-0.8.0-bin-all/conf# mv zeppelin-env.sh.template zeppelin-env.sh root@node200:/usr/local/zeppelin-0.8.0-bin-all/conf# mv zeppelin-site.xml.template zeppelin-site.xml |
修改zeppelin-env.sh和zeppelin-site.xml文件
进入zeppelin-env.sh文件,修改内容如下表 5所示。
export JAVA_HOME=/usr/local/jdk1.8.0_51 export SPARK_MASTER_IP=192.168.128.200 export SPARK_LOCAL_IP=192.168.128.200 export SPARK_HOME=/usr/local/spark-2.2.2-bin-hadoop2.6 export HADOOP_HOME=/usr/local/hadoop-2.6.5 export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop export ZEPPELIN_HOME_INTP_JAVA_OPTS="-XX:PermSize=512M -XX:MaxPermSize=1024M" |
进入zeppelin-site.xml文件,修改Zeppelin的端口,原先的端口是8080,现在修改为8089。修改内容如下表 6所示。
<property> <name>zeppelin.server.port</name> <value>8089</value> <description>Server port.</description> </property> |
启动/关闭Zeppelin
在Zeppelin的bin目录下,执行如下代码 16所示命令。
#启动 ./zeppelin-daemon.sh start #关闭 ./zeppelin-daemon.sh stop #重启 ./zeppelin-daemon.sh restart |
浏览器显示
在谷歌浏览器上运行,地址:端口(node200:8089),如图 9所示。

图 9 浏览器显示Zeppelin
- Zeppelin使用
目前只是配置可以跑的通shell脚本,如图 10所示,若想使用mysql,spark,puthon等可以参考官网。

图 10 运行Linux命令