apachezeppelin

使用 zeppelin 在 kubernetes 上 Spark

我按照本指南在使用 minikube 设置的本地 kubernetes 集群中运行 zeppelin 容器 https zeppelin apache org docs 0 9 0 SNAPSHOT quickstart kubernete

apachespark Kubernetes apachezeppelin

在 Apache Zeppelin 上运行 Pig 查询

我正在 Apache Zeppelin 中运行以下 Pig 查询 pig query A load Pig data using PigStorage as ExamName ExamId BITSID StudentName Issue

apachepig apachezeppelin

使用 Dataproc 在 Zeppelin 上加载插件 GitHubNotebookRepo 和 GCSNotebookRepo 时出现问题

我尝试将笔记本保存在 GCS 和 GitHub 上但没有成功我有以下错误 INFO 2020 07 23 19 54 59 790 qtp684874119 16 PluginManager java loadNotebookRepo

googlecloudplatform apachezeppelin googleclouddataproc

安装 Apache Zeppelin 时出现构建错误

我束手无策试图让 Apache Zeppelin 在我的 Linux 虚拟机上运行我正在关注这个教程 http madhukaudantha blogspot ca 2015 03 building apache zeppelin ht

Build apachezeppelin

字段“功能”不存在。 SparkML

我正在尝试使用 Zeppelin 在 Spark ML 中构建模型我是这个领域的新手需要一些帮助我想我需要为该列设置正确的数据类型并将第一列设置为标签任何帮助将不胜感激谢谢 val training sc textFile hdf

scala apachezeppelin apachesparkml

zeppelin hive 解释器抛出 ClassNotFoundException

我已经部署了zeppelin 0 6并在Jdbc解释器下配置了hive 尝试执行 hive show databases Throws org apache hive jdbc HiveDriver 类 java lang ClassNot

hive interpreter apachezeppelin

Zeppelin 无法在 docker 上加载：logErrors docker zeppelin

我遇到的第一个问题是如果不指定版本标签我无法提取基本映像这没什么大不了的但我发现这很奇怪在那之后 docker pull apache zeppelin 0 8 2 之后我就可以获得图像但我尝试将其运行为 docker run

Docker apachezeppelin

是否可以在 Zeppelin Notebook 中设置全局变量？

我正在尝试使用 Zeppelin 笔记本创建多段落仪表板我希望使用仪表板的人们只需输入某些参数一次例如如果我正在制作包含有关不同网站的信息的仪表板则仪表板用户只需选择他们想要的特定网站一次整个多段落仪表板就会更新这可能吗如何在

apachespark apachezeppelin

超时错误：400 StatusCode 错误：“要求失败：会话不活动。”

我在用着Zeppelin v0 7 3笔记本运行Pyspark脚本在一段中我正在运行脚本来写入数据dataframe to a parquetBlob 文件夹中的文件文件按国家地区进行分区数据帧的行数是99 452 829 当脚本

python apachespark apachezeppelin livy

Spark 抛出 java.util.NoSuchElementException：找不到密钥：67

在 Zeppelin 中运行 Spark 平分 kmmeans 算法 I transform my data using the TF IDF algorithm val idf new IDF minFreq fit data val h

scala apachespark apachezeppelin NoSuchElementException

启动集群时在 EMR 上配置 Zeppelin 的 Spark 解释器

我正在 EMR 上创建集群并配置 Zeppelin 以从 S3 读取笔记本为此我使用一个 json 对象如下所示 Classification zeppelin env Properties Configurations Classi

apachespark EMR amazonemr apachezeppelin

构建 Apache Zeppelin 时出现错误

我已经用cloudera 设置了hadoop 我想安装 zeppelin 来连接 hive 并为我的查询构建 UI 使用以下命令构建 zeppelin 命令时 sudo mvn clean package Pspark 1 3 Dspark

Maven Build clouderacdh apachezeppelin

Zeppelin 上的皮肤可以自定义吗？

Zeppelin 上的皮肤可以自定义吗换句话说把齐柏林飞艇的标志换成别的东西是的很有可能如您所知 Apache Zeppelin 正在孵化是一个开源项目因此只需克隆它来自github com apache incubator

apachezeppelin

构建 SparkSession

我有在齐柏林飞艇担任翻译的火花我使用的是Spark2 0 我构建了一个Session Create 一般来说你不应该初始化SparkSession nor SparkContext在齐柏林飞艇 Zeppelin 笔记本配置为为您创建会话

apachespark apachezeppelin

是否可以将 Zeppelin 笔记与 git 集成？

是否可以将 Zeppelin 笔记与 git 集成人们可以设置存储库位置但如何将其设置为远程 git 存储库不过此功能可在 Amazon EMR 上使用是的这是可能的我使用以下方式创建一个 github 存储库并推送所有笔记

apachezeppelin

Apache Zeppelin 0.6.1：运行 Spark 2.0 Twitter Stream 应用程序

我有一个安装了 Spark 2 0 和 Zeppelin 0 6 1 的集群自从上课以来TwitterUtils scala从 Spark 项目移至 Apache Bahir 我无法再在我的 Zeppelin 笔记本中使用 Twitter

scala apachespark SparkStreaming twitter4j apachezeppelin

使用 Spark 2.0 构建 zeppelin-0.7.0 主分支失败，“yarn install --no-lockfile”失败

我尝试构建从github下载的zeppelin 0 7 0 master分支但失败了构建命令 mvn package Pyarn Pbuild distr Pspark 2 0 Dspark version 2 0 1 Phadoop

Build apachezeppelin

结构化流Kafka 2.1->Zeppelin 0.8->Spark 2.4：spark不使用jar

我有一个 Kafka 2 1 消息代理想要对 Spark 2 4 中的消息数据进行一些处理我想使用 Zeppelin 0 8 1 笔记本进行快速原型设计我下载了结构化流所需的spark streaming kafka 0 10 2 1

python apachespark PySpark ApacheKafka apachezeppelin

如何使用 Zeppelin 访问 aws spark-ec2 集群和 s3 存储桶

我有一个通过 Spark ec2 脚本设置的 aws ec2 集群我想配置 Zeppelin 以便我可以在 Zeppelin 本地编写 scala 代码并在集群上运行它通过 master 此外我希望能够访问我的 s3 存储桶我跟着本

amazons3 amazonec2 apachespark apachezeppelin

JavaPackage 对象不可调用错误：Pyspark

像 dataframe show sqlContext read json 这样的操作工作正常但大多数函数都会给出 JavaPackage object is not callable error 例如当我这样做时 dataFrame

apachespark PySpark Python34 apachezeppelin py4j