Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 zeppelin 在 kubernetes 上 Spark
我按照本指南在使用 minikube 设置的本地 kubernetes 集群中运行 zeppelin 容器 https zeppelin apache org docs 0 9 0 SNAPSHOT quickstart kubernete
apachespark
Kubernetes
apachezeppelin
在 Apache Zeppelin 上运行 Pig 查询
我正在 Apache Zeppelin 中运行以下 Pig 查询 pig query A load Pig data using PigStorage as ExamName ExamId BITSID StudentName Issue
apachepig
apachezeppelin
使用 Dataproc 在 Zeppelin 上加载插件 GitHubNotebookRepo 和 GCSNotebookRepo 时出现问题
我尝试将笔记本保存在 GCS 和 GitHub 上 但没有成功 我有以下错误 INFO 2020 07 23 19 54 59 790 qtp684874119 16 PluginManager java loadNotebookRepo
googlecloudplatform
apachezeppelin
googleclouddataproc
安装 Apache Zeppelin 时出现构建错误
我束手无策 试图让 Apache Zeppelin 在我的 Linux 虚拟机上运行 我正在关注这个教程 http madhukaudantha blogspot ca 2015 03 building apache zeppelin ht
Build
apachezeppelin
字段“功能”不存在。 SparkML
我正在尝试使用 Zeppelin 在 Spark ML 中构建模型 我是这个领域的新手 需要一些帮助 我想我需要为该列设置正确的数据类型并将第一列设置为标签 任何帮助将不胜感激 谢谢 val training sc textFile hdf
scala
apachezeppelin
apachesparkml
zeppelin hive 解释器抛出 ClassNotFoundException
我已经部署了zeppelin 0 6并在Jdbc解释器下配置了hive 尝试执行 hive show databases Throws org apache hive jdbc HiveDriver 类 java lang ClassNot
hive
interpreter
apachezeppelin
Zeppelin 无法在 docker 上加载:logErrors docker zeppelin
我遇到的第一个问题是 如果不指定版本标签 我无法提取基本映像 这没什么大不了的 但我发现这很奇怪 在那之后 docker pull apache zeppelin 0 8 2 之后我就可以获得图像 但我尝试将其运行为 docker run
Docker
apachezeppelin
是否可以在 Zeppelin Notebook 中设置全局变量?
我正在尝试使用 Zeppelin 笔记本创建多段落仪表板 我希望使用仪表板的人们只需输入某些参数一次 例如 如果我正在制作包含有关不同网站的信息的仪表板 则仪表板用户只需选择他们想要的特定网站一次 整个多段落仪表板就会更新 这可能吗 如何在
apachespark
apachezeppelin
超时错误:400 StatusCode 错误:“要求失败:会话不活动。”
我在用着Zeppelin v0 7 3笔记本运行Pyspark脚本 在一段中 我正在运行脚本来写入数据dataframe to a parquetBlob 文件夹中的文件 文件按国家 地区进行分区 数据帧的行数是99 452 829 当脚本
python
apachespark
apachezeppelin
livy
Spark 抛出 java.util.NoSuchElementException:找不到密钥:67
在 Zeppelin 中运行 Spark 平分 kmmeans 算法 I transform my data using the TF IDF algorithm val idf new IDF minFreq fit data val h
scala
apachespark
apachezeppelin
NoSuchElementException
启动集群时在 EMR 上配置 Zeppelin 的 Spark 解释器
我正在 EMR 上创建集群并配置 Zeppelin 以从 S3 读取笔记本 为此 我使用一个 json 对象 如下所示 Classification zeppelin env Properties Configurations Classi
apachespark
EMR
amazonemr
apachezeppelin
构建 Apache Zeppelin 时出现错误
我已经用cloudera 设置了hadoop 我想安装 zeppelin 来连接 hive 并为我的查询构建 UI 使用以下命令构建 zeppelin 命令时 sudo mvn clean package Pspark 1 3 Dspark
Maven
Build
clouderacdh
apachezeppelin
Zeppelin 上的皮肤可以自定义吗?
Zeppelin 上的皮肤可以自定义吗 换句话说 把齐柏林飞艇的标志换成别的东西 是的 很有可能 如您所知 Apache Zeppelin 正在孵化 是一个开源项目 因此只需 克隆它来自github com apache incubator
apachezeppelin
构建 SparkSession
我有在齐柏林飞艇担任翻译的火花 我使用的是Spark2 0 我构建了一个Session Create 一般来说 你不应该初始化SparkSession nor SparkContext在齐柏林飞艇 Zeppelin 笔记本配置为为您创建会话
apachespark
apachezeppelin
是否可以将 Zeppelin 笔记与 git 集成?
是否可以将 Zeppelin 笔记与 git 集成 人们可以设置存储库位置 但如何将其设置为远程 git 存储库 不过 此功能可在 Amazon EMR 上使用 是的 这是可能的 我使用以下方式 创建一个 github 存储库并推送所有笔记
apachezeppelin
Apache Zeppelin 0.6.1:运行 Spark 2.0 Twitter Stream 应用程序
我有一个安装了 Spark 2 0 和 Zeppelin 0 6 1 的集群 自从上课以来TwitterUtils scala从 Spark 项目移至 Apache Bahir 我无法再在我的 Zeppelin 笔记本中使用 Twitter
scala
apachespark
SparkStreaming
twitter4j
apachezeppelin
使用 Spark 2.0 构建 zeppelin-0.7.0 主分支失败,“yarn install --no-lockfile”失败
我尝试构建从github下载的zeppelin 0 7 0 master分支 但失败了 构建命令 mvn package Pyarn Pbuild distr Pspark 2 0 Dspark version 2 0 1 Phadoop
Build
apachezeppelin
结构化流Kafka 2.1->Zeppelin 0.8->Spark 2.4:spark不使用jar
我有一个 Kafka 2 1 消息代理 想要对 Spark 2 4 中的消息数据进行一些处理 我想使用 Zeppelin 0 8 1 笔记本进行快速原型设计 我下载了结构化流所需的spark streaming kafka 0 10 2 1
python
apachespark
PySpark
ApacheKafka
apachezeppelin
如何使用 Zeppelin 访问 aws spark-ec2 集群和 s3 存储桶
我有一个通过 Spark ec2 脚本设置的 aws ec2 集群 我想配置 Zeppelin 以便我可以在 Zeppelin 本地编写 scala 代码并在集群上运行它 通过 master 此外 我希望能够访问我的 s3 存储桶 我跟着本
amazons3
amazonec2
apachespark
apachezeppelin
JavaPackage 对象不可调用错误:Pyspark
像 dataframe show sqlContext read json 这样的操作工作正常 但大多数函数都会给出 JavaPackage object is not callable error 例如 当我这样做时 dataFrame
apachespark
PySpark
Python34
apachezeppelin
py4j
1
2
»