使用 zeppelin 在 kubernetes 上 Spark

2024-04-28

我按照本指南在使用 minikube 设置的本地 kubernetes 集群中运行 zeppelin 容器。

https://zeppelin.apache.org/docs/0.9.0-SNAPSHOT/quickstart/kubernetes.html https://zeppelin.apache.org/docs/0.9.0-SNAPSHOT/quickstart/kubernetes.html

我可以设置 zeppelin 并在那里运行一些示例代码。我已经下载了 Spark 2.4.5 和 2.4.0 源代码,并使用以下命令构建它以支持 kubernetes:

./build/mvn -Pkubernetes -DskipTests clean package

Spark 构建完成后,我创建了一个 docker 容器,如文章中所述:

bin/docker-image-tool.sh -m -t 2.4.X build

我将 zeppelin 配置为使用在 kubernetes 支持下构建的 Spark 映像。上面的文章解释了spark解释器将自动配置kubernetes上的spark以客户端模式运行并运行作业。

但是每当我尝试使用 Spark 运行任何段落时,我都会收到以下错误

Exception in thread "main" java.lang.IllegalArgumentException: basedir must be absolute: ?/.ivy2/local

我尝试设置火花配置spark.jars.ivy在 zeppelin 中指向临时目录,但这也不起作用。

我在这里发现了类似的问题:basedir 必须是绝对的:?/.ivy2/local https://stackoverflow.com/questions/50861477/basedir-must-be-absolute-ivy2-local

但我似乎无法配置 Spark 来运行spark.jars.ivy /tmp/.ivy配置。我尝试与火花默认值.conf在构建 Spark 时,但这似乎也不起作用。

对这个问题以及如何解决它感到非常困惑,任何指导将不胜感激。

Thanks!


我也遇到了这个问题,但是我用来设置的解决方法spark.jars.ivy=/tmp/.ivy而是将其设置为环境变量。

在 Spark 解释器设置中,添加以下属性:SPARK_SUBMIT_OPTIONS并将其值设置为--conf spark.jars.ivy=/tmp/.ivy.

这应该会传递额外的选项来触发提交,并且您的工作应该继续。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 zeppelin 在 kubernetes 上 Spark 的相关文章

随机推荐

  • 将 SQL 依赖关系与 Azure 结合使用

    在我的本地数据库中 Sql 依赖关系工作正常 但是当我迁移到 Azure 数据库时 它就不起作用了 我检查服务代理是否已启用 并且它已激活 这是错误 此版本的 SQL Server 不支持语句 RECEIVE MSG 这是我的代码 publ
  • ASP.NET 4 中 '(单引号)和“(双引号)之间的区别

    我想在 aspx 页面中的服务器控件的代码隐藏中调用 MyMethod 如下所示 我的页面 aspx
  • 如何检查程序是否在 Windows 上的 Ubuntu 上的 Bash 中运行,而不仅仅是普通的 Ubuntu?

    非常简单 确定您所使用的操作系统的通常位置似乎与 Ubuntu for Windows 上的普通 Ubuntu 相同 例如uname a与本机 GNU Linux 安装相同并且 etc os version与 Ubuntu Trusty T
  • Google Closure 事件委托 a'la jQuery live/on

    我需要将事件委托给新创建的元素 我需要将处理程序附加到它们的创建事件 类似于 onCreate 我不想在创建后通过寻址将事件绑定到元素 jQuery element click function 我更喜欢类似的东西 on document
  • 返回深度嵌套数组中对象的索引的函数

    我可能需要编写一个函数 仅输出数组内对象的索引 显然 使用 inArray 在下面的示例中返回这个索引就可以了 array one two three inArray one array 0 对于更复杂的数组 如何找到嵌套对象的索引 arr
  • Pig Batch 模式:如何设置日志记录级别以隐藏 INFO 日志消息?

    使用阿帕奇猪版本0 10 1 21 重新出口 当我执行 Pig 脚本时 有很多 INFO 日志记录行 如下所示 2013 05 18 14 30 12 810 Thread 28 INFO org apache hadoop mapred
  • 如何读取硬盘S.M.A.R.T.属性?

    我会监控 Windows 7 客户端上的智能 HDD 我希望在不使用任何 vbs 文件或现成工具的情况下获得 HDD 智能属性 只需使用 WMI 或 PowerShell 我将使用 Zabbix 监控服务器聚合该数据 使用zabbix se
  • 有没有办法在坐标平面上动态绘制点之间的线?

    我正在完成一个项目 在该项目中我实现了一个暴力算法来解决凸包问题 我还需要为该算法创建视觉效果 我试图在 x 轴和 y 轴上创建一个范围从 100 100 的坐标平面 绘制完整集中的所有点 并在点之间动态绘制线条以创建凸包 例如 假设我有
  • 如何在Python中的滚动平均计算中忽略NaN

    对于时间序列销售预测任务 我想创建一个代表过去 3 天平均销售额的功能 当我想预测未来几天的销售额时遇到问题 因为这些数据点没有销售数据 NaN 值 Pandas 提供rolling mean 但当窗口中的任何数据点为 NaN 时 该函数会
  • 当考虑性能时如何从文件中读取整数?

    我正在 CodeEval 上执行一些任务 基本上任务非常简单 打印出从文件中读取的所有整数的总和 我的解决方案如下 import java io File import java io IOException import java io
  • HDP 3.1.0.0-78 升级后无法使用 ResourceManager UI 终止 YARN 应用程序

    我最近将 HDP 从 2 6 5 升级到 3 1 0 它运行 YARN 3 1 0 并且我无法再使用旧的 8088 cluster apps 或新的 8088 从 YARN ResourceManager UI 终止应用程序 ui2 ind
  • qt 读取就绪信号

    我正在尝试与运行 1996 年处理器的设备建立串行连接 这意味着数据传输回我可能需要几秒钟的时间 我知道readyRead每次有新数据可用时都会生成信号 但我的问题是生成多长时间 这也是我可以测试就绪读取是否较低的一种方法 因为如果当它们不
  • 初学者 MYSQL 错误 - 访问被拒绝

    错误 1045 28000 用户 root localhost 的访问被拒绝 使用密码 N 哦 我已经尝试了一切 我已经阅读了一页又一页的答案 但似乎没有人知道正确的答案 当我尝试登录我的数据库时 我只是收到上述错误 我还没有设置密码或其他
  • Xamarin Mac 中 AttributeName 的用途

    我正在尝试对 Xamarin 中的 NSMutableAttributedString 中的子字符串进行着色 但它似乎缺少正确的常量 我应该在那里放什么 Update 这越来越接近 var s new NSMutableAttributed
  • 将行追加到 Pandas DataFrame 添加 0 列

    我正在创建一个 Pandas DataFrame 来存储数据 不幸的是 我无法提前知道我将拥有的数据行数 所以我的方法如下 首先 我声明一个空的 DataFrame df DataFrame columns col1 col2 然后 我附加
  • 在 JavaScript 中将带有哈希值的十六进制字符串转换为带有 0x 的十六进制值的最佳方法?

    这个问题不是问如何将哈希字符串十六进制值转换为其相反的颜色 这个问题询问如何将哈希字符串十六进制值转换为常规十六进制值 如下所述 我从元素的存储样式中获取元素的十六进制颜色值 我需要将它们的十六进制值 带有像 FFFFFF 这样的哈希值的字
  • 如何让供应商与 Google App Engine 配合使用?

    我正在尝试引入 Go 供应商 将依赖项存储在名为的文件夹中 vendor 到现有的 App Engine 项目 我已将所有依赖项存储在供应商文件夹中 使用 Godep 作为助手 它看起来是正确的 但在本地运行应用程序时出现以下错误 go a
  • Java 8 中接口和抽象类之间的根本区别[重复]

    这个问题在这里已经有答案了 考虑到接口现在可以为其提供的方法提供实现 我无法正确合理地解释接口和抽象类之间的差异 有谁知道如何正确解释其中的差异 我还被告知 从性能角度来看 接口比抽象类更轻量 有人可以证实这一点吗 接口仍然不能有任何状态
  • Firefox 中的代理设置不会“粘连”

    在家里我们有一个代理服务器 在工作中我们不会 Firefox 在这方面令人恼火 每当我启动它时 它都会默认使用代理服务器 如果我执行 工具 gt 选项 gt 设置 并选择 无代理 则没有问题 但是 如果我关闭 Firefox 并重新启动它
  • 使用 zeppelin 在 kubernetes 上 Spark

    我按照本指南在使用 minikube 设置的本地 kubernetes 集群中运行 zeppelin 容器 https zeppelin apache org docs 0 9 0 SNAPSHOT quickstart kubernete