如何在 Apache-Spark 中连接主从？（独立模式）

2024-01-10

我在用着Spark独立模式 https://spark.apache.org/docs/latest/spark-standalone.html以独立模式安装 Spark 的教程页面。

1-我通过以下方式开始了大师生涯：

./sbin/start-master.sh

2-我通过以下方式启动了一名工人：

./bin/spark-class org.apache.spark.deploy.worker.Worker spark://ubuntu:7077

Note: spark://ubuntu:7077是我的主人名字，我可以在其中看到它Master-WebUI.

Problem:通过第二条命令，worker 成功启动。但它无法与主人交往。它反复尝试，然后给出以下消息：

15/02/08 11:30:04 WARN Remoting: Tried to associate with unreachable    remote address [akka.tcp://sparkMaster@ubuntu:7077]. Address is now gated for 5000 ms, all messages to this address will be delivered to dead letters. Reason: Connection refused: ubuntu/127.0.1.1:7077
15/02/08 11:30:04 INFO RemoteActorRefProvider$RemoteDeadLetterActorRef: Message [org.apache.spark.deploy.DeployMessages$RegisterWorker] from Actor[akka://sparkWorker/user/Worker#-1296628173] to Actor[akka://sparkWorker/deadLetters] was not delivered. [20] dead letters encountered. This logging can be turned off or adjusted with configuration settings 'akka.log-dead-letters' and 'akka.log-dead-letters-during-shutdown'.
15/02/08 11:31:15 ERROR Worker: All masters are unresponsive! Giving up.

问题是什么？

Thanks

我通常从Spark-env.sh https://github.com/apache/spark/blob/master/conf/spark-env.sh.template模板。我设置了我需要的属性。对于简单集群，您需要：

SPARK_MASTER_IP

然后，在与spark-env.sh和slaves ip相同的目录中创建一个名为“slaves”的文件（每行一个）。确保您通过 ssh 到达所有从站。

最后，复制此配置在集群的每台机器上。然后执行start-all.sh脚本启动整个集群并尝试spark-shell来检查您的配置。

> sbin/start-all.sh
> bin/spark-shell

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

如何在 Apache-Spark 中连接主从？（独立模式）的相关文章

PySpark DataFrame 上分组数据的 Pandas 式转换

如果我们有一个由一列类别和一列值组成的 Pandas 数据框我们可以通过执行以下操作来删除每个类别中的平均值 df DemeanedValues df groupby Category Values transform lambda g
如何在 Spark 数据帧 groupBy 中执行 count(*)

我的目的是做相当于基本sql的事情 select shipgrp shipstatus count cnt from shipstatus group by shipgrp shipstatus 我见过的 Spark 数据帧的示例包括其他列
为什么 Spark 退出并显示 exitCode: 16？

我将 Spark 2 0 0 与 Hadoop 2 7 一起使用并使用纱线集群模式每次我都会收到以下错误 17 01 04 11 18 04 INFO spark SparkContext Successfully stopped S
如何在每行中添加行号？

假设这些是我的数据 Maps and Reduces are two phases of solving a query in HDFS Map is responsible to read data from input location
Spark Python：标准缩放器错误“不支持... SparseVector”

我又撞到了堵墙我是一个新手所以我不得不再次依赖你强大的知识我从一个数据集开始如下所示 user account id user lifetime user no outgoing activity in days user acco
Spark Dataframe/Parquet 中的枚举等效项

我有一个包含数亿行的表我想将其存储在 Spark 的数据帧中并作为 parquet 文件持久保存到磁盘我的 Parquet 文件的大小现在超过 2TB 我想确保我已经对此进行了优化这些列中很大一部分是字符串值它们可能很长但值通常也
如何从DataFrame中获取最后一行？

我有一个DataFrame 该DataFrame有两列 value 和 timestamp timestmp 是有序的我想获取DataFrame的最后一行我该怎么办这是我的输入 value timestamp 1 1 4 2 3 3
在 pyspark 中包装 java 函数

我正在尝试创建一个用户定义的聚合函数我可以从 python 调用它我试图遵循答案this https stackoverflow com questions 33233737 spark how to map python with s
如何在 pySpark 数据框中添加行 ID [重复]

这个问题在这里已经有答案了我有一个 csv 文件我在 pyspark 中将其转换为 DataFrame df 经过一番改造后我想在 df 中添加一列这应该是简单的行 ID 从 0 或 1 开始到 N 我将 df 转换为 rdd 并使
如何强制 Spark 执行代码？

我如何强制 Spark 执行对 map 的调用即使它认为由于其惰性求值而不需要执行它我试过把cache 与地图调用但这仍然没有解决问题我的地图方法实际上将结果上传到 HDFS 所以它并非无用但 Spark 认为它是无用的简短回
一起调用distinct和map会在spark库中抛出NPE

我不确定这是否是一个错误所以如果你这样做 d spark RDD String d distinct map x gt d filter equals x 您将获得 Java NPE 但是如果你做了一个collect之后立马distinc
如何调试 Spark 工作线程上的映射函数中的错误？

我是 Spark 新手正在努力寻找自己的方法我有一个 Spark 应用程序它在dataset 此地图功能可能会因主要与数据相关的原因而失败我怎样才能获得一些关于问题所在的有意义的信息我不知道从哪里开始非常感谢如果您想编写单元测
如何对 RDD 进行分区

我有一个文本文件其中包含大量由空格分隔的随机浮动值我正在将此文件加载到 scala 中的 RDD 中这个RDD是如何分区的另外是否有任何方法可以生成自定义分区以便所有分区都具有相同数量的元素以及每个分区的索引 val dRDD
根据条件组合 Spark 数据帧列中的多行

我正在尝试根据条件组合 Spark 数据框中的多行这是我的数据框 df username qid row no text a 1 1 this a 1 2 is d 2 1 the a 1 3 text d 2 2 ball 我希望它看起
从 Spark 数据帧中过滤大量 ID

我有一个大型数据框其格式类似于 ID Cat date 12 A 201602 14 B 201601 19 A 201608 12 F 201605 11 G 201603 我需要根据大约 500 万个 Is 的列表来过滤行最直接的方
如何将 Spark-sftp 等新库添加到我的 Pyspark 代码中？

当我尝试在 Spark conf 中设置包依赖项 spark sftp 时我收到 ClassNotFoundException 但当我使用以下命令执行脚本时它会起作用 Spark submit packages com springml
Spark Collect_list 并限制结果列表

我有以下格式的数据框 name merged key1 internalKey1 value1 key1 internalKey2 value2 key2 internalKey3 value3 我想做的是将数据框分组name 收集列表并l
更改spark_temporary目录路径

是否可以更改 temporarySpark在写入之前保存临时文件的目录特别是由于我正在编写表的单个分区因此我希望临时文件夹位于分区文件夹内是否可以由于其实现原因无法使用默认的 FileOutputCommiter FileOut
Spark 2.1无法在CSV上写入Vector字段

当我将代码从 Spark 2 0 迁移到 2 1 时我偶然发现了与 Dataframe 保存相关的问题这是代码 import org apache spark sql types import org apache spark ml l
使用 Spark 版本 2.2 的 row_number() 函数创建 PySpark DataFrame 中每行的行号

我有一个 PySpark DataFrame valuesCol Sweden 31 Norway 62 Iceland 13 Finland 24 Denmark 52 df sqlContext createDataFrame valu

随机推荐

如何创建动态外部 javascript 文件？

我正在考虑一些在线服务如何创建动态 JavaScript 文件这些文件具有 js 扩展名但其内容不是静态的我找到了一个示例文件here http j maxmind com app geoip js 看来这个脚本是用更高级的编程语言生
禁用 Zend Framework 2 中的某些选项

我会在 Zend Framework 2 中禁用某些选项的选择我有一个关于口语的选择当用户保存口语时我会禁用它因为他无法再次保存相同的语言在 LanguageForm php 内 this gt add array name gt
有没有一种方法可以对列表进行排序，以使一列中具有相同值的行均匀分布？

希望按扇区排序左下但均匀分布右下 Name Sector Name Sector A 1 A 1 B 1 E 2 C 1 H 3 D 4 D 4 E 2 B 1 F 2 F 2 G 2 J 3 H 3 I 4 I 4 C 1 J 3
jQuery：如何查找*没有*某个类的元素

为什么这个会失败 div contactAperson input not input hadFocus focus function this attr value 它的目的是嗅出具有的输入not获得类 hadFocus 然后当该子集之一
小波函数的选择如何影响 cwt() 的速度？

In cwt 我可以指定使用哪个小波函数这对速度有何影响cwt 这是一个基准测试我用它运行 singleCompThread https stackoverflow com q 24397847 395857启动 MATLAB 时强制其
如果我使用 youtube-API 或在网络视图中呈现视频有什么优点或缺点

在 YouTube 播放器 API 中当我按全屏时它会从头开始重复视频有任何帮助可以解决此问题另外当我锁定手机睡眠模式时它会停止播放我希望它能够恢复如果您向 AndroidManifest 添加全屏方向标志则不会基
Python authlib Flask - 如何处理刷新令牌？

到目前为止我只需要 oauth2 进行登录但我觉得为了相当完整我的应用程序仍然应该处理刷新令牌我对 oauth 还很陌生所以这是我的理解通过保持访问令牌生命周期较短但刷新令牌生命周期较长您可以强制客户端定期签入以更新访问
Java SQLite - 如何关闭连接？

我见过很多关闭人们使用的数据库连接的例子finally 在 DAO 方法中但在我的例子中 DAO 方法例如 insertUsers 向它所调用的方法抛出异常在这种情况下我该如何关闭我的连接我在尝试时收到 SQLiteExcepti
使用变量而不是显式列名访问列

我想通过使用变量而不是静态列名来访问列例子 variable customer SELECT table variable this is what I would prefer instead of table customer 我需要
MATLAB 中的 subplot 是如何工作的以及 subplot(121) 和 subplot(1,2,1) 之间有什么区别？

我有点不清楚如何subplot作品具体来说有什么区别subplot 121 and subplot 1 2 1 在 MATLAB 中我尝试过搜索subplot文档但我似乎找不到我要找的东西长话短说没有什么区别如何subplot
在 wpf 中显示用户控件的替代方法

我想知道是否有其他显示方式usercontrols inside mainwindow在WPF应用程序中目前我利用的可见性属性usercontrols单击按钮一次显示一个用户控件我将用户控件的可见性设置为Hidden单击按钮后我会更改
ImageIO脏内存不会被iOS自动清除

我正在创建一个应用程序它是一种画廊它作为全屏查看器显示不同的媒体内容分配工具显示使用应用程序时 Live Bytes 参数不会增长到高于 40 Mb 同时在我滑动页面 20 30 次后该应用程序 100 被杀死我检查了 Dir
当 udf 函数不接受足够大的输入变量时 Spark DataFrames

我正在准备一个带有 id 和特征向量的 DataFrame 以便稍后用于进行预测我在我的数据帧上做了一个 groupBy 并在我的 groupBy 中将几列作为列表合并到一个新列中 def mergeFunction with 14 in
检查表单的所有复选框是否都被选中

我有多个从代码动态创建的复选框所以我知道我可以使用以下方式获取复选框 foreach var checkBox in this Controls OfType
C#：HashSet的易失性读写

我有一堂课 public class Checker private HashSet
单击单选按钮时提交表单 - 单击单选按钮时提交表单并执行其他操作

我有一个关于单选按钮和表单的 jQuery 问题我有选项卡式内容设置有 5 个选项卡设置每个选项卡中有一个表单每个表单由 5 个单选按钮和一个提交按钮组成我有我的 jQuery 设置来验证是否首先进行了选择然后使用 AJAX 提
Espresso 测试经常因 NoActivityResumedException 失败

编辑更新了描述和错误消息并添加了一些图像还是有这个问题我在运行浓缩咖啡测试时多次出现奇怪的错误几次成功的测试运行后测试开始失败并出现以下异常 06 23 13 04 48 438 info TestRunner failed W
如何在频繁更新的滑动数组中有效跟踪滚动最小值/最大值

考虑以下 JavaScript 数据结构 let sensors sensor1 min 1 00 max 9 00 data timestamp 1517760374400 value 1 00 timestamp 15177603745
无法理解 Rust 模块系统

我出于教育目的创建了一个简单的项目所以我有一个主要功能和 3 个特征Battery Display and GSM以及他们的实施我希望 main 函数位于文件 main rs 中而 3 个特征位于另一个名为 phone rs 的文件中
如何在 Apache-Spark 中连接主从？（独立模式）

我在用着Spark独立模式 https spark apache org docs latest spark standalone html以独立模式安装 Spark 的教程页面 1 我通过以下方式开始了大师生涯 sbin start ma

如何在 Apache-Spark 中连接主从？ （独立模式）

如何在 Apache-Spark 中连接主从？ （独立模式） 的相关文章

随机推荐

热门标签

如何在 Apache-Spark 中连接主从？（独立模式）

如何在 Apache-Spark 中连接主从？（独立模式）的相关文章