使用sparkr时我应该在工作节点上预安装cran r包吗

2023-12-09

我想在 cran 上使用 r 包，例如forecast等与sparkr并遇到以下两个问题。

我应该在工作节点上预安装所有这些软件包吗？但是当我读spark的源码时这个文件，似乎spark会自动压缩包并通过--jars或--packages将它们分发给工作人员。我应该怎么做才能使工作人员可以使用依赖项？
假设我需要使用提供的功能forecast in a map转换，我应该如何导入包。我是否需要执行以下操作，在地图函数中导入包，是否会进行多次导入：SparkR:::map(rdd, function(x){ library(forecast) then do other staffs })

Update:

阅读更多源代码后，看来，我可以使用includePackage根据以下内容在工作节点上包含包这个文件。那么现在的问题是我是否必须手动在节点上预安装软件包？如果这是真的，那么问题 1 中描述的 --jars 和 --packages 的用例是什么？如果这是错误的，如何使用 --jars 和 --packages 来安装软件包？

重复这个很无聊，但是你不应该使用内部 RDD API首先。它已在第一个 SparkR 官方版本中被删除，并且它根本不适合一般用途。

直到新的低级 API* 准备就绪（参见示例SPARK-12922 SPARK-12919, SPARK-12792）我不会将 Spark 视为运行纯 R 代码的平台。即使它发生变化，使用 R 包装器添加本机（Java / Scala）代码也可能是更好的选择。

话虽这么说，让我们从你的问题开始：

RPackageUtils旨在处理使用 Spark 包创建的包。它不处理标准 R 库。
是的，您需要在每个节点上安装软件包。从includePackage文档字符串：

假定该包已安装在 Spark 集群中的每个节点上。

* 如果您使用 Spark 2.0+，您可以使用 dapply、gapply 和 lapply 函数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用sparkr时我应该在工作节点上预安装cran r包吗的相关文章

更新 R6 对象实例中的方法定义

如何更新 R6 类实例的方法定义正如我所期望的 S3 使用当前的方法定义对于 R5 参考类我可以使用 myInstance myInstance copy 在 R6 中我尝试了 myInstance myInstance clone
我可以在没有 Hadoop 的情况下使用 Spark 作为开发环境吗？

我对大数据和相关领域的概念非常陌生如果我犯了一些错误或拼写错误我很抱歉我想了解阿帕奇火花 http spark apache org 并使用它仅在我的电脑中在开发测试环境中由于Hadoop包含HDFS Hadoop分布式文件系统
在包加载之前如何知道 R 中特定函数属于哪个包？

例如我知道许多流行的功能例如tbl df 我通常不记得它属于哪个包即data table or dplyr 所以我必须始终记住并加载一个包但我做不到 tbl df除非我加载了正确的包在 R 控制台本身加载或安装包之前有没有办法知
data.table 抛出“找不到对象”错误[重复]

这个问题在这里已经有答案了我有一个数据表 library data table mydt lt data table index 1 10 当我在全局环境中尝试它时我可以让它工作但当我在调试器中或在包测试中使用它时却无法工作问题是我
dplyr：连接中的 NSE (by)

我很难弄清楚如何使用 dplyr left join 和 NSE 连接两个表问题是我无法为 by 提供正确的值我想我现在已经找到了解决方案但感觉我正在以一种额外复杂的方式来做因此如果您知道更简单更优雅的解决方案请告诉我这就是
增加雷达图中长轴标签的空间

我想创建一个雷达图ggirahExtra ggRadar 问题是我的标签很长并且被剪掉了我想我可以通过添加在标签和绘图之间创建更多空间margin margin 0 0 2 0 cm to element text in axis tex
使用点阵个性化 R 上显示的 X 轴值

我收集了大量包含日期客户端及其 NFS 使用情况的数据我正在使用lattice R包进行绘图正如对超级用户的建议 https superuser com questions 523195 plot custom log data on
R：如何将字符/数字转为1，NA转为0？

有没有一种简单的方法可以将列的字符数字变为 1 将 NA 变为 0 这里有一些示例数据我想将其应用于 3 4 structure list Item Code c 176L 187L 191L 201L 217L 220L Item x
如何在 R 中的 dygraph 标题中使用 UTF-8 字符

使用 Rstudio Windows8 当我使用 dygraph 函数绘制时间序列时在尝试在主标题中使用 UTF 8 字符时遇到问题 library dygraphs dygraph AirPassengers main T tulo 这
如何动态地将 sliderInput 添加到闪亮的应用程序中？

使用闪亮我上传一个 csv 文件并根据列名称我需要向 ui 添加滑块 sidebarPanel fileInput file1 Upload CSV File to Create a Model accept c text csv t
R：单纯形错误：在下标赋值中不允许使用 NA

对于以下具有目标函数和约束的最小化 boot simplex返回错误 Error in tab pr lt tab pr tab pr pc pv o tab pr NAs are not allowed in subscripted as
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
无法编译包“maps”

当我安装 maps 包时安装中出现警告 ld warning ignoring file Library Developer CommandLineTools SDKs MacOSX10 14 sdk usr lib libSystem
更改 R 中 ggplot geom_polygon 的颜色方案

我正在使用地图库和 ggplot 的 geom polygon 创建地图我只是想将默认的蓝色红色紫色配色方案更改为其他颜色我对 ggplot 非常陌生所以如果我没有使用正确的数据类型请原谅我使用的数据如下所示 gt head
获取包含矩阵行内最大值的列名称，该矩阵在数组内包含单独的最大值

例如给出 dim1 lt c P PO C T dim2 lt c LL RR R Y dim3 lt c Jerry1 Jerry2 Jerry3 Q lt array 1 48 c 4 4 3 dimnames list dim1 di
是否有weighted.median()函数？

我正在寻找类似形式的东西weighted mean 我通过搜索找到了一些解决方案这些解决方案写出了整个函数但希望有一些更用户友好的解决方案以下软件包都有计算加权中位数的函数 aroma light isotone limma cwhm
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
ggplot2：带有 geom_line 的 x 轴因子不起作用

我想要一个线图其中value绘制为函数expt每级一行var 这是我的数据 lines lt expt var value 1 none p 0 183065327746799 2 none p 0 254234138384241 3 n
R：改变堆积条形图的颜色

library ggplot2 df2 lt data frame supp rep c VC OJ each 3 dose rep c D0 5 D1 D2 2 len c 6 8 15 33 4 2 10 29 5 head df2 g
闪亮井板宽度

library shiny library shinydashboard ui lt dashboardPage dashboardHeader dashboardSidebar dashboardBody wellPanel tags d

随机推荐

悬停时图像变化 Java

我知道item1 setToolTipText This shows up on mouse hover 如果鼠标悬停在文本上将允许显示文本我想知道是否可以在鼠标悬停时改变图像提前致谢我会添加一个MouseListener到保存图像
Aurelia show.bind 是否有回调或承诺？

在我的模板中我想将一个 div 用作各种工具提示当我选择模型时会显示工具提示然后我使用系绳将其放置在正确的位置如果我在设置使元素显示的模型后立即设置 Tether 则它的大小无法正确计算并且 Tether 不会正确限制约束如果
将背景颜色和渐变组合到一个背景 CSS 属性中

我想将纯色和渐变结合在一个单一的颜色中backgroundCSS 属性然后我希望这两个背景具有单独的大小和位置参数并分别指定background position and background size属性以便将这两个背景彼此相邻 d
python aes加密/解密不返回相同的结果

下面的代码示例在加密解密操作后不返回原始文本我试图找出原因 from Crypto Cipher import AES text This is plain text to use It should be exqctly 128 ch
Ansible：使用带变量的嵌套组

我遇到的情况是我们有 3 层盒子在每一层中我们应用不同的变量设置例如缓存目录所在的位置但有很多默认值我还需要重写per node基础这通常是通过主机本身的库存变量来完成的我不确定组织主办方的最佳方式是什么以便优先作品对我有利
为什么 hsync() 不刷新我的 hdfs 文件？

尽管有关于这个主题的所有资源但我在刷新磁盘上的 hdfs 文件时遇到问题 hadoop 2 6 呼唤FSDataOutputStream hsync 应该可以解决这个问题但实际上它只有效一次原因不明这是一个失败的简单单元测试 Tes
测试自定义 UITableViewCell、cellForRowAtIndexPath 因 nil 出口而崩溃

我有一个包含 tableView 的 ViewController 由于我需要用测试很好地覆盖代码因此我需要为 tableView cellForRowAtIndexPath 编写一个测试 import UIKit class MainV
vbscript：如何将日期转换为天和时间

我从 WMI 获得了上次启动时间它看起来为 20141103113859 220250 060 我想将其转换为当前时间的天数和时间是否可以来自帮助使用 SWbemDateTime 对象将它们转换为常规日期和时间 Windows 20
TabActivity 中永远不会调用 onActivityResult

我知道有很多相同的问题但 OnActivityResult 仍然没有被调用这是我的代码活动一 Intent i new Intent Bundle b new Bundle b putString ActivityB LINK ad
WPF 甜甜圈进度条

我正在尝试将 WPF 4 Unleashed 一书中找到的饼图 ProgressBar 调整为看起来像甜甜圈我觉得我已经成功了一半但我不知道如何解决最后一个问题这是一张图片说明了我想要的以及我已经实现的目标这就是我想要的样子使用
如何强制 C# 构建过程包含代码中未使用的程序集

我有一个名为 Company Application 的应用程序它确实使用库公司控制反转公司职能合同公司职能该应用程序使用 InversionOfControl 来侦察程序集部分应用程序域方法是 appDomain Ge
在表单加载上使用进度条

我正在尝试用 C 设计一个 WinForms 控件它将在加载时从数据库中获取一些数据我想用进度条来显示进度我尝试了这段代码以及许多其他代码 protected override void OnLoad EventArgs e bas
Django 中的“gettext()”与“gettext_lazy()”

我有一个关于使用 ugettext 的问题gettext lazy 用于翻译我了解到在模型中我应该使用gettext lazy 而在视图 ugettext 中但是还有其他地方我应该使用吗gettext lazy 也表单定义又如何呢它
给定两个整数列表，我们如何找到一个列表中与另一个列表中最接近的数字？ [关闭]

Closed 这个问题需要多问focused 目前不接受答案鉴于我有两个不同的整数列表 a 1 4 11 20 25 and b 3 10 20 我想返回一个长度列表len b 存储最接近的数字a对于每个整数b 所以这应该返回 4 11
Outlook 加载项崩溃或您的服务器管理员限制了您可以同时打开的项目数量

我创建了一个简单的 Outlook 插件用于将联系人从一个文件夹复制到另一个文件夹约 5000 个联系人为什么我需要这个有一种奇怪的方法可以创建如上所述的公共地址簿here 那么为什么不复制公用文件夹中的所有联系人呢我希望我的团队
六边形联合图的 Seaborn 成对矩阵

我正在尝试生成比较分布的成对图矩阵像这样的东西由于我有很多点我想使用十六进制图来减少时间和绘图复杂性 import seaborn as sns import matplotlib pyplot as plt tips sns loa
如何在制作 htmlhelp 时使用 Sphinx RTD 主题隐藏侧边栏

使用时是否可以隐藏侧边栏Sphinx与ReadTheDocs theme 再扩展一下问题我可以在发出命令时包含侧边栏吗制作 html 并且不包括它发出命令制作 htmlhelp 不改变代码也许在layout html 中添加一些东西
JodaTime - 我如何知道指定时间段内是否发生夏令时？

我需要知道该期间是否由以下定义 DateTime start DateTime end 里面有夏令时我正在迭代由 start end 定义的周期集合并在每次迭代中将开始和结束时间向前移动 24 小时生成的周期从午夜开始到下一个午夜之
以编程方式将目标添加到按钮会引发错误“无法识别的选择器发送到类”

不知道为什么当我尝试使用我在代码中创建的按钮时收到无法识别的选择器发送到类错误这是我的代码 let sendButton UIButton let button UIButton type system button setTitle
使用sparkr时我应该在工作节点上预安装cran r包吗

我想在 cran 上使用 r 包例如forecast等与sparkr并遇到以下两个问题我应该在工作节点上预安装所有这些软件包吗但是当我读spark的源码时这个文件似乎spark会自动压缩包并通过 jars或 packages将它们分

使用sparkr时我应该在工作节点上预安装cran r包吗

使用sparkr时我应该在工作节点上预安装cran r包吗 的相关文章

随机推荐

热门标签

使用sparkr时我应该在工作节点上预安装cran r包吗的相关文章