Spark中的分布式缓存相当于什么？ [复制]

2024-02-15

在Hadoop中，您可以使用分布式缓存来复制每个节点上的只读文件。 Spark 中的等效方法是什么？我了解广播变量，但这仅适用于变量，而不适用于文件。

看一下 SparkContext.addFile()

在每个节点上添加要与此 Spark 作业一起下载的文件。传递的路径可以是本地文件、HDFS（或其他 Hadoop 支持的文件系统）中的文件，也可以是 HTTP、HTTPS 或 FTP URI。要访问 Spark 作业中的文件，请使用 SparkFiles.get(fileName) 查找其下载位置。

如果递归选项设置为 true，则可以给出目录。目前目录仅支持 Hadoop 支持的文件系统。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

scala

Hadoop

apachespark

Spark中的分布式缓存相当于什么？ [复制] 的相关文章

如何将列表转换为地图？

最近我和一位同事讨论了转换的最佳方式是什么List to Map在 Java 中这样做是否有任何具体的好处我想知道最佳的转换方法如果有人可以指导我我将非常感激这是个好方法吗 List
Java，将 null 分配给对象和仅声明之间有什么区别

之间有什么区别 Object o null and Object o 仅声明有人可以回答我吗这取决于您声明变量的范围例如局部变量没有default values在这种情况下你将不得不分配null手动在这种情况下实例变量分配 nul
我们如何测试我们的 Java UI？

我们正在寻找记录和回放类型的测试工具来自动化我们的一些 UI 功能测试我们已经研究了从 Silke 到 QTP 的大多数常见嫌疑但没有一个起作用当需要右键单击才能从右键单击菜单中选择某些内容时或者当您必须在网格的下拉列表中选择一个值
将 JSON Map 传递到 Spring MVC 控制器

我正在尝试将 Map 的 JSON 表示形式作为 POST 参数发送到我的控制器中 RequestMapping value search do method RequestMethod GET consumes application j
隐藏类的 System.out.print 调用

我正在使用 java 库 jar 文件该文件的作者放入了一堆System out print and System out printlns 有没有办法隐藏特定对象的这些消息编辑看起来jar文件似乎正在创建一堆线程并且每个线程都有它
获取TextView的高度

我有一些文字将被放入TextView 我这样做是使用setText 现在我需要找到文本在文本中占据的行数或高度TextView 我尝试使用getHeight 但它总是返回 0 无论如何有没有办法获得文本中存在的文本的高度TextView
总结二维数组

鉴于我当前的程序我希望它在用户输入所有值后计算每列和每行的总和我当前的代码似乎只是将数组的值加倍这不是我想要做的例如如果用户输入具有以下值 1 2 3 2 3 4 3 4 5 的 3x3 矩阵则看起来就像我在下面的程序中对其进行
通过spark-shell以静默模式执行scala脚本

需要通过spark shell以静默模式执行scala脚本当我使用时spark shell i file scala 执行后我进入scala交互模式我不想进入那里我尝试执行spark shell i file scala 但我不知道
在 JavaFX 中拖动未装饰的舞台

我希望将舞台设置为未装饰使其可拖动且可最小化问题是我找不到这样做的方法因为我遇到的示例是通过插入到主方法中的方法来实现的我想通过控制器类中声明的方法来完成此操作就像我如何使用下面的 WindowClose 方法来完成此操作这是
使用 CrudRepository 进行自定义查询

我想使用 CrudRepository 自定义查询这是我的代码 Repository public interface CustomerRepository extends CrudRepository
Akka 和 spring 配置

我正在尝试将 akka 与 spring 结合起来但没有成功基本上我的应用程序似乎不习惯读取 akka 模式具有架构的 service context xml 的一部分
多对多不检索映射数据

Spring boot 2 5 6 我无法安装版本概要文件 java Getter Setter NoArgsConstructor AllArgsConstructor EqualsAndHashCode FieldDefaults l
java 1.8下无法启动eclipse

java 1 8 升级后我无法启动 eclipse 附上错误截图这是我的 eclipse 配置设置我该如何解决 startup plugins org eclipse equinox launcher 1 3 0 v20120522 1
链表中的虚拟节点

问什么时候使用它们作业问题列表中的第一个和最后一个节点有时用作列表中的第一个和最后一个节点从未用作列表中的第一个和最后一个节点维基百科说哨兵节点是与链接一起使用的专门指定的节点列表和树作为遍历路径终止符哨兵节点的作用是不
如何告诉 IntelliJ 使用 Java 1.6 JDK 启动 gradle？

一个简单的问题即使经过几个小时的尝试和搜索我也无法弄清楚我安装了 Java 6 和 7 如何告诉 IntelliJ 使用 JDK 版本 1 6 启动 Gradle 构建无论我做什么 IntelliJ 都会以以下方式开始我的 grad
Apache HttpClient TCP Keep-Alive（套接字保持活动）

我的 http 请求需要太多时间才能被服务器处理大约 5 分钟由于连接闲置 5 分钟代理服务器将关闭连接我正在尝试在 Apache DefaultHttpClient 中使用 TCP Keep Alive 来使连接长时间处于活动状态
如何配置嵌入式 MongoDB 以在 Spring Boot 应用程序中进行集成测试？

我有一个相当简单的 Spring Boot 应用程序它公开一个小型 REST API 并从 MongoDB 实例检索数据对 MongoDB 实例的查询通过基于 Spring Data 的存储库下面的一些关键代码 Main applic
Python 可以替代 Java 小程序吗？

除了制作用于物理模拟如抛射运动重力等的教育性 Java 小程序之外还有其他选择吗如果你想让它在浏览器中运行你可以使用PyJamas http pyjs org 这是一个 Python 到 Javascript 的编译器和工具集
如何隐藏或删除 Android HoneyComb 中的状态栏？

如何隐藏或删除 Android HoneyComb 中的状态栏每次运行应用程序时我都会发现某些内容必须被状态栏覆盖我尝试改变AndroidManifest xml 但没有任何改变你不知道它被认为是永久的屏幕装饰就像电容式主页菜
Java，如何管理线程读取socket（websocket）？

我有一个 WebSocket 服务器我的服务器创建一个新线程来处理新连接该线程一直处于活动状态直到 websocket 中断我的问题对于 1 000 000 个连接我需要 1 000 000 个线程我如何通过一个线程处理多个

随机推荐

为什么 string.split() 结果包含未定义？

我想在其中一个上分割一个字符串 d or n 我能够成功地分割这两者之一但不能同时分割 gt msg foo 1 bar n baz 2 gt msg split d foo 1 bar baz 2 gt msg split n foo
在 POST 负载中使用环境变量

我可以在我发布的有效负载中使用先前测试中设置的环境变量吗 eg POST list some key environment saved value 是的你可以这么做你这样发送 some key environment variable
Python print 语句在参数之间添加空格

我正在编写一个非常基本的 hello 程序但我在名称和第一个感叹号之间不断出现空格而我在代码中没有看到该空格我尝试用几种不同的方式重新格式化字符串部分来连接间距但我无法弄清楚是什么导致了额外的空间我尝试过单独使用感叹号或者将其作
在 CUDA 内核中声明变量

假设您在 CUDA 内核中声明一个新变量然后在多个线程中使用它例如 global void kernel float delt float deltb int i blockIdx x blockDim x threadIdx x fl
为数据类型定义自己的 Ord

我正在尝试制作一些数据结构来解决图形难题我正在尝试定义边缘的比较标准但我不确定如何定义迄今为止 data Edge Edge Set String Bool 如果边缘具有相同的字符串集并且相等与布尔值没有任何关系我如何通知编译
unordered_map 具有三个元素

我试图在一个元素中包含三个元素unordered map 我尝试了以下代码 include
如何解除对 Java 启动进程的阻止？

当从命令行执行某些命令比如说 x 时我收到以下消息按任意键继续因此它会等待用户输入来解锁但是当我从 java 执行相同的命令 x 时 Process p Runtime getRuntime exec cmd null cmdDi
C# 数组的协变和逆变 [重复]

这个问题在这里已经有答案了在阅读一本section http en wikipedia org wiki Covariance and contravariance 28computer science 29 Arrays在维基百科上一篇
Html IFrame 标签未在电子邮件正文中解释

我需要在电子邮件正文中发送一个 html 文件其中包含 iframe 该 html 文件在浏览器中工作正常并播放视频但是当我在电子邮件正文中发送它时 iframe 标记不会被解释因此不会表现在身体上这是 html 文件 b Aman
分配给位置参数[重复]

这个问题在这里已经有答案了如何在 Bash 中为位置参数赋值我想为默认参数分配一个值 if z 4 then 4 3 fi 表明4不是命令 The set内置是设置位置参数的唯一方法 set this is a test echo 1
Scylladb：聚类键笛卡尔乘积大小 600 大于最大值 100

我正在使用 data stax java 驱动程序来查询 scylladb 我在从 scylla 读取数据时看到此错误 RequestHandler ip 9042 回复服务器错误集群键笛卡尔乘积大小 600 大于最大值 100 连接失效
Node.js - 服务器关闭了连接？

我正在 Node js 服务器上运行一个 Web 应用程序并且需要它始终在线因此我将永远使用它但这是我在一段时间后得到的结果 Error Connection lost The server closed the connection
如何改变ios中源图像的脸部肤色？

我的代码如何管理不同肤色的RGB值以及如何应用这段代码将改变脸部和头发的颜色但我想要 1 仅脸部着色不包括头发 void changeSkinColorValue float value WithImage UIImage nee
Angular：将参数传递给另一个组件

我被 Angular2 困住了我想从 a 传递参数产品页面例如产品 ID 到支付页面这是我迄今为止尝试过的付款 html Message message
覆盖对象时的 Perl 内存管理

我的问题是关于 Perl 如何在内部管理对象的数据当在 Perl 中创建对象时新的子例程通常会返回对受祝福的对象的引用以下面的代码为例 Create a new object my object Object gt new data1
如何找到当前系统时区？

在 Linux 上我需要找到当前配置的时区作为 Olson 位置我希望我的 C 或 C 代码能够移植到尽可能多的 Linux 系统例如我住在伦敦所以我当前的奥尔森位置是欧洲伦敦我是not对 BST EST 等时区 ID 感兴
SQL代码转换为C#数据类型问题

我试图回答这个问题所以问题 https stackoverflow com questions 58726514 sp execution time is extremely slow 给出以下 SQL 代码 DECLARE input1
如何将文本转换为 SVG 路径？

我在 ttf 文件中有一个字体想要生成 SVG 并将文本转换为路径我不需要图像因此使用 imagettftext 或 Image Magick 字体渲染功能是不够的我需要可以放大和缩小的形状我想丢失有关所用字体的信息并且不想在中
Java 8 Stream：如何将当前元素与下一个元素进行比较？

如何从a中获取下一个元素List使用 Java 8 流如果我迭代List 我想将当前元素与列表的下一个元素进行比较使用 Java 8 Stream 可行吗 My free StreamEx https github com amaemb
Spark中的分布式缓存相当于什么？ [复制]

这个问题在这里已经有答案了在Hadoop中您可以使用分布式缓存来复制每个节点上的只读文件 Spark 中的等效方法是什么我了解广播变量但这仅适用于变量而不适用于文件看一下 SparkContext addFile 在每个节点上添

Spark中的分布式缓存相当于什么？ [复制]

Spark中的分布式缓存相当于什么？ [复制] 的相关文章

随机推荐

热门标签