我应该将变量保留为瞬态吗？

2024-03-01

我一直在尝试使用 Apache Spark 来解决一些查询，例如 top-k、skyline 等。

我做了一个包装纸，其中包含SparkConf and JavaSparkContext named SparkContext。这个类也实现了可序列化，但是因为SparkConf and JavaSparkContext不可序列化，那么该类也不可序列化。

我有一个解决 topK 查询的类，名为TopK，该类实现了可序列化，但该类还有一个SparkContext不可序列化的成员变量（由于上述原因）。因此，每当我尝试执行时，我都会遇到异常TopK方法从内部.reduce()RDD 中的函数。

我找到的解决方案是SparkContext短暂的。

我的问题是：我应该保留SparkContext变量是瞬态的还是我犯了一个大错误？

SparkContext class:

import java.io.Serializable;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.*;

public class SparkContext implements Serializable {

    private final SparkConf sparConf; // this is not serializable
    private final JavaSparkContext sparkContext; // this is not either

    protected SparkContext(String appName, String master) {
        this.sparConf = new SparkConf();
        this.sparConf.setAppName(appName);
        this.sparConf.setMaster(master);

        this.sparkContext = new JavaSparkContext(sparConf);
    }

    protected JavaRDD<String> textFile(String path) {
        return sparkContext.textFile(path);
    }

}

TopK class:

public class TopK implements QueryCalculator, Serializable {

    private final transient SparkContext sparkContext;
    .
    .
    .
}

抛出的例子Task not serializable例外。 getBiggestPointByXDimension甚至不会被输入，因为为了让它在包含它的类的reduce函数中执行（TopK) 必须是可序列化的。

private Point findMedianPoint(JavaRDD<Point> points) {
    Point biggestPointByXDimension = points.reduce((a, b) -> getBiggestPointByXDimension(a, b));
    .
    .
    .
}

private Point getBiggestPointByXDimension(Point first, Point second) {
        return first.getX() > second.getX() ? first : second;
    }

对于你的问题：我应该将 SparkContext 变量保留为瞬态变量吗?

是的。没关系。它仅封装 (Java)SparkContext 并且上下文在工作人员上不可用，因此对其进行标记transient只是告诉序列化器不要序列化该字段。

你也可以拥有自己的SparkContext包装器不可序列化并将其标记为瞬态 - 与上面的效果相同。（顺便说一句，鉴于 SparkContext 是 Spark 上下文的 Scala 类名称，我选择了另一个名称以避免将来混淆。）

还有一件事：正如您所指出的，Spark 尝试序列化完整的封闭类的原因是因为该类的方法正在闭包中使用。避免这种情况！使用匿名类或自包含闭包（最后将转换为匿名类）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

我应该将变量保留为瞬态吗？的相关文章

将构造函数作为参数传递给方法

我是java新手开始研究构造函数我看到一些构造函数作为参数传递给方法的示例请告诉我当构造函数作为参数传递给方法时会发生什么或者建议我一些链接我可以在其中获得有关使用构造函数的足够知识根据您需要传递构造函数的目的您可以考虑传递供
将 MouseListener 添加到面板

我正在尝试将鼠标操作添加到我的面板中这就是程序应该做的事情编写一个程序允许用户通过按三下鼠标来指定一个三角形第一次按下鼠标后画一个小点第二次按下鼠标后绘制一条连接前两个点的线第三次按下鼠标后绘制整个三角形第四次按下鼠标会
使类只能从特定类实例化

假设我有 3 节课class1 class2 and class3 我怎样才能拥有它class1只能通过实例化class2 class1 object new class1 但不是 class3 或任何其他类我认为它应该与修饰符一起使用
运行 java -jar 时出现 java.lang.ClassNotFoundException

我正在使用 ant 来构建我的build xml文件它编译正常但随后得到运行时java lang NoClassDefFoundError通过运行生成的 jar 时java jar my jar jar 似乎这个问题出现了很多但没有
本地开发的 Azure Functions 扩展包版本问题

我有一个带有队列触发器的 Java 11 Azure 函数该函数在部署到 Azure 时按预期工作并正确从定义的服务总线主题中提取消息但是运行相同的功能locally除非我回滚版本否则不起作用Azure Functions 绑定扩
即使在轴上进行自动量程调整，我也可以保留积分刻度线吗？

我偷了一些代码here http fxexperience com 2012 01 curve fitting and styling areachart 拥有一个AreaChart我在 FXML 中使用了平滑线条它的工作原理如下
在哪里保存选项值、重要文件的路径等[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在创建一个程序需要设置一些选项值以及图像文件的一些路径 SQLite 数据库的路径有关各种按钮上文本的一些信息有关要使用哪个数据库的信
记录共享和映射的诊断上下文

据我所知其他人做了什么来解决 Commons Logging 项目针对 NET 和 Java 不支持映射或嵌套诊断上下文这一事实执行摘要我们选择直接使用实现者日志框架在我们的例子中为 log4j 长答案您是否需要一个抽象日志框架
JUnit5 平台启动器 API - 如果没有至少一个测试引擎，则无法创建启动器

我正在尝试升级我们的自动化测试套件的测试能力以接受 JUnit5 测试并遵循JUnit 平台启动器 API 说明 https junit org junit5 docs current user guide launcher api我收到错
Java：SortedMap、TreeMap、可比较？如何使用？

我有一个对象列表需要根据其中一个字段的属性进行排序我听说 SortedMap 和 Comparator 是实现此目的的最佳方法我是否要与正在排序的类实现 Comparable 还是创建一个新类如何实例化 SortedMap 并传入
如何在 JPA 和 Hibernate 中将数据库生成的列值定义为只读字段？

使用 MariaDB 10 2 可以定义日期时间的默认值例如创建和最后修改我应该如何将此列作为只读字段访问因为这个值应该只在数据库的控制之下并且不应该从代码中修改但我想在代码中读取这个属性这很简单只需设置insertable
用于层次结构树角色的 Spring Security / Java EE 解决方案

我知道 Spring Security 非常适合标准角色和基于权限的授权我不确定的是这种情况系统中管理着 10 000 名员工员工被组织成组织结构图跨部门的谁向谁报告的树其中一些员工是用户这些用户仅被允许访问其职责范围内的员工
在 Java 中创建 XML 文件的最佳方法是什么？

我们目前使用 dom4j 来创建 XML 文件不过我猜现在有更好的东西了如果我们使用的是 Java 1 6 或更高版本那么在编写 XML 文件时最好使用什么类运行速度最快使用简单我不需要构建一个 DOM 然后编写整个 DOM
Java 中 JButton 的击键/热键

最初我使用 JMenu 并建立热键以使用加速器工作它运行得很好现在我想在 JButton 中实现相同的行为但我陷入困境这是我编写的代码请分享您的想法以便我可以走上正确的道路 import javax swing import j
使用单独的线程在java中读取和写入文件

我创建了两个线程并修改了 run 函数以便一个线程读取一行另一个线程将同一行写入新文件这种情况会发生直到整个文件被复制为止我遇到的问题是即使我使用变量来控制线程一一执行但线程的执行仍然不均匀即一个线程执行多次然后控制权转移
如何从 JavaFX 中的另一个控制器类访问 UI 元素？

我有一个使用 NetBeans 8 编写的 JavaFX Java 8 应用程序没有SceneBuilder 我的应用程序有一个主窗口该窗口有自己的 FXML 文件 primary fxml 和自己的控制器类 FXMLPrimaryCo
spring data jpa复合键重复键记录插入导致更新

我有一个具有复合键的实体我试图通过使用 spring data jpa 存储库到 mysql 数据库来持久化它如下所示 Embeddable public class MobileVerificationKey implements S
受信任的 1.5 小程序可以执行系统命令吗？

如果是的话这个能力有什么限制吗具体来说我需要以 Mac OSX 为目标我以前用过这个在 Windows 系统上启动东西但从未在 Mac 上尝试过 public void launchScript String args Strin
Java/MongoDB 按日期查询

我将一个值作为 java util Date 存储在我的集合中但是当我查询以获取两个特定日期之间的值时我最终得到的值超出了范围这是我的代码插入 BasicDBObject object new BasicDBObject objec
Errors/BindingResult 参数应在模型属性、@RequestBody 或 @RequestPart 参数之后立即声明

我通过剖析示例应用程序来自学 Spring 然后到处添加代码来测试我在剖析过程中开发的理论在测试添加到 Spring 应用程序中的一些代码时我收到以下错误消息 An Errors BindingResult argument is ex

随机推荐

THREE.JS 场景中永无止境的楼层

在我的 canvas Three js 场景中创建各个方向连续的地板的最佳方法是什么最好将 THREE PlaneGeometry 附加到相机位置以便它随相机移动或者是否有另一种方法可以使用纹理对场景的地板进行纹理化我的 Plane
日志中的西里尔文日志显示不正确

目前日志以错误的编码 ISO 8859 1 而不是 UTF 8 记录请求和响应这就是西里尔字母显示不正确的原因 message 目前库版本 2 3 0 日志文本在 org zalando logbook DefaultHttpLogF
WildFly 9.0.1.Final 附带哪些版本的库

我正在寻找https docs jboss org author display WFLY9 Documentation https docs jboss org author display WFLY9 Documentation 但没有
在Java中将整数转换为int数组[重复]

这个问题在这里已经有答案了我对 Java 编程非常陌生想知道是否有一种方法可以将整数转换为 int 数组我问的原因是因为我知道可以将整数转换为字符串所以我希望还有其他快捷方式可供我学习我想做的一个例子是获取 int 10382 并
模拟器与 iPad 上部署的差异

我刚刚将我的 iPhone 应用程序部署到我的 iPad 2 我仅有的 iOS 设备上并惊讶地发现了这种差异以及其他功能差异如果我无法弄清楚我将在另一篇文章中解决这些差异每个系统如何显示事物该应用程序是为 iOS 7 iPho
是否有一个 C# 命令行命令可以帮助我获取应用程序的 GIT 提交哈希值？

这个问题是后续问题另一个 https stackoverflow com questions 69371809 how to add commit hash to details of an executable file 在这个问题中有
Android - 如何在动画后与视图交互？

我有一个使用动画的视图翻译动画 http developer android com reference android view animation TranslateAnimation html TranslateAnimation t
我们是否应该对 C# 中从 Microsoft.Rest.ServiceClient 派生的客户端使用单例？

使用从 swagger 规范例如与 Azure 资源管理器关联的规范生成的 Azure NET SDK 时生成的库利用 Microsoft AutoRest 客户端运行时并且各种客户端均继承自 ServiceClient 我们一
错误：无法运行 /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/usr/bin/ibtool （没有此类文件）

我正在尝试使用 ibtool 进行 iOS 开发本地化但是当我从终端运行它时出现以下错误 Error Can t run Applications Xcode app Contents Developer Platforms MacO
CriteriaBuilder：使用 ON 子句连接一对多

假设您有以下 OneToMany 关系 School gt Student gt ScientificWork 现在您想要选择所有学生名为 John 且他的科学工作称为黑洞的学校我按照以下方式进行操作但由于某种原因它返回了我所有可能
primefaces 数据表列过滤框中不显示下拉列表

我正在使用 Jsf 2 2 和 primefaces 4 0 当我使用此代码时一切正常
与 java 一起使用的最佳数学库是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
组合两个相等链表的转轮技术

所以我在这里面临着一个疑问我正在读破解编码面试一书那里写着下面的文字假设你有一个链表a1 gt a2 gt an gt b1 gt b2 bn 并且您想将其重新排列为a1 gt b1 gt a2 gt b2 gt an gt b
如何删除mongodb中的深层嵌套对象

假设我有一个代表这样的书籍的文档 id 1234567890 title Lord Of The Rings books 1234567890 id 123456789890 title The Two Towers page count
如何更改 wcf 客户端中的时间戳安全标头？

我正在尝试修改安全标头的默认过期时间即 5 分钟到 1 分钟服务器的安全策略之一是时间戳请求的日期生存时间为一分钟任何想法我尝试创建自定义绑定但没有成功
ActiveAdmin 中的格式提示问题（不需要的对象 ID 输出）

当我使用 formattastic DSL 进行 ActiveAdmin 编辑表单时我得到以下输出 0x00000006bd1018 gt 图片标签 gt 为什么这从 obj inspect 的结果开始以及如何删除这部分导致此错误的代码
如何正确使用范围 https://www.googleapis.com/auth/drive.file

我尝试使用以下代码访问我的 Google 云端硬盘中的 Google 表格文件 import gspread from oauth2client service account import ServiceAccountCredential
我的 UITableViewController 中的内存泄漏在哪里？

表视图工作正常但是当我离开视图并第二次返回时出现内存泄漏可能 viewDidLoad 中的某些内容不确定我正在运行泄漏工具并收到以下通知 Leaked Object Address Size Responsible Library
在PyQt中，如何将终端嵌入到窗口中？

我有一个小脚本旨在将 xterm 嵌入 PyQt GUI 中在 Linux 上它可以工作创建一个如下所示的 GUI 然而在 OS X 上运行相同的脚本会产生两个如下所示的窗口有谁知道如何解决这个问题并防止 OS X 搞砸 GUI
我应该将变量保留为瞬态吗？

我一直在尝试使用 Apache Spark 来解决一些查询例如 top k skyline 等我做了一个包装纸其中包含SparkConf and JavaSparkContext named SparkContext 这个类也实现了可

我应该将变量保留为瞬态吗？

我应该将变量保留为瞬态吗？ 的相关文章

随机推荐

热门标签

我应该将变量保留为瞬态吗？的相关文章