如何将自定义 Java 类转换为 Spark 数据集

2024-01-10

我无法找到将测试对象列表转换为 Spark 中的数据集的方法 这是我的课:

public class Test {
    public String a;
    public String b;
    public Test(String a, String b){
        this.a = a;
        this.b = b;
    }

    public List getList(){
        List l = new ArrayList();
        l.add(this.a);
        l.add(this.b);

        return l;
    }
}

您在注释中创建 DataFrame 的代码是正确的。不过你定义的方式有问题Test。您只能使用 Java Bean 中的代码创建 DataFrame。你的Test类不是一个Java豆 https://stackoverflow.com/questions/3295496/what-is-a-javabean-exactly。修复该问题后,您可以使用以下代码创建 DataFrame:

Dataset<Row> dataFrame = spark.createDataFrame(listOfTestClasses, Test.class);

和这些行来创建类型化数据集:

Encoder<Test> encoder = Encoders.bean(Test.class);
Dataset<Test> dataset = spark.createDataset(listOfTestClasses, encoder);
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将自定义 Java 类转换为 Spark 数据集 的相关文章

  • 使用 Spring MVC 返回 PDF 文件

    实际上 我有这个功能 我有一个框架 可以在其中设置 URL ip port birt preview report report rptdesign format pdf parameters 并且该框架呈现 PDF 文件 但我想隐藏该网址
  • 从 Bitmap 类创建 .bmp 图像文件

    我创建了一个使用套接字的应用程序 客户端在其中接收图像并将图像数据存储在 Bitmap 类中 谁能告诉我如何创建一个名为我的图像 png or 我的图像 bmp来自此 Bitmap 对象 String base64Code dataInpu
  • Java,将 null 分配给对象和仅声明之间有什么区别

    之间有什么区别 Object o null and Object o 仅声明 有人可以回答我吗 这取决于您声明变量的范围 例如 局部变量没有default values在这种情况下你将不得不分配null手动 在这种情况下实例变量分配 nul
  • 在 Java 中填充布尔数组

    作为一名相当新手的 Java 程序员 我给自己设定了一个艰巨的挑战 尝试编写一个简单的文本冒险 不出所料 我已经遇到了困难 我试图为我的 Location 类提供一个属性来存储它包含的退出 我为此使用了一个布尔数组 本质上保存代表每个出口的
  • Jodatime 日期格式

    是否可以格式化 JodaTime 日期 这是代码 private static LocalDate priorDay LocalDate date1 do date1 date1 plusDays 1 while date1 getDayO
  • 将 EditText 聚焦在设备上运行的 PopupWindow 中时出现异常

    我正在为 Android 开发一个弹出窗口 它正在工作 我在上面添加了一个 EditText 和一个按钮 当在 ADV 上运行时 它可以正常工作 而在设备上运行时 当我专注于 EditText 时 这会抛出一个奇怪的异常 android v
  • 在 JavaFX 中拖动未装饰的舞台

    我希望将舞台设置为 未装饰 使其可拖动且可最小化 问题是我找不到这样做的方法 因为我遇到的示例是通过插入到主方法中的方法来实现的 我想通过控制器类中声明的方法来完成此操作 就像我如何使用下面的 WindowClose 方法来完成此操作 这是
  • 使用 CrudRepository 进行自定义查询

    我想使用 CrudRepository 自定义查询 这是我的代码 Repository public interface CustomerRepository extends CrudRepository
  • Java中的OR运算(BitSet.class)

    如何编写一个程序 该程序需要001010101110000100100 011100010001000011000 000000000010000000000100 作为输入 位 输出将是OR其中 3 个 OR 0 0 0 0 1 1 1
  • Java中无参数的for循环

    我在看别人的代码 发现了这段代码 for 我不是 Java 专家 这行代码在做什么 起初 我认为这会创建一个无限循环 但在该程序员使用的同一个类中 while true 其中 如果我错了 请纠正我 是一个无限循环 这两个相同吗 为什么有人会
  • 如何告诉 cxf 将包装类型保留在方法中?

    在我的 WSDL 中我有一个操作
  • wsdl 没有服务元素

    我必须使用 WCF Web 服务并获得 WSDL 外部的 因此无法控制 WSDL 在 WSDL 定义中 我没有找到包含服务 端口和地址元素的服务元素 WSDL 中不存在这种情况正常吗 这对于 WCF WSDL 来说很常见吗 我正在尝试使用轴
  • 在Spring-Boot中,我们如何在同一个项目中连接两个数据库(Mysql数据库和MongoDB)?

    我正在尝试创建一个 Spring Boot 项目 其中我有一个要求 我想连接到不同的数据库 MySql 和 MongoDB 我是否需要做一些特殊的事情来连接到这两个数据库 或者 spring boot 会自动计算出自己连接到这两个数据库 我
  • Spark shuffle 溢出指标

    在 Spark 2 3 集群上运行作业时 我在 Spark WebUI 中注意到某些任务发生了溢出 据我所知 在reduce端 reducer获取所需的分区 随机读取 然后使用执行器的执行内存执行reduce计算 由于没有足够的执行内存 一
  • Apache HttpClient TCP Keep-Alive(套接字保持活动)

    我的 http 请求需要太多时间才能被服务器处理 大约 5 分钟 由于连接闲置 5 分钟 代理服务器将关闭连接 我正在尝试在 Apache DefaultHttpClient 中使用 TCP Keep Alive 来使连接长时间处于活动状态
  • Python 可以替代 Java 小程序吗?

    除了制作用于物理模拟 如抛射运动 重力等 的教育性 Java 小程序之外 还有其他选择吗 如果你想让它在浏览器中运行 你可以使用PyJamas http pyjs org 这是一个 Python 到 Javascript 的编译器和工具集
  • spring data jpa 过滤 @OneToMany 中的子项

    我有一个员工测试实体是父实体并且FunGroup信息子实体 这两个实体都是通过employeeId映射 我需要一种方法来过滤掉与搜索条件匹配的子实体 以便结果仅包含父实体和子实体 满足要求 员工测试类 Entity name Employe
  • 将带有时区的 Joda-Time `DateTime` 转换为没有时区的 DateTime?

    Given a DateTime http www joda org joda time apidocs org joda time DateTime html例如2015 07 09T05 10 00 02 00 using 乔达时间 h
  • Java,如何管理线程读取socket(websocket)?

    我有一个 WebSocket 服务器 我的服务器创建一个新线程来处理新连接 该线程一直处于活动状态 直到 websocket 中断 我的问题 对于 1 000 000 个连接 我需要 1 000 000 个线程 我如何通过一个线程处理多个
  • Spark SQL中如何按列降序排序?

    I tried df orderBy col1 show 10 但它是按升序排列的 df sort col1 show 10 也按升序排序 我查看了 stackoverflow 发现的答案都已过时或称为 RDD https stackove

随机推荐

  • Kafka-MongoDB Debezium 连接器:分布式模式

    我正在研究 debezium mongodb 源连接器 我可以通过将 kafka bootstrap 服务器地址提供为远程计算机 部署在 Kubernetes 中 和远程 MongoDB url 来在本地计算机上以分布式模式运行连接器吗 我
  • Python functools.wraps 相当于类

    使用类定义装饰器时 如何自动转过来 name module and doc 通常 我会使用 functools 中的 wraps 装饰器 这是我为一个类所做的事情 这不完全是我的代码 class memoized Decorator tha
  • 按名称读取 javascript cookie

    我已经使用设置了一个cookie document cookie MYBIGCOOKIE value expires now toGMTString path 现在该网站上设置了 5 到 10 个 cookie 有没有办法通过名称检查该 c
  • 如何使用 Windows 身份验证在 IIS 上授权 CORS 预检请求

    我在 ASP net Core 2 Windows 身份验证 上有一个 API 在 Angular 上有一个前端 我做了一个 cors 配置来从 SPA 角度查询我的后端 但由于预检而被阻止 他被 IIS 服务器拒绝 因为他没有标识信息 错
  • 更改 play.google.com/apps/publish/ 中的隐私政策 URL

    I entered the wrong URL in Privacy Policy URL box and published the app in alpha release App is now Pending publication
  • 有没有专门的方法来获取 python `Enum` 中的项目数量?

    说我有这样一条蟒蛇Enum class from enum import Enum class Mood Enum red 0 green 1 blue 2 有没有一种自然的方法来获取项目总数Mood 就像不必迭代它 或者添加额外的n项目
  • 您不能多次定义关联名称“链接”

    您好 提前谢谢您 我在 Magento 2 3 的产品页面中出现错误 您不能多次定义关联名称 链接 trace 0 您定义的关联名称 链接 不能超过 一次 1 0 home buybionette public html vendor ma
  • 如何制作浮动控件

    我想创建一个控件 该控件 可能 浮动在其包含表单的边界之外 这可能吗 我可以怎样做呢 这与上下文菜单的功能非常相似 只是我需要能够向其中添加其他控件 例如按钮和图像 您想要一个 FormBorderStyle 设置为 None 的表单 如果
  • 如何在 Android Studio IDE 中自定义硬换行垂直线以进行代码格式化

    当我应用 格式化代码 时 即使我的屏幕有足够的空间将其显示在一行上 我的代码行也会自动向下行 多行 我发现这取决于垂直线 图像中的红色 我怎样才能删除这条线或加宽它 我的语言是 Dart 您可以禁用该线路文件 gt 设置 gt 编辑器 gt
  • 我必须以编程方式从 Android 应用程序的 manifest.xml 中检索权限组

    我想以分组方式列出设备上安装的每个应用程序所获取的权限 请看看这个 我希望这对你有帮助 private static final int REQUEST PERMISSIONS 10 Override protected void onCr
  • 从 PHP 查询时,视图内的 Postgresql regexp_matches 始终返回 null

    我有与此类似的观点 CREATE OR REPLACE VIEW regexp test AS SELECT regexp matches decode NTB4 base64 text d x 当我从 pgAdmin 查询视图时 按预期返
  • 代码中的注释有标准格式吗? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我想知道人们在代码中是否有标准的注释格式 不是方法或类的 xml 注释 而是注释within一个方法 也可以看看 是否有注释 C 代码的标准 如
  • 从代码隐藏访问 div 标签

    我正在使用 asp net 和 c 我有一个div在我的应用程序中标记class something 我需要访问这个某物代码隐藏中的类 我该怎么做 Code div class something somecode div Note 我想要
  • JavaScript:forEach 循环中的奇怪行为

    我的代码如下所示 someArray forEach x gt do something console log calling api for x callAnHttpApiAsync sleep 10 http api 调用是异步的 但
  • 无法在 Spring4D 中使用带有比较器的默认参数值

    我不确定这是否是一些通用问题 还是因为 Spring4D 实现 但我不能使用默认参数值来创建比较器 type TMyClass class class function MyComparer AParam Boolean False ICo
  • 在 Laravel Eloquent 模型中创建动态命名的变体

    我有一个日期字段列表 所有这些字段的变异器都有相同的逻辑 我想将此功能提取到一个特征中 以便将来我需要的只是在模型中创建一个日期字段数组并使用该特征 像这样的事情 foreach dates as date dateCamelCase th
  • 从 Maven 运行 Gradle

    我正在寻找一些 Maven 的 Gradle 执行器插件 类似于 Maven ant run 插件 谷歌没有提供帮助 难道这样的插件不存在吗 我应该尝试这个 https github com if6was9 gradle maven plu
  • 实现docker容器按需启动

    情况 大量重型 docker 容器会在一段时间内定期受到攻击 然后在较长时间内保持未使用状态 希望 按需启动容器 就像 systemd 通过套接字激活启动容器一样 并在空闲一段时间后停止它们 不visible最终用户的停机时间 Option
  • 忘记是行不通的

    如果我尝试从此集合中删除某个项目 examples Example where example data example gt get 通过做 examples gt forget 20 它不会从集合中删除该项目 我仍然取回原来存在的所有项
  • 如何将自定义 Java 类转换为 Spark 数据集

    我无法找到将测试对象列表转换为 Spark 中的数据集的方法 这是我的课 public class Test public String a public String b public Test String a String b thi