将 RDD 转换为 JSON 对象

2023-12-04

我有一个 RDD[(String, List[String])] 类型的 RDD。

例子:

(FRUIT, List(Apple,Banana,Mango))
(VEGETABLE, List(Potato,Tomato))

我想将上面的输出转换为 json 对象,如下所示。

{
  "categories": [
    {
      "name": "FRUIT",
      "nodes": [
        {
          "name": "Apple",
          "isInTopList": false
        },
        {
          "name": "Banana",
          "isInTopList": false
        },
        {
          "name": "Mango",
          "isInTopList": false
        }
      ]
    },
    {
      "name": "VEGETABLE",
      "nodes": [
        {
          "name": "POTATO",
          "isInTopList": false
        },
        {
          "name": "TOMATO",
          "isInTopList": false
        },
      ]
    }
  ]
}

请建议最好的方法。

NOTE: "isInTopList": false始终是常量,并且必须与 jsonobject 中的每个项目一起存在。


首先,我使用以下代码重现您提到的场景:

val sampleArray = Array(
("FRUIT", List("Apple", "Banana", "Mango")),
("VEGETABLE", List("Potato", "Tomato")))

val sampleRdd = sc.parallelize(sampleArray)
sampleRdd.foreach(println) // Printing the result

现在,我正在使用json4sScala 库将此 RDD 转换为您请求的 JSON 结构:

import org.json4s.native.JsonMethods._
import org.json4s.JsonDSL.WithDouble._

val json = "categories" -> sampleRdd.collect().toList.map{
case (name, nodes) =>
  ("name", name) ~
  ("nodes", nodes.map{
    name => ("name", name)
  })
}

println(compact(render(json))) // Printing the rendered JSON

结果是:

{"categories":[{"name":"FRUIT","nodes":[{"name":"Apple"},{"name":"Banana"},{"name":"Mango"}]},{"name":"VEGETABLE","nodes":[{"name":"Potato"},{"name":"Tomato"}]}]}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将 RDD 转换为 JSON 对象 的相关文章

  • Bug 组合:jQuery 1.4、ajax/json、Firebug Lite 和 IE 8

    我刚刚得出结论 无论我如何尝试 jQuery 的 ajax 调用都无法在 IE 8 中处理 JSON 数据 我发现我可以使用 jQuery 1 3 2 库 这解决了问题 但 1 4 根本无法处理 JSON ajax 请求 即使返回的 JSO
  • 将当前类作为 scala 中的参数传递

    如何传递当前类作为参数 在java中我们这样做 mymethod this class or mymethod MyClass class 如何将 scala 当前类传递给此方法 this getClass or classOf MyCla
  • 如何防止 SQL Server 在导入数据时去除前导零

    A data file被导入到SQL Server桌子 数据文件中的一列是文本数据类型 该列中的值只能是整数 SQL Server 数据库中目标表中的相应列的类型为varchar 100 但在数据导入后 SQL Server 会存储以下值
  • 如何在 Spark 数据帧 groupBy 中执行 count(*)

    我的目的是做相当于基本sql的事情 select shipgrp shipstatus count cnt from shipstatus group by shipgrp shipstatus 我见过的 Spark 数据帧的示例包括其他列
  • Python-如何删除 json 字符串中最后的逗号(,)

    嗨 我刚刚开始尝试 python tornado 和 mongodb 我是新手 我编写了一个简单的 get 函数来从 mongodb 获取所有值并以 JSON 格式返回 问题是 当我尝试将输出写入 JSON 字符串时 我在集合中的最后一条记
  • 使用 NSJSONSerialization 解析 JSON

    对此进行了太多讨论 但我不知道如何解决我的问题 这是我从 WorldWeatherOnline 获取的 JSON 数据 JSON 有效 但我不知道如何解析它 这是我的代码 后面是 JSON 请帮忙 NSError errorInfo NSD
  • Elasticsearch GET API 获取分片大小

    在 Elasticsearch 2 3 3 中 有没有办法使用返回 JSON 的 GET API 获取分片大小 目前我找到了以下几种获取shard size的方法 这两种方法都存在问题 recovery gt 使用 JSON 进行响应并提供
  • 解析错误:第 2 行第 0 列的数字文字无效

    我正在尝试读取一个大的 json 数据结构 我收到消息 解析错误 第 2 行第 0 列的数字文字无效 我正在使用的命令是下一个 n rules echo rulebase list jq total 该文件在第一层次结构中具有一个变量 该变
  • Json.dump 失败并显示“必须是 unicode,而不是 str”TypeError

    我有一个 json 文件 其中恰好有大量中文和日文 以及其他语言 字符 我将其加载到我的 python 2 7 脚本中使用io open如下 with io open multiIdName json encoding utf 8 as j
  • 代码点火器 JSON

    你好 我使用 codeigniter 然后我从控制器中的数据库中回显输出 然后在我的视图文件中执行以下操作 但它没有显示任何内容 S 我的模型文件 function forumList this gt db gt select oversk
  • 来自 Janino 和 Commons-Compiler 的 Spark java.lang.NoSuchMethodError

    我正在构建一个使用 Spark 进行基于随机森林分类的 应用程序 当尝试运行该程序时 我从该行收到异常 StringIndexerModel labelIndexer new StringIndexer setInputCol label
  • Node.js - 异步 JSON 查询

    如果这是一个愚蠢的问题 我深表歉意 但我对 Javascript 很陌生 而 Node js 确实让我很头疼 因为它是异步的 我的目标是从 API 查询 JSON 对象并能够使用它 我试图寻找关于我应该做什么的问题和答案 但它们对我来说都没
  • 气流:如何将读取 json 文件的方法放入本地库中

    我必须产生一些DAG 我已将 json 表架构文件保存在GCP铲斗 https cloud google com storage docs json api v1 buckets GCP 存储桶上的文件关联到composer将被重新映射到
  • Scala 中的高级类型 [重复]

    这个问题在这里已经有答案了 我正在阅读 Scala 中的函数式编程一书 在 Monoids 章节中 他们讨论了 Monoid 接口 如下所示 trait Monoid A def op a1 A a2 A A def zero A 后来 他
  • 如何强制控制器/操作使用 JsonValueProvider

    再会 我正在使用 ASP NET MVC 3 其中JsonValueProvider http haacked com archive 2010 04 15 sending json to an asp net mvc action met
  • json、rails、javascript 中的解析错误

    我需要将 ruby 数组放入 javascript 数组中 但出现解析错误 var characters 这就是我将 ruby 嵌入到内联 javascript 中的方式 但它出现了解析错误 我应该如何将此 ruby 数组放入 javasc
  • 如何将 yii2 Restful api 中两个表的关系数据显示为 json 格式

    我遇到了将两个表中的数据显示为 JSON 格式并在 yii2 Restful api 上工作的问题 这是我的结构数据库 TABLE volunteer volunteer id int 11 NOT NULL auto increment
  • 如何在scala中生成n-gram?

    我正在尝试在 scala 中编写基于 n gram 的分离新闻算法 如何为大文件生成 n gram 例如 对于包含 蜜蜂是蜜蜂中的蜜蜂 的文件 首先它必须选择一个随机的 n 元语法 例如 蜜蜂 然后它必须寻找以 n 1 个单词开头的 n 元
  • 在 Scala 中创建任意类作为 monad 实例

    为了使任何东西都可以在 monad 上下文中操作 如果使用 Haskell 我只需在任何地方为给定类型添加类 Monad 的实现 所以我根本不接触数据类型定义的来源 像 人造的东西 data Z a MyZLeft a MyZRight a
  • 与文件名中的冒号“:”作斗争

    我有以下代码 用于加载大量 csv gz 并将它们转储到其他文件夹中 并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts

随机推荐

  • 将日期作为因子错误转换为日期

    我在计算从 csv 文件导入的日期时遇到问题 我想要做的是在因素 DateClosed 中获取该日期并在日期字段 a 中生成日期 例如 如果 a 203 我希望日期等于 DateClosed 203 但是 我在使用下面列出的代码时遇到了问题
  • Android FLAG_ACTIVITY_CLEAR_TOP 无法正常工作?

    我真的不明白所有这些标志是如何工作的 因为我完全按照文档所说的操作 并且它没有解决我的问题 我的活动是这样启动的 第一 活动 A gt 活动 B gt 第二 活动 A 如果我按返回按钮 它会返回到活动 B gt 活动 A gt 退出应用程序
  • 通过 PowerShell 命令获取返回对象的类 - 确定 cmdlet 的输出数据类型

    在PowerShell中 如果一个命令返回一个或多个对象的数组 我可以通过以下方法找出该对象的类 ab SampleCommand ab 0 getType 但是 如果命令没有返回任何内容 0 值的数组 我如何找出该命令的默认返回类型 注意
  • 我可以使用java在黑莓手机上打开“.pdf”文档吗?

    我可以使用java在黑莓手机上打开 pdf 文档吗 如果是 那么如何 黑莓中没有任何本地功能可以加载pdf文件 但是您可以在浏览器字段中加载谷歌查看器 这样就可以了 D public ScrLoad String url http docs
  • 如何更改 GitHub 上存储库的语言?

    GitHub 搜索允许按语言过滤存储库 如何将存储库设置为特定语言 您还可以覆盖某些文件 cat gitattributes rb linguist language Java Source
  • 更改最后一个字母的颜色

    示例代码 p class test string p 我想更改最后一个字母的颜色 在本例中为 g 但我需要 css 解决方案 我不需要 javascript 解决方案 我一个字母一个字母地显示字符串 但无法使用静态解决方案 大家都说做不到
  • 使用 PHP 八进制和字符串转换

    我正在使用一个数据库 该数据库包含一堆以前导 0 为前缀的序列号 因此 序列号可能类似于 00032432 或 56332432 问题在于 PHP 我不明白八进制转换系统是如何工作的 一个具体的例子是 我试图将所有这些基于整数的数字与字符串
  • 升级到 mac Big Sur 后,SnowSQL 失败,并显示“无法找到库安全性”

    升级到 macOS Big Sur 后 我的 Snowsql 脚本全部失败 并显示 无法找到库安全性 snowsql q select 1 x User me Password XXX The library Security could
  • 字符编码UTF-8和ISO-8859-1规则是什么

    我想知道是否有一篇文章讨论字符编码 UTF 8 和 ISO 8859 1 的规则 有人也可以指出我其他字符编码的规则吗 读这个 http www joelonsoftware com articles Unicode html 它将清除您对
  • 如何在注入的服务中访问用户令牌以重新编码密码?

    我有下面的代码 我试图在用户登录时重新编码密码 数据库已从旧网站迁移 但是 我不确定我做错了什么 因为我不断收到错误 尝试调用类 AppBundle Service HubAuthenticator 的名为 forward 的未定义方法 我
  • 如何将四元数转换为角度?

    有没有将四元数转换为角度的公式 希望使用 Core Motion API 和陀螺仪在 iPhone 上做一些事情 以便根据我从它收到的数据 以四元数的形式 我可以在屏幕上投影 UIView Thanks Yes see Quaternion
  • Google Cloud Functions 是否能够免受 DDoS 攻击?

    据我了解 我的 Google Cloud Functions 可以在全球范围内访问 如果我想控制对它们的访问 我需要将授权作为函数本身的一部分来实现 比如说 我可以使用基于不记名令牌的方法 这将保护该功能背后的资源免遭未经授权的访问 然而
  • iOS requestAccessToAccountsWithType 不显示权限提示/NSAlert

    据我了解 当我调用 ACAccountStore requestAccessToAccountsWithType options completion 用户应该会看到一个 UIAlert 询问他们是否授予我的应用程序权限 当我运行这段代码时
  • 实施 Google URL 缩短 API 的跨域问题

    我正在尝试在 jQuery 的帮助下通过 AJAX 调用来实现 Google URL 缩短器 API 我做过这样的事情 function btnshorten click function var longURL tboxLongURL v
  • 使用 PHP 获取 Discord 中的成员总数

    我有一个拥有 1361 名成员的 Discord 服务器 我想在我的网站上显示加入用户的总数 我已经弄清楚如何使用以下方法获取服务器上的所有在线会员 我应该采取什么不同的做法来获取已加入服务器的所有用户的总
  • 使用 TypeNameHandling 对 System.Drawing.Color 进行 JSON.NET 序列化

    我想序列化一个Dictionary
  • 属性号 10 超过列数 0

    此查询成功返回表中的所有行 大约 850 select from my db log where date trunc day creation date gt to date 2014 03 05 text yyyy mm dd 但是当我
  • Python 按字母顺序对字符串进行排序,小写在前

    我想使用 python 按字母顺序对给定的字符串数组进行排序 但小写单词应该首先出现 一个例子 usr local bin python2 7 arr A e a D f B arr sort for s in arr print s In
  • TabLayout 和 ViewPager 无法在 Android 片段内工作

    您好 我在片段中有一个 TabLayout 和 ViewPager 但我无法在选项卡之间滑动以到达子片段 在 活动 中正常工作 但在 片段 中不起作用 这是我在片段内的 Tablayout 代码 Override public View o
  • 将 RDD 转换为 JSON 对象

    我有一个 RDD String List String 类型的 RDD 例子 FRUIT List Apple Banana Mango VEGETABLE List Potato Tomato 我想将上面的输出转换为 json 对象 如下