如何将列聚合到 JSON 数组中?

2024-01-22

如何转换如下数据以便将数据存储在 ElasticSearch 中?

这是一个 bean 数据集,我将按产品将其聚合到 JSON 数组中。

List<Bean> data = new ArrayList<Bean>();
data.add(new Bean("book","John",59));
data.add(new Bean("book","Björn",61));
data.add(new Bean("tv","Roger",36));
Dataset ds = spark.createDataFrame(data, Bean.class);

ds.show(false);

+------+-------+---------+
|amount|product|purchaser|
+------+-------+---------+
|59    |book   |John     |
|61    |book   |Björn    |
|36    |tv     |Roger    |
+------+-------+---------+


ds = ds.groupBy(col("product")).agg(collect_list(map(ds.col("purchaser"),ds.col("amount")).as("map")));
ds.show(false);

+-------+---------------------------------------------+
|product|collect_list(map(purchaser, amount) AS `map`)|
+-------+---------------------------------------------+
|tv     |[[Roger -> 36]]                              |
|book   |[[John -> 59], [Björn -> 61]]                |
+-------+---------------------------------------------+

这就是我想将其转换为:

+-------+------------------------------------------------------------------+
|product|json                                                              |
+-------+------------------------------------------------------------------+
|tv     |[{purchaser: "Roger", amount:36}]                                 |
|book   |[{purchaser: "John", amount:36}, {purchaser: "Björn", amount:61}] |
+-------+------------------------------------------------------------------+

解决方案 :

ds.groupBy(col("product"))
  .agg(collect_list(to_json(struct(col("purchaser"), col("amount"))).alias("json")));
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将列聚合到 JSON 数组中? 的相关文章

随机推荐

  • 如何使 pytest 因警告而崩溃?

    这是一个扩展如何找到 因非串联而排序 警告的来源 https stackoverflow com questions 54486927 how do i find where a sorting because non concatenat
  • 数据包已发送但无法接收到数据包

    我一直在编辑安卓toyvpn https android googlesource com platform development master samples ToyVpnVPN 的示例项目 我为我的示例应用程序找到了这个 我知道我的代
  • PHP 变量大小有限制吗?

    我需要知道 PHP 是否有可变的限制大小 我从 SQL 数据库中获取一个字符串字段并使用echo在网页上查看它 我遇到的问题是 当我查看网页时 我看不到数据库字段中的所有内容 PHP 变量的大小有限制吗 有没有办法让 PHP 从数据库中读取
  • 如何使用 Ninject 将服务注入授权过滤器?

    我正在使用 asp net mvc 3 ninject 2 0 和 ninject mvc 3 插件 我想知道如何将服务层放入我的过滤器中 在本例中是授权过滤器 我喜欢进行构造函数注入 所以这是可能的还是我必须进行属性注入 Thanks E
  • 当 cfn 模板和管道都是使用 AWS CDK 创建时,如何使用 CodePipeline 部署 CloudFormation 堆栈?

    我使用 AWS CDK 创建了一个带有自动扩展组的简单堆栈 并定义了启动配置资源以在 ec2 实例创建期间执行一些 powershell 脚本 这些脚本位于同一个 cdk typescript 项目中 我使用 aws s3 asset 构造
  • UICollectionView 最后一个单元格未对齐

    我是 iOS 新手 现在遇到一个问题 我的目标是获得一个带有过滤按钮的滑动条 我有一个 UICollectionView 作为其他视图中的子视图 除了最后一个单元格之外 所有视图都显示良好 这是 uicollectionview 的委托和日
  • 当我在平面上嵌入平面图时,如何找到包含预定义点的面

    我有一个嵌入在平面上的平面图 平面图 并且想要搜索它的面 该图不是连接的 而是由多个连接的图组成 这些图不能单独寻址 例如 子图可以包含在另一个图的表面中 我想找到包含某个二维点的多边形 面 多边形由图形的面形成 由于面孔数量相当大 我想避
  • 如何杀死扭曲的协议实例python

    我有一个使用 Twisted 用 python 编写的服务器应用程序 我想知道如何终止我的协议 bottalk 的实例 每次我获得新的客户端连接时 我都会在内存中看到该实例 print Factory clients 但是假设我想从服务器端
  • 如何将sql参数作为整数数据类型变量中的空值传递?

    如何将 sql 参数作为空值传递给整数数据类型变量 StockBO sBO new StockBO sBO Mode 2 if ddcmpanyname SelectedIndex 0 sBO Client id Convert ToInt
  • 如何检查引用的程序集在运行时是否可用?

    我正在创建一个简单的 独立的 net winforms 应用程序 它引用了程序集Microsoft SqlServer SqlWmiManagement Net Framework 4 的版本可能存在或不存在于客户端计算机上 如果该程序集不
  • 如何使用 es6 import 加载 emscripten 生成的模块?

    我正在尝试导入使用 emscripten 生成的模块作为 es6 模块 我正在尝试与基本示例 https kripken github io emscripten site docs porting connecting cpp and j
  • 跨多列排序 (Perl)

    对于以下代码 我将如何对多个列进行排序 目前 代码 1 得到一个 lista 中的文件数 directory2 使用正则表达式获取 fileName fileLocation and fileSize对于中的每个元素 list3 将 2 中
  • 数据注释验证属性中的 string.Format

    有没有办法使用格式化字符串而不是直接常量来设置数据注释消息 我需要像下面的代码一样设置必填字段 ErrorMessage 但它给了我一个错误 Required ErrorMessage string Format SystemMessage
  • Hyperledger Composer 点对点连接未建立

    我们使用 Hyperledger Composer 建立了一个业务网络 并通过创建对等点来创建参与者卡 当我们在导入参与者卡后尝试将对等方连接到本地的另一台计算机时 我收到以下错误 错误 尝试登录并获取用户上下文时出错 错误 尝试时出错 注
  • 运行 GO111MODULE=on go install 。 ./cmd/... 在云初始化中

    我有一个使用 cloud init 部署的 bash 脚本 我的 bash 脚本包含以下部分代码 GO111MODULE on go install cmd 当直接在已部署服务器的终端中运行我的 bash 脚本时 它按预期工作 但是当我在云
  • 我应该如何管理基于 Xml 的文档的不同不兼容格式

    我有一个应用程序 它以基于 Xml 的格式保存文档 例如 Word 文档 目前 从 xsd 文件生成的 C 类用于读取 写入文档格式 一切都很好 直到最近我不得不更改以下格式 该文件 我担心的是我的应用程序的未来版本的向后兼容性need能够
  • Ionic:如何不堆叠多个 toast 通知?

    我得到了以下 Ionic 代码片段 用于在工业应用程序中显示警报 错误 showError message string let toast this toastController create message message posit
  • Phpunit骨架生成器找不到扩展类

    我有一个基于 Zend Framework 的应用程序 我尝试使用 phpunit 生成测试用例的框架 Phpunit 似乎无法找到我尝试生成的类的父类 phpunit skeleton test Default Model Person
  • TFS 构建期间未找到程序集

    遇到问题的是项目在本地编译得很好 但 TFS 构建报告找不到程序集 日志文件将显示 2 gt C 程序文件 x86 MSBuild 12 0 bin amd64 Microsoft Common CurrentVersion targets
  • 如何将列聚合到 JSON 数组中?

    如何转换如下数据以便将数据存储在 ElasticSearch 中 这是一个 bean 数据集 我将按产品将其聚合到 JSON 数组中 List