如何使用scala从数据框中获取字符串列的最大长度?

2024-01-09

这可能是一个非常简单的问题。我正在使用 Spark 1.6 和 scala

var DF=hivecontext.sql("select name from myTable")
val name_max_len =DF.agg(max(length($"name"))) // did not work

println(name_max_len)

我怎样才能获得最大长度?


您应该收集结果:

import org.apache.spark.sql.functions.max

val df = Seq("foo", "bar", "foobar").toDF("name")
df.agg(max(length($"name"))).as[Int].first
// res0: Int = 6
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用scala从数据框中获取字符串列的最大长度? 的相关文章

随机推荐

  • “APP”中无法使用 Apple Pay

    提前致谢 我在我的应用程序中使用 Apple Pay 我在 Apple 中注册了新的商家 ID 和来自支付网关的证书 通过使用此商家 ID 付款摘要表正在打开 但当我选择付款时 收到如下错误消息 Apple Pay 在 APP 中不可用 检
  • :before 和 ::before 有什么区别?

    我刚刚看到一个 CSS 代码 其中包括 before标签 我在看MDN https developer mozilla org en CSS before看看是什么 before是但我真的不明白 有人可以解释它是如何工作的吗 它会在我们通过
  • 找不到与给定名称匹配的资源 Theme.AppCompat.Light.NoActionBar

    我正在 Styles xml 文件中添加一些项目 但是 它给了我一个错误 这是我的代码
  • 如何在 mysql 中创建作业或事件

    我想创造一份工作mysql它在一天结束时运行 在该作业中我想更新表中的一些列值 假设我有 2 个表 其中有一列名为Status这是Pending or Accepted 为此 我想创建一个作业 在其中搜索两个表并设置Pending状态为Ac
  • ant 支持 java 9 addmods 选项

    我正在尝试使用 Java 9 编译我的 java 项目 我正在使用 java xml bind 包 所以我需要使用 addmods 选项 用于编译 Ant 1 9 7 似乎不支持这个新功能 ant 支持 Java 9 编译器的 addmod
  • Python - Networkx 搜索前驱节点 - 超出最大深度

    我正在使用 Python 中的 Networkx 库 用于图形管理 进行一个项目 并且在尝试实现我需要的内容时遇到了麻烦 我有一个有向图的集合 将特殊对象作为节点和与边关联的权重 问题是我需要从输出节点到输入节点遍历该图 对于每个节点 我必
  • ajax加载不同内容后如何刷新Select2下拉菜单?

    我在下拉菜单组合中使用 Select2 我有一份 国家 菜单和一份 州 省 菜单 根据所选国家 地区的不同 州 省 下拉列表的内容会发生变化 使用ajax从数据库中提取州 省 然后以如下方式显示 display output
  • 改进频率时间归一化/希尔伯特传输运行时间

    所以这是一个有点本质的问题 我有一个时间序列信号 它具有不均匀的响应谱 我需要将其白化 我使用频率时间归一化方法进行此白化 其中使用恒定的窄频带 最低频率端成员的约 1 4 逐步过滤两个频率端点之间的信号 然后 我找到表征每个窄带的包络 并
  • 无法启动 SSMS (SQL Server 2014 Express) - 许可证数据无效。需要重新安装

    我有一台运行 Windows Server 2012 RS 和 IIS 8 5 的新服务器 我已经安装了 SQL Server 2014 Express 但在 IIS 下的站点连接到 最初为占位符 数据库时遇到问题 为了让 Visual S
  • 我如何在 RxJava 中显式地发出 Flowable 完成的信号?

    我正在尝试创建一个Flowable这是包装一个Iterable 我将元素推送到我的Iterable定期但似乎完成事件是隐式的 我不知道如何表示处理已完成 例如在我的代码中 note that this code is written in
  • 信号编号 2 的名称

    我想知道是否有一个模块或编译指示定义了由system称呼 例如 use feature qw say use strict use warnings my cmd sleep 10 my res system cmd my signal r
  • 在 npm 脚本中运行批处理文件

    是否可以以及如何在 npm 命令中运行批处理脚本 我有一个有角度的项目 在package json文件 下scripts部分 我想定义一个 npm 命令来运行批处理脚本 我知道我可以使用关键字运行 shell 脚本bash e g star
  • 将 Ruby on Rails 从版本 3.2.13 升级到 4.0.0 时遇到问题

    对于我的应用程序 我正在尝试从版本升级 Ruby on Rails3 2 13 to 4 0 0我在安装 更新一些 gem 通过使用 Bundler 时遇到了麻烦 特别是全球化3 https github com svenfuchs glo
  • javascript,如何在将 DOMparser 与 text/html 一起使用时删除 元素

    The code var txt div fe div div fe div div fe div var parser new DOMParser var temp node parser parseFromString txt text
  • 为什么在 MySQL 中存储二进制数据?

    我有点困惑 在数据库中存储二进制数据有什么优点 是出于安全原因 还是有一些我看不到的更复杂的动机 谢谢你的时间 相对于什么 将其放入文件系统中 使用文件系统进行二进制文件存储的缺点是 你没有得到 ACID 合规性 如果您可能将应用程序托管在
  • Java 中类型安全的方法反射

    有什么实用的方法可以以类型安全的方式引用类上的方法吗 一个基本的例子是 如果我想创建类似以下实用函数的东西 public Result validateField Object data String fieldName Validatio
  • 为什么 Dart(Flutter) 中的“.map”比“while/for 循环”慢

    我看到了这篇文章 https itnext io comparing darts loops which is the fastest 731a03ad42a2 https itnext io comparing darts loops w
  • 从 Jenkins 中的 Jacoco 覆盖范围中排除包

    由于我的 Jenkins 管道失败 尝试从覆盖率报告中排除包 我有一个包含所有 POJO s 的子项目 我不想为所有这些编写 uittest 因此 他们会降低分支 线路覆盖率 使覆盖率低于阈值并使我的构建失败 应该可以排除一些软件包 但我无
  • git checkout:这个奇怪的输出是什么意思?

    当我结帐时 我得到 me localhost git checkout master D deps example M deps example2 Switched to branch master 手册页没有提到这个神秘的输出 这是什么意
  • 如何使用scala从数据框中获取字符串列的最大长度?

    这可能是一个非常简单的问题 我正在使用 Spark 1 6 和 scala var DF hivecontext sql select name from myTable val name max len DF agg max length