如何爆炸空间分隔的柱子？

2024-04-20

我在 Spark Scala 中有一个示例数据框，其中包含一列和许多其他列 50+，并且需要分解 id ：

示例数据：

id             name   address
234 435 567    auh    aus
345 123        muji   uk

输出数据：

id             name   address
234            auh    aus
435            auh    aus
567            auh    aus
345            muji   uk
123            muji   uk

尝试这个：

import org.apache.spark.sql.functions._

scala> df.withColumn("id", explode(split($"id", " "))).show
+---+----+-------+
| id|name|address|
+---+----+-------+
|234| auh|    aus|
|435| auh|    aus|
|567| auh|    aus|
|345|muji|     uk|
|123|muji|     uk|
+---+----+-------+

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

apachesparksql

如何爆炸空间分隔的柱子？的相关文章

在scala / play框架中构建Json文件

我正在使用 Play 框架和 Scala 我需要提供一个如下所示的输入 id node37 name 3 7 data children 如何使用 json 获取该格式以下是 Play 框架网站上的示例 val JsonObject Js
Scala REPL 中的递归重载语义 - JVM 语言

使用 Scala 的命令行 REPL def foo x Int Unit def foo x String Unit println foo 2 gives error type mismatch found Int 2 required
';'预期但发现“导入” - Scala 和 Spark

我正在尝试使用 Spark 和 Scala 来编译一个独立的应用程序我不知道为什么会收到此错误 topicModel scala 2 expected but import found error import org apache sp
Scala 中抛出异常，什么是“官方规则”

我正在 Coursera 上学习 Scala 课程我也开始阅读 Odersky 的 Scala 书我经常听到的是在函数式语言中抛出异常不是一个好主意因为它破坏了控制流并且我们通常返回一个失败或成功的 Either Scala 2
如何将 scala 列表转换为 javascript 数组？

有更简单的方法吗 document ready function var jsArray if scalaList null for id lt scalaList jsArray push id 很简单如下所示 import play
如何在Gradle中支持多种语言（Java和Scala）的多个项目？

我正在尝试将过时的 Ant 构建转换为 Gradle 该项目包含约50个Java子项目和10个Scala子项目 Java 项目仅包含 Java Scala 项目仅包含 Scala 每个项目都是由 Java 和 Scala 构建的这大大减慢
Scala（或 Java）中泛型函数的特化

是否可以在 Scala 中专门化泛型函数或类例如我想编写一个将数据写入 ByteBuffer 的通用函数 def writeData T buffer ByteBuffer data T buffer put data 但由于 put
如何在 Apache Spark 中通过 DStream 使用特征提取

我有通过 DStream 从 Kafka 到达的数据我想进行特征提取以获得一些关键词我不想等待所有数据的到达因为它是可能永远不会结束的连续流所以我希望以块的形式执行提取如果准确性会受到一点影响对我来说并不重要到目前为止我整理
多个 scala 库导致 intellij 出错？

我正在使用 intellij 14 和 scala 2 11 6 使用 homebrew 安装并使用符号链接 ln s usr local Cellar scala 2 11 6 libexec src usr local Cellar s
具有两个通用参数的上下文边界

在 Scala 中我可以使用上下文边界 def sort T Ordered t Seq T 与以下意思相同 def sort T t Seq T implicit def Ordered T 如果我有一个带有两个泛型参数的类怎么办 IE
Scala 的代码覆盖率工具 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Spark SQL 失败，因为“常量池已超过 JVM 限制 0xFFFF”

我在 EMR 4 6 0 Spark 1 6 1 上运行此代码 val sqlContext SQLContext getOrCreate sc val inputRDD sqlContext read json input try inp
高效序列化案例类

对于我正在工作的图书馆我需要提供一个高效便捷 typesafe序列化 scala 类的方法理想的情况是用户可以创建一个案例类并且只要所有成员都是可序列化的它似乎也应该如此我准确地知道序列化和反序列化阶段的类型因此不需要也不能
对两种类型之间的二元关系进行建模

有企业也有人用户可以对某个企业点赞或发表评论但效果是一样的can not发生在一个人身上当用户发布有关某个企业的内容或对其点赞时该企业就被称为target喜欢或帖子 trait TargetingRelation Targetin
使用 net.liftweb.json 或 scala.util.parsing.json 解析大型 (30MB) JSON 文件会出现 OutOfMemoryException。有什么建议吗？

我有一个包含大量测试数据的 JSON 文件我想解析这些数据并推送我正在测试的算法它的大小约为 30MB 包含大约 60 000 个元素的列表我最初在 scala util parsing json 中尝试了简单的解析器如下所示 im
Spark：如何使用crossJoin

我有两个数据框 df1有 100000 行并且df2有 10000 行我想创建一个df3这是两者的交叉连接 val df3 df1 crossJoin df2 这将产生 10 亿行尝试在本地运行它但似乎需要很长时间您认为本地可以实现
Scala中有类似Java Stream的“peek”操作吗？

在Java中你可以调用peek x gt println x 在 Stream 上它将对每个元素执行操作并返回原始流这与 foreach 不同 foreach 是 Unit Scala 中是否有类似的东西最好是适用于所有 Monady
在 Scala 中将元素追加到列表末尾

我无法添加 type 元素T到一个列表中List T 我尝试过myList myElement但它似乎创建了一个奇怪的对象并访问myList last始终返回放入列表中的第一个元素我怎么解决这个问题 List 1 2 3 4 Result
Slick和bonecp：org.postgresql.util.PSQLException：FATAL：抱歉，太多客户端已经错误

当我在本地开发应用程序时我使用以下命令启动我的 play2 应用程序sbt run 我喜欢如何更改代码然后重新加载浏览器以查看我的更改在大约 10 次代码更改之后我收到 postgresql 太多连接错误见下文我的数据库连接使用
Spark DataFrame 序列化为无效 json

TL DR 当我倾倒 Spark 时DataFrame作为 json 我总是得到类似的结果 key1 v11 key2 v21 key1 v12 key2 v22 key1 v13 key2 v23 这是无效的 json 我可以手动编辑转储

随机推荐

用泛型 T 扩展类

在 TypeScript 中有没有办法用泛型类型扩展类请参阅我的假设场景示例其中我希望我的类具有名为品种或其他的属性 interface dog breed string export class animal
当我在 NetLogo 中取消世界环绕时，为什么会出现错误？

我下载了一个工作模型并正在对其进行调整以适应我的标准我想禁用世界环绕以便海龟在移动到初始屏幕时受到限制但是当我这样做时我收到一条错误消息告诉我 OF预期输入是海龟代理集或补丁代理集或海龟或补丁但没有得到任何人欢迎来到 Sta
如何使用多语言/多个index.html文件正确设置React Router？

我正在构建一个 Web 应用程序使用最新的 React 和 React Router 版本就我而言我的应用程序支持多种语言并且由于索引我们为每种语言都有单独的条目 html 文件因此对于像 myapp com 这样的 url
使用 Shell 脚本根据条件编辑和更新 XML

我想改变一个值即value false 使用 Shell 脚本我该如何去做呢请向我提供任何建议我尝试过使用过的我使用命令 gt sed s true false g ml xml Problem But all true内容改变
为什么分配给多个目标（标识符/属性）会产生奇怪的结果？

我有一些这样的代码 def foo bar initial bar Bar while True next bar Bar bar next bar next bar bar next bar return initial bar 其目的是
具有 Room 和状态处理功能的 Kotlin 协程流

我正在尝试新的协程流程我的目标是创建一个简单的存储库可以从 Web api 获取数据并将其保存到数据库还可以从数据库返回流程我使用 room 和 firebase 作为 Web api 现在一切看起来都非常简单直到我尝试将来自 a
OCaml：用消息断言

又是另一个问题 P 我不太确定是否应该将其发布在这里或 OCaml 邮件列表上但我首先尝试这样做我喜欢断言语句然而我发现如果没有附加消息错误消息几乎毫无用处第 XXX 行的断言冲突很好但实际上出了什么问题我认为断言的一个很
在 Javascript 中迭代数组

我是一个 JavaScript 新手我正在尝试练习一些示例 JavaScript 问题当涉及到迭代数组的问题时我有点困惑有人能指出我正确的方向吗我正在尝试接受价值观oldArray 分别添加 5 并存储在newArray var
Windows Phone 7 上的 Dispatcher.Invoke()？

在回调方法中我尝试获取文本框的文本属性如下所示 string postData tbSendBox Text 但因为它不是在 UI 线程上执行所以它给了我一个跨线程异常我想要这样的东西 Dispatcher BeginInvoke
从 powershell 脚本引用 .Net .dll

您能帮我从 powershell 脚本引用 Net dll 吗我正在使用 powershell ISE 编写调试脚本我有一些引用 Nuget 包的 net 代码我想将该代码嵌入到 powershell 脚本中如果我在 C WIND
创建片段时的NPE

我正在创建一个关于Fragment with sensorEventlitener 主要活动主办fragment如下代码所示但在运行时我收到下面发布的内容logcat Errors 主要活动 public class MainActivi
用于查找应用于特定分支的标签的命令

用于查找应用于特定分支的标签的命令假设我有一个名为 BR test 的分支名称我想知道该分支上应用的所有标签是什么如果这是 UCM 一个简单的lsbl就足够了 cleartool lsbl stream myStream mypvob
Django 的内存错误

我有一个 Django 应用程序它将大量数据加载到 sqlite3 数据库文件中我们正在谈论数百万个条目这些条目输入到一个函数中在执行的某个时刻会抛出异常 File root codebase lib python2 6 site
从单例类中检索 Ruby 对象？

可以访问单例类 https ruby doc org core 2 5 1 Object html来自 Ruby 对象 some object singleton class 是否可以进行相反的操作在单例类中访问原始对象 class lt
找不到 com.google.android.gms:play-services:7.3.0

我有来自 Android Studio gradle 的日志 Error A problem occurred configuring project ParseStarterProject gt Could not resolve all
返回对象中项目总数的最佳 RESTful 方法是什么？

我正在为我参与的一个大型社交网站开发 REST API 服务到目前为止它运行良好我可以发出GET POST PUT and DELETE请求对象 URL 并影响我的数据但是此数据是分页的一次限制为 30 个结果通过我的 API
使用 php 缩短 if else 语句

我有一个关于缩短 if else 语句的问题我正在尝试使用制作天气应用程序打开天气地图 https openweathermap org weather conditionsAPI 但我不喜欢那些图标我想像这样更改图标 if desc
如何在 Android 上显示当前可见活动的对话框？

我的问题类似于这个2年前的问题 https stackoverflow com questions 3136187 how to detect if any of my activity is front most and visible
lib 未指定 & loadNamespace 中出现错误

我的一切都可以使用 R 和 RStudio 但后来我在清理计算机目录和文件时移动了文件夹现在我收到以下错误消息 R和RStudio应该安装在Program Files or Program Files x86 我应该有两个libPaths
如何爆炸空间分隔的柱子？

我在 Spark Scala 中有一个示例数据框其中包含一列和许多其他列 50 并且需要分解 id 示例数据 id name address 234 435 567 auh aus 345 123 muji uk 输出数据 id name

如何爆炸空间分隔的柱子？

如何爆炸空间分隔的柱子？ 的相关文章

随机推荐

热门标签

如何爆炸空间分隔的柱子？的相关文章