Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List()

2024-01-06

我搜索了与这个问题相关的其他答案，但没有帮助。

我正在尝试向数据框中添加一列。该列的数据类型为Seq[CaseClass]。起初我认为 Spark 可能不支持集合类型列，但事实并非如此。

这是我尝试运行的代码示例。我只想向每一行添加一个空的 Seq[CaseClass]，以便稍后追加。

case class Employee(name: String)
val emptyEmployees: Seq[Employee] = Seq()
df.withColumn("Employees", lit(emptyEmployees))

但后来我发现这个错误被抛出withColumn

Unsupported literal type class scala.collection.immutable.Nil$ List()
java.lang.RuntimeException: Unsupported literal type classscala.collection.immutable.Nil$ List()

如果您使用的是spark 2.2+，那么只需更改lit() to typedLit()，根据this https://stackoverflow.com/a/35420501/2639647 answer.

case class Employee(name: String)
val emptyEmployees: Seq[Employee] = Seq()
val df = spark.createDataset(Seq("foo")).toDF("foo")
df.withColumn("Employees", typedLit(emptyEmployees)).show()

向我们展示：

+---+---------+
|foo|Employees|
+---+---------+
|foo|       []|
+---+---------+

Update

对于 2.1，上面该版本的链接答案通过转换您的lit(Array)进入一个array() of lit()s （使用一些神奇的 scala 语法）。在你的情况下，这会起作用，因为数组是空的。

def asLitArray[T](xs: Seq[T]) = array(xs map lit: _*)

case class Employee(name: String)

val emptyEmployees: Seq[Employee] = Seq()
val df = spark.createDataset(Seq("foo")).toDF("foo")

df.withColumn("Employees", asLitArray(emptyEmployees)).show()

其结果相同：

+---+---------+
|foo|Employees|
+---+---------+
|foo|       []|
+---+---------+

真正拥有一些东西在你的Seq需要稍微不同的功能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

DataFrame

apachesparksql

caseclass

Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List() 的相关文章

使用 net.liftweb.json 或 scala.util.parsing.json 解析大型 (30MB) JSON 文件会出现 OutOfMemoryException。有什么建议吗？

我有一个包含大量测试数据的 JSON 文件我想解析这些数据并推送我正在测试的算法它的大小约为 30MB 包含大约 60 000 个元素的列表我最初在 scala util parsing json 中尝试了简单的解析器如下所示 im
Play框架：单属性案例类的JSON读取

我正在尝试为包含单个属性的案例类创建隐式 JSON Reads 但收到错误 Reads Nothing 不符合预期类型这是代码 import play api libs functional syntax import play api
使用 Scala 获取 Spark 数据集中最新时间戳对应的行

我对 Spark 和 Scala 比较陌生我有一个具有以下格式的数据框 Col1 Col2 Col3 Col 4 Col 5 Col TS Col 7 1234 AAAA 1111 afsdf ewqre 1970 01 01 00 00
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
andThen 类型不匹配的 Scala 链接函数

我有一堆函数可以清理文本并将它们分成单词最小的例子 val txt Mary had a little nlamb val stopwords Seq a def clean text String String text replace
Slick和bonecp：org.postgresql.util.PSQLException：FATAL：抱歉，太多客户端已经错误

当我在本地开发应用程序时我使用以下命令启动我的 play2 应用程序sbt run 我喜欢如何更改代码然后重新加载浏览器以查看我的更改在大约 10 次代码更改之后我收到 postgresql 太多连接错误见下文我的数据库连接使用
Spark DataFrame 序列化为无效 json

TL DR 当我倾倒 Spark 时DataFrame作为 json 我总是得到类似的结果 key1 v11 key2 v21 key1 v12 key2 v22 key1 v13 key2 v23 这是无效的 json 我可以手动编辑转储
Java 8 Stream，获取头部和尾部

Java 8 引入了Stream http download java net jdk8 docs api java util stream Stream html类似于 Scala 的类Stream http www scala lang
在 Shiny 应用程序中过滤数据时，长度为 1 的字符向量除了第一个元素之外的所有元素都将被忽略错误

我有以下闪亮的应用程序 library shiny library rhandsontable library shinydashboard library ggplot2 library dplyr setwd C Users Marc
将 IndexToString 应用于 Spark 中的特征向量

Context 我有一个数据框其中所有分类值都已使用 StringIndexer 进行索引 val categoricalColumns df schema collect case StructField name StringType
Akka-Streams 收集数据（Source -> Flow -> Flow (collect) -> Sink）

我对 Scala 和 Akka 完全陌生我有一个简单的 RunnableFlow Source gt Flow do some transformation gt Sink runForeach 现在我想要这样的东西 Source gt
如何在 scala repl 和 sbt 控制台中关闭/打开 typer 阶段

是否可以在不退出当前会话的情况下切换阶段我尝试进入 power 模式但它仍然不打印类型在SBT中只需添加以下设置 set scalacOptions in Compile console Xprint typer 在 REPL 中你可
如何通过 javascript 和 ajax 调用 Scala 中的方法？

我不知道我的标题是否有点误导但这是我真正需要帮助的我正在获取这个网址 get fb login fbEmail function data console log data 这是我的路线 GET fb login email prese
在 Spark 结构化流 2.3.0 中连接两个流时，左外连接不发出空值

两个流上的左外连接不发出空输出它只是等待记录添加到另一个流中使用套接字流来测试这一点在我们的例子中我们想要发出具有 null 值的记录这些记录与 id 不匹配或且不属于时间范围条件水印和间隔的详细信息如下 val ds1Map
如何从 pandas 数据框中的列中删除字符串值

我正在尝试编写一些代码以逗号分隔数据帧列中的字符串因此它成为一个列表并从该列表中删除某个字符串如果存在删除不需要的字符串后我想再次以逗号加入列表元素我的数据框如下所示 df Column1 Column2 0 a a b c
错误：无法找到或加载主类 org.apache.spark.launcher.Main [重复]

这个问题在这里已经有答案了如果有人能帮我解决以下路径问题我将不胜感激我非常怀疑这与缺少路径设置有关但不知道如何修复它 rxie ubuntu Downloads spark echo PATH usr bin java usr lo
从另一列的子字符串创建列

我有一个 Pandas 数据框对象我想从现有列的子字符串创建新列我的数据如下所示 Date variable want1 want2 want3 0 02 01 08 Australia Sydney A Australia Sydne
根据 pyspark 中的条件从数据框中删除行

我有一个包含两列的数据框 col1 col2 22 12 2 1 2 1 5 52 1 2 62 9 77 33 3 我想创建一个新的数据框它只需要行 col1 的值 gt col2 的值就像注释一样col1 很长类型和col2 有双
Spark 2.2 无法将 df 写入 parquet

我正在构建一个聚类算法我需要存储模型以供将来加载我有一个具有以下架构的数据框 val schema new StructType add StructField uniqueId LongType add StructField tim
Akka-Http 2.4.9 抛出 java.lang.NoClassDefFoundError: akka/actor/ActorRefFactory 异常

我正在尝试使用 Akka http 构建一个简单的 Web 服务我遵循了这个指南 http doc akka io docs akka 2 4 9 scala http low level server side api html htt

随机推荐

检查页面是父页面还是子页面？

是否可以检查页面是父页面还是子页面我的页面设置如下家长子页1 子页2 etc 如果它是父页面我想显示某个菜单如果它在子页面上我想显示不同的菜单我知道我可以做类似下面的事情但我想让它更加动态而不包含特定的页面 ID 您可以测
“kotlin-noarg”插件在 Realm 中不起作用

kotlin allopen 插件可以工作但 kotlin noarg 插件不起作用我能怎么做下面是代码构建 gradle buildscript ext kotlin version 1 1 3 2 repositories go
cin 首次使用函数后不允许输入

对于 C 或任何类型的编程来说都是全新的我正在尝试进行简单的输入输出但是在回答第一个问题后我没有机会输入第二个输入我尝试过在网上查找内容但考虑到这是一个非常简单的代码据说哈哈没有人遇到过同样的问题这让我来到这里 inclu
生产中的高超音速休眠？

开发商高超音速 http hsqldb org 承诺提高绩效但我担心使用 hsqlDB 的管理和其他方面会出现问题有人在生产中使用这个吗这是个好主意吗许多公司 http hsqldb org web hsqlUsing html在生
如何评估 WHERE 子句中的输入

我正在我的一个变量中输入一个输入基本上我想做一些类似的事情 SELECT FROM PEOPLE WHERE IF INPUT 1 ITEMID 16 OR ITEMID 13 ELSE IF INPUT 2 ITEMID 11 OR I
Java SFTP (apache vfs2) - 密码带有@

我正在尝试使用 org apache commons vfs2 通过 SFTP 下载文件问题是密码包含字符因此这会导致 URI 被错误解析 org apache commons vfs2 FileSystemException Ex
有没有办法只限制mysql中的较低范围？

我想获取查询中除第一行之外的所有行我怎样才能做到这一点您可以使用大量行偏移量为1 LIMIT 1 18446744073709551615
为什么 JSON 列不能是唯一键？

我有一个表里面有一个名为ColumnName该列的数据类型是JSON 我正在努力让它成为unique key 但这是不可能的我收到了这条消息 3152 JSON 列 columnName 不能在键规范中使用我想了解为什么我不能将该列设
在 SQL Server 中从 base64 字符串转换为 varbinary(max)

我的表中以二进制形式存储了 PDF 文档存储 PDF 字节的列是 typevarbinary max 我想要updateSQL Studio 中包含更新文档的一条记录我尝试完成此操作的方式如下所示 UPDATE table SET fi
Azure 搜索是否支持拼写错误和同义词？

我见过讨论这两个主题的线程 Azure 搜索是否处理同义词 https stackoverflow com questions 31180405 does azure search handle synonyms 搜索 API 中的模糊搜索
没有简单组件的提供者

直到 5 分钟前它才工作这毫无意义这是组件 import Component OnInit from angular core import Osobaa from osobaa import Osoba from osoba impo
RUBYLIB 环境路径

所以目前我已将以下内容包含在我的 bashrc 文件中 export RUBYLIB home git project app helpers 我正在尝试使用具有以下规范的规范来运行 rspec require output helper
在Python中读取csv文件时列出索引超出范围错误

我有这段代码我正在读取 csv 文件使用NamedTemporaryFile更改 csv 文件的内容 def update localcsv ping Yes No filename file1 csv tempfile NamedTe
发布 TypeScript 包时如何处理可选的对等依赖项？

将 TypeScript 包发布到 npm 并提供接受来自一个对等依赖项或另一个对等依赖项的输入的函数时如何定义可选的对等依赖项 import ExternalFoo from foo import ExternalBar from ba
如何重写此 MySQL 查询，使其不会引发此错误：您无法在 FROM 子句中指定目标表“crawlLog”进行更新？

我正在尝试从公司表中获取 id 但该 id 尚未出现在crawlLog 表中然后我需要将该companyId 插入crawlLog 表中我需要在一次调用中执行此操作以便并行爬网程序在其他爬网程序选择了某个 url 但尚未将其插入爬网日
如何在小窗口中打开“zxing条码”扫描屏？

zxing Barcode 扫描仪在我的应用程序中成功运行 https github com journeyapps zxing android embedded https github com journeyapps zxing and
如何优化elasticsearch percolator索引内存性能

使用elasticsearch percolator索引时有没有办法提高内存性能我为我的渗滤器创建了一个单独的索引我有大约 1 000 000 个用户创建的已保存搜索用于电子邮件警报创建此渗透器索引后我的堆使用率飙升至 100 并
重新打开 gem 提供的 ActiveRecord 模型

我正在尝试扩展 ActiveRecord 模型 Vote 那是一颗宝石 https github com peteonrails vote fu https github com peteonrails vote fu 提供给我的应用程序
“自动释放但没有池”是什么意思？

我的应用程序结构如下核心部分是用 C 编写的并大量使用线程我正在其上用 Objective C 开发 UI 如果我不执行线程它工作正常但我无法禁用停止线程 UI 在日志中随机崩溃我可以看到以下消息 NSAutoreleaseN
Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List()

我搜索了与这个问题相关的其他答案但没有帮助我正在尝试向数据框中添加一列该列的数据类型为Seq CaseClass 起初我认为 Spark 可能不支持集合类型列但事实并非如此这是我尝试运行的代码示例我只想向每一行添加一个空的 Se

Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List()

Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List() 的相关文章

随机推荐

热门标签