如何解决错误“AttributeError：‘SparkSession’对象没有属性‘序列化器’？

2024-04-29

我正在使用 pyspark 数据框。我有一些代码试图在其中转换dataframe to an rdd，但我收到以下错误：

AttributeError：“SparkSession”对象没有属性“序列化器”

可能是什么问题？

training, test = rescaledData.randomSplit([0.8, 0.2])
nb = NaiveBayes(smoothing=1.0, modelType="multinomial")
# Train a naive Bayes model.
model = nb.fit(rescaledData)

# Make prediction and test accuracy.
predictionAndLabel = test.rdd.map(lambda p: (model.predict(p.features), p.label))
accuracy = 1.0 * predictionAndLabel.filter(lambda pl: pl[0] == pl[1]).count() / test.count()
print('model accuracy {}'.format(accuracy))

有谁知道为什么该声明test.rdd导致错误？数据框包含Row object of (label, features).

Thanks

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

PySpark

apachesparksql

如何解决错误“AttributeError：‘SparkSession’对象没有属性‘序列化器’？的相关文章

将 Spark 数据框中的时间戳转换为日期

我见过这里如何将DataFrame中的时间戳转换为日期格式 https stackoverflow com questions 40656001 how to convert timestamp to date format in da
以有效的方式从 BigQuery 读取到 Spark 中？

使用时BigQuery 连接器 https cloud google com hadoop examples bigquery connector spark example要从 BigQuery 读取数据我发现它首先将所有数据复制到 G
司机下令停车后 Spark 工作人员停下来

基本上主节点也充当从节点之一一旦主服务器上的从服务器完成它就会调用 SparkContext 来停止因此该命令传播到所有从服务器从而在处理过程中停止执行其中一名工作人员登录时出错信息 SparkHadoopMapRedUtil
如何更改 SparkContext.sparkUser() 设置（在 pyspark 中）？

我是新来的Spark and pyspark 我使用 pyspark 之后我rdd处理中我试图将其保存到hdfs使用saveAsTextfile 功能但我得到一个没有权限错误消息因为 pyspark 尝试写入hdfs使用我的本地帐
如何在 Apache Spark 中基于列的子集实现“ except ”？

我正在 Spark 中使用两个模式 table1 and table2 scala gt table1 printSchema root user id long nullable true item id long nullable tr
如何过滤 pyspark 列表中值的列？

我有一个数据框原始数据我必须在 X 列上应用值 CB CI 和 CR 的过滤条件所以我使用了下面的代码 df dfRawData filter col X between CB CI CR 但我收到以下错误 Between 恰好需要 3
从 pandas udf 记录

我正在尝试从 python 转换中调用的 pandas udf 进行日志记录因为在执行器上调用的代码不会显示在驱动程序的日志中我一直在寻找一些选项但到目前为止最接近的选项是这个one https stackoverflow com q
如何使用 Scala 在 Spark 中漂亮地打印 JSON 数据帧？

我有一个数据帧我想将其作为有效的 json 写入 json 文件我当前的代码如下所示 val df DataFrame myFun df toJSON saveAsTextFile myFile json 输出的格式为如何将文件内容组
在 kubernetes 上安装 PySpark 软件包时出现 Spark-Submit：ivy-cache 文件未找到错误

我一整天都在与它斗争我能够安装并使用带有 Spark shell 或连接的 Jupiter 笔记本的包 graphframes 但我想使用 Spark Submit 将其移动到基于 kubernetes 的 Spark 环境我的火花版
如何从 Databricks Delta 表中删除列？

我最近开始发现 Databricks 并遇到了需要删除增量表的特定列的情况当我使用 PostgreSQL 时它就像 ALTER TABLE main metrics table DROP COLUMN metric 1 我正在浏览 Da
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa
如何从字符串列中提取数字？

我的要求是从列中的评论列中检索订单号comment并且总是开始于R 订单号应作为新列添加到表中输入数据 code id mode location status comment AS SD 101 Airways hyderabad D
如何根据 Pyspark 中另一列的表达式评估有条件地替换列中的值？

import numpy as np df spark createDataFrame 1 1 None 1 2 float 5 1 3 np nan 1 4 None 0 5 float 10 1 6 float nan 0 6 floa
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
Spark DataFrame 序列化为无效 json

TL DR 当我倾倒 Spark 时DataFrame作为 json 我总是得到类似的结果 key1 v11 key2 v21 key1 v12 key2 v22 key1 v13 key2 v23 这是无效的 json 我可以手动编辑转储
将 IndexToString 应用于 Spark 中的特征向量

Context 我有一个数据框其中所有分类值都已使用 StringIndexer 进行索引 val categoricalColumns df schema collect case StructField name StringType
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
Spark/Gradle -- 在 build.gradle 中获取 IP 地址以用于启动 master 和worker

我在基本层面上了解 build gradle 构建脚本的各个移动部分但无法将它们全部结合在一起在 Apache Spark 独立模式下只需尝试从 build gradle 在同一个机器上启动 master 和worker 稍后将使用

随机推荐

Android/iOS 上的相机远程快门如何工作？

我最近在 Android iOS 上遇到了一个使用蓝牙的内置相机应用程序的远程快门这是我找到的产品的示例链接 Link http www youtube com watch v cyVG76HDvh4 不是来打广告的只是简单了解背后的技
Haskell 程序的 -hc 配置文件中的 PINNED 是什么意思？

我正在尝试分析我的应用程序分析内存使用情况时 hcRTS 选项我注意到很多内存标记为 PINNED 当与 hy内存被标记为ARR WORDS 该程序使用以下命令创建 2400 2400 双精度矩阵Data Packed Matrixhm
根据 pandas 数据框中的多个列值选择行

我有一个pandas DataFrame df import pandas as pd data Name AAAA BBBB C1 25 12 C2 2 1 C3 1 10 df pd DataFrame data df set inde
这两个绑定声明与 Google Guice 有什么区别？

有什么区别 bind FooImpl class in Scopes SINGLETON bind Foo class to FooImpl class and bind Foo class to FooImpl class in Scop
您尝试通过调用 firebase.storage() 来使用 Android 项目上未安装的 Firebase 模块

我尝试使用react native firebase模块在React Native上使用firebase存储当您调用firebase存储时我收到此错误您尝试通过调用 firebase storage 来使用 Android 项目上未安
如何从 ArrayList 中删除空白项。不删除索引

public class ArrayListTest public static void main String args ArrayList al new ArrayList al add al add name al add al a
将 ASP.Net Identity 表链接到用户详细信息表

我正在尝试将我的身份用户表链接到我创建的用于跟踪其他用户信息的用户详细信息表该用户详细信息表称为 UserProfile 我发现了这个链接但它在 NET Core 2 1 中不起作用将 ASP NET Identity 用户链接到用户
在 RemotePlaybackClient 上调用 play() 时 Google Play 服务中出现 NullPointerException

该示例应用程序 https github com commonsguy cw omnibus tree master MediaRouter RemotePlayback我的曾经工作得很好不过在过去几个月的某个时候 Google 更新了
Go中的切片分配是否复制内存

目的我有一个大缓冲区我想要一个指向缓冲区中不同位置的指针数组切片我在做什么 datPtrs make byte n for i 0 i
为什么 HTML 锚标记不包裹可缩放的 SVG
？
我创建了一个可扩展的 SVG 对象使用preserveAspectRatio and viewBoxSVG 文件本身的属性

2个地理坐标之间的中间点

我正在尝试开发一种涉及标准化 GPS 坐标纬度经度的算法这意味着给定两个点 A lat1 lon1 和 B lat2 lon2 我想插入一个与 AB 成线性的点 C 相同的弧并且放置在距 A 和 B 特定距离处例如 A 到 B

为什么简单的“Hello World”风格的程序不能用 Turbo C++ 编译？

我已经开始在编程课上学习 C 我已经下载了这个 Hello World 程序 include

当面向 ECMAScript 5 及更高版本时，八进制文字不可用

我正在 angularjs 中构建挪威 SSN 验证器并收到错误针对 ECMAScript 5 及更高版本时八进制文字不可用但在 es3 模式下一切正常请帮我解决这个问题 module ec directives export f

如何格式化字符串以在 Python 中使用 mysqldb 进行查询？

我该如何正确执行此操作我想做这样的查询 query SELECT FROM sometable order by s s limit s s conn app globals pool connection cur conn cursor

如何将expo sdk升级到特定版本

我想按照文档中的建议逐步升级我的expo sdk版本这些是说明更新到最新版本的 Expo CLI npm i g expo cli 电子邮件受保护 cdn cgi l email protection或更大的要求如果您使用 EAS C

如何在 python 中的不同终端窗口中运行函数/线程？

我有一个这样的程序 from threading import Thread def foo1 arg print foo1 gt gt gt Something input foo1 gt gt gt Enter Something de

存储库和数据映射器模式

在大量阅读有关存储库和数据映射器的内容后我决定在测试项目中实现这些模式由于我对这些不熟悉我想了解您对我如何在一个简单的项目中实现这些的看法杰里米米勒说做一些不平凡的个人编码项目您可以在其中自由地尝试设计模式但我不知道我做的

根据自定义适配器中的条件更改特定行的背景

我试图根据从远程服务器上的数据库收到的标志来更改行的背景颜色在我的代码中我创建了一个名为 disable 的 ArrayList 其中包含所有已标记的位置我想将禁用列表中的内容与我的 ListView 中的位置相匹配我研究了几篇帖子

在 IntelliJ 插件中创建后台任务

我正在开发一个 IntelliJ idea 插件并希望在后台任务中运行代码在后台任务对话框和 UI 之外的另一个线程中可见我发现了以下内容助手类 https github com inmite android selector cha

如何解决错误“AttributeError：‘SparkSession’对象没有属性‘序列化器’？

我正在使用 pyspark 数据框我有一些代码试图在其中转换dataframe to an rdd 但我收到以下错误 AttributeError SparkSession 对象没有属性序列化器可能是什么问题 training tes
热门标签

镜像下载与安装

请求报文

模型计算文本相似度

模型的详细介绍

指定字符

数据挖掘实验一使用

输入捕获

ctype

上的应用

通信知识梳理及在

附资料和源码

手柄通讯协议解析

OpenHD

contrib

三周年创作纪念日

任务切换过程深层解析

树莓派新手入门教程

波形解析实例

新版本主要特性

是否可用

日历控件遇到的问题

总结使用

车牌识别

下的自动跟随
Powered by Hwhale

如何解决错误“AttributeError：‘SparkSession’对象没有属性‘序列化器’？

如何解决错误“AttributeError：‘SparkSession’对象没有属性‘序列化器’？ 的相关文章

随机推荐

热门标签

如何解决错误“AttributeError：‘SparkSession’对象没有属性‘序列化器’？的相关文章