如何将模型结果保存到文本文件？

2024-05-12

我正在尝试将从模型生成的频繁项集保存到文本文件中。该代码是 Spark ML 库中 FPGrowth 示例的示例。

Using saveAsTextFile直接在模型上写入 RDD 位置而不是实际值。

import org.apache.spark.mllib.fpm.FPGrowth
import org.apache.spark.rdd.RDD

val data = sc.textFile("/home/ponny/Freq")
val data1 = sc.textFile("/home/ponny/Scala_Examples/test.txt")
val transactions: RDD[Array[String]] = data.map(s => s.trim.split(' '))
val tdata: RDD[Array[String]] = data1.map(s => s.trim.split(' '))

val fpg = new FPGrowth().setMinSupport(0.0).setNumPartitions(10)
val model = fpg.run(transactions)

model.freqItemsets.collect().foreach { itemset =>
  println(itemset.items.mkString("[", ",", "]") + ", " + itemset.freq)
}
model.freqItemsets.saveAsTextFile("/home/ponny/Freq_op")

文本文件中生成的输出类似于

org.apache.spark.mllib.fpm.FPGrowth$FreqItemset@5b27c9
org.apache.spark.mllib.fpm.FPGrowth$FreqItemset@2a7acd
org.apache.spark.mllib.fpm.FPGrowth$FreqItemset@d4d011
org.apache.spark.mllib.fpm.FPGrowth$FreqItemset@1fd4350

请指导。

与打印值的方式完全相同。首先构建所需的输出字符串：

model.freqItemsets
  .map { fi => s"""[${fi.items.mkString(",")}], ${fi.freq}""" }
  .saveAsTextFile(path)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

apachesparkmllib

如何将模型结果保存到文本文件？的相关文章

在 Scala 中反转地图的优雅方法

目前正在学习Scala 需要反转Map 来进行一些反转值 gt 键查找我一直在寻找一种简单的方法来做到这一点但只想到了 Map origMap map kvp gt kvp 2 gt kvp 1 有人有更优雅的方法吗假设值是唯一的则
Map 和 Set 的实际类（不是抽象类，也不是特征类）是什么？

在 Scala 中映射和集合文字可以通过以下方式创建 val m Map 1 gt a 以及引用的类型m字面意思都是Map Int String 然而 scala文档表明Map实际上是一个特征具有需要实现才能实例化的抽象成员 scala
Spark scala：大量列上的简单 UDF 会导致性能下降

我有一个包含 1 亿行和约 10 000 列的数据框这些列有两种类型标准 C i 和动态 X i 这个dataframe是经过一些处理后得到的性能很快现在只剩下2步了 Goal 需要使用 C i 列的相同子集对每个 X i 执行特定
pyspark。数据框中的 zip 数组

我有以下 PySpark DataFrame id data 1 10 11 12 2 20 21 22 3 30 31 32 最后我想要以下 DataFrame id data
使用 Pyspark 从 S3 读取时，内容长度分隔消息正文过早结束 SparkException

我正在使用下面的代码来阅读S3 csv 文件从我的本地机器 from pyspark import SparkConf SparkContext from pyspark sql import SparkSession import con
如何从DataFrame中获取最后一行？

我有一个DataFrame 该DataFrame有两列 value 和 timestamp timestmp 是有序的我想获取DataFrame的最后一行我该怎么办这是我的输入 value timestamp 1 1 4 2 3 3
Pyspark - 一次聚合数据帧的所有列[重复]

这个问题在这里已经有答案了我想将数据框分组到单个列上然后对所有列应用聚合函数例如我有一个包含 10 列的 df 我希望对第一列 1 进行分组然后对所有剩余列均为数字应用聚合函数 sum 与此等效的 R 是 summarise
一般处理枚举的 Scala 类

我想创建一个通用类来保存枚举的值并且还允许访问枚举的可能值以属性编辑器为例您需要知道属性的当前值并且还需要能够知道该属性的其他合法值并且枚举的类型不应该提前知道您应该能够使用任何类型的枚举我的第一个想法是这样的 class E
在 scala 中混合类型参数和抽象类型

我正在尝试使用的答案前面的问题 https stackoverflow com questions 2059601 circular type parameters definition in scala实现一个小型图形库这个想法是将图视
如何找到两个数据帧之间的精确和非精确匹配？

我有两个数据框 df1 id amount fee 1 10 00 5 0 2 20 0 3 0 3 90 130 0 4 120 0 35 0 df2 exId exAmount exFee 1 10 00 5 0 2 20 0 3 0
Spark toLocalIterator 和迭代器方法之间的区别

在编写 Spark 程序时我遇到了这个toLocalIterator 方法之前我只使用iterator method 如果有人曾经使用过这种方法请点亮我在使用时遇到foreach and foreachPartitionSpark程序
如何为每个用户或系统范围配置 Ivy 缓存目录？

我在用SBT http www scala sbt org 作为我构建 Scala 项目的构建工具我的问题是我无法配置 SBT 将依赖项下载到我的用户主目录因此我正在寻找每个用户甚至更好的系统范围设置来告诉 SBT 将 Ivy 缓存
将spark.local.dir设置为不同的驱动器

我正在尝试在 Windows 10 上设置独立 Spark 我想设置spark local dir to D spark tmp tmp 目前它似乎正在使用C Users
Spark - 构建时出现 scala 初始化错误

我正在尝试在我的 scala 应用程序中使用 Spark 这是我正在使用的 Spark 依赖项
SBT - 使用汇编时多项目合并策略和构建 sbt 结构

我有一个由多个较小项目组成的项目其中一些项目相互依赖例如有一个依赖于 commons 项目的实用程序项目其他项目可能依赖于公用事业或公共设施也可能不依赖于两者在 build sbt 中我在文件末尾有程序集合并策略以及程序集中
发送 FakeRequest 时如何为 akka.stream.Materializer 提供隐式值？

我正在尝试理解下面看到的错误并学习如何修复它 could not find implicit value for parameter materializer akka Stream Materializer val fut Future
Spark LDA 困境 - 预测和 OOM 问题

我正在评估 Spark 1 6 0 来构建大型数百万个文档数百万个特征数千个主题 LDA 模型并进行预测这是我可以使用 Yahoo 轻松完成的任务 LDA 从小处开始按照 Java 示例我使用分布式模型 EM 优化器构建了 10
带有泛型参数的抽象类的 JsonFormat

我正在尝试为具有通用参数的抽象类编写 JsonFormat 如下所示 abstract class Animal A def data A def otherStuff String stuff case class CatData cat
将括号子集映射到字符

我正在尝试创建一个 Scala 方法该方法将采用一个父括号组表示为字符串然后将每个括号子组映射到不同的字母然后它应该将它们放入它返回的映射中所以基本上我调用以下方法如下所示 val s 2 x 3 6 val map mapPa
单击“发送”按钮事件时，我们可以在哪里获取 xml/元数据格式的表单数据？

我是一个新的 scala 学习者作为要求的一部分我需要将表单数据插入 activemq 队列中以进行提交事件我尝试调试发送方法代码以了解单击 FormRunnerActions scala 类中的发送按钮时我们到底在哪里获取 xml

随机推荐

如何从linux命令行运行.exe可执行文件？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在 Windows 中有一个 abc exe 可执行文件我可以使用 DOS 命令提示来执行此应用程序并为其提供一些运行时变量我想从
测试 - 存根服务方法未定义

我已经在非常简单的代码上编写了一个非常简单的测试但由于某种原因存根服务方法未定义当我使用 Jasmine Spy 时它可以工作但对于这样一个简单的任务有人可以解释一下为什么会发生这种情况吗我删除了 import 语句只是为了减少
为什么 Objective-C 使用 YES 和 NO 而不是 1 和 0？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Objective C 使用 YES 和 NO 而不是 1 和 0 是否有任何技术原因或者只是为了使其更具可读性使其更具可读性is技术原因
膨胀类片段 InflateException 二进制 XML 文件时出错

我正在使用 Material Design 和 NavigationDrawer 布局等设计我的第一个应用程序但我遇到了一个问题该应用程序非常简单它只显示文本并且基于 Android Studio 中提供的模板尝试启动我的应用程序
在 SSIS 中使用 OLE DB 从 Sybase 提取数据时出错

我在 SSIS 2017 中使用 Advantage 11 OLE DB Provider 从 Sybase 提取数据时遇到问题我可以连接到数据库查看表列表并且在选择表作为数据源时我可以看到列但是当我单击预览或运行数据流任务
如何将值从孩子的孩子传递给父母？

我有一个父组件有一个子组件它也有一个子组件 Parent Child One child of parent Child Two child of child 当在子二中定义一个值时我使用回调将该值传递给子一但我也想将相同的值传递回
Azure 2012 年 10 月 SDK 损坏 UseDevelopmentStorage=true

有人尝试过使用 usedevelopmentstorage true 连接字符串的 2012 年 10 月 Azure sdk 吗 CloudStorageAccount Parse UseDevelopmentStorage true 抛
我可以在 Laravel 5.2 中创建一个继承自 User 的新类吗？

我对 Laravel 还很陌生使用的是迄今为止的最新版本 5 2 因此我遇到了以下困境我知道 Laravel 附带了一个User开箱即用的类但我想开发一个系统在其中我可以有另外两种类型的用户称为Researcher and Adm
Haskell 中的 print 是纯函数吗？

Is print在 Haskell 中是纯函数为什么或者为什么不我认为不是因为它并不总是返回与纯函数应返回的值相同的值类型的值IO Int并不是真正的Int 它更像是一张纸上面写着嘿 Haskell 运行时请生成一个Int如此
Hibernate @OneToMany 注释到底是如何工作的？

我对 Hibernate 还很陌生我正在通过教程学习它我在理解到底如何一对多注释作品所以我有这两个实体类 Student代表一个学生并且Guide代表指导学生的人因此每个学生都与一名向导相关联但一名向导可以跟随多个学生我想要一
uncss 错误：C.UTF-8：不是有效的语言标签

嗨我正在尝试使用UNCSS https github com giakki uncss第一次从 CSS 中删除未使用的样式我收到以下错误 Fontconfig 警告忽略 C UTF 8 不是有效的语言标记 home ubuntu nv
Symfony 5.4 Security Bundle，注册后无法登录

我在 5 4 版本上构建空的新项目我使用这些命令来构建项目 composer create project symfony skeleton 5 4 testapp54 cd testapp54 composer require weba
无法在cordova项目中安装插件

我面临一个大问题 Unable to install the phonegap plugins在我的科尔多瓦项目中实际上昨天它仍然工作正常现在每当我尝试在我的 cordova 项目中使用 CLI 添加任何 cordova 插件时我收
如何使用css网格制作一个垄断板？

I want to create a monopoly board like There are following features in the board 角是方形的比其他盒子大每行的文本都面向特定的角度我的基本 html 结构
通过 SSLStream 发送数据时出现数据包碎片

当使用 SSLStream 将大数据块 1 兆发送到已通过身份验证的客户端时我看到的数据包碎片分解是FAR比使用普通 NetworkStream 时更大在客户端上使用异步读取即 BeginRead 会重复调用 ReadCa
如何在 Flutter 中更新 AnimatedList 中的数据

如何在 Flutter 中更新 AnimatedList 中的数据添加删除行我可以在 ListView 中通过更新支持数据并调用来完成此操作setState 例如 setState data insert 2 pig 不过在 Ani
如何在 Swift 编程中获得基于导航的模板功能

我的项目需要一个导航控制器并且我的应用程序最初有一个社交登录一旦验证通过用户将被推送到另一个视图我在其中显示一个具有 2 个选项卡的选项卡控制器我不知道如何在 Swift 编程中做到这一点我已将视图控制器嵌入到导航控制器中一旦
C++ 中的 Java ArrayList [重复]

这个问题在这里已经有答案了在Java中我可以做 List
CMS：将自定义页面存储为文件或 MySQL 数据库中？

我正在 PHP 中创建一个自定义 CMS 从头开始编写并且想知道是否应该将用户创建的页面存储为文件或存储在 MySQL 数据库中内容全部是 HTML 代码至少目前是这样我无法决定该做什么因为用 php 编写文件似乎存在安全风险并
如何将模型结果保存到文本文件？

我正在尝试将从模型生成的频繁项集保存到文本文件中该代码是 Spark ML 库中 FPGrowth 示例的示例 Using saveAsTextFile直接在模型上写入 RDD 位置而不是实际值 import org apache spa

如何将模型结果保存到文本文件？

如何将模型结果保存到文本文件？ 的相关文章

随机推荐

热门标签

如何将模型结果保存到文本文件？的相关文章