如何将数组[字符串]存储到输出文件[重复]

2024-01-13

我有一个名为 samparr 的数组[String]，其中包含一些值，我希望将其存储为输出文件。

var samparr: Array[String] = new Array[String](4)
samparr +:= print1 + "  BEST_MATCH  " + print2

就像，

val output = samparr.saveAsTextFile(outputpath)

但它不是一个 RDD，它是一个 Array[String]

您可以使用SparkContext.parallelize将数组“分发”到 Spark 集群上（换句话说，将其变成 RDD），然后调用saveAsTextFile:

sc.parallelize(samparr).saveAsTextFile(outputpath)

此操作将对数据进行分区并将每个分区发送到其中一个执行器，然后每个分区将被保存到单独的“文件部分”中。

或者，由于数组非常小，并且不能真正“证明”使用 Spark，因此您可以尝试任何将数据保存到文件的非 Spark 方法，例如链接的那个@avihoo-mamka https://stackoverflow.com/users/2455626/avihoo-mamka: 如何在 Scala 中写入文件？ https://stackoverflow.com/questions/4604237/how-to-write-to-a-file-in-scala

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

如何将数组[字符串]存储到输出文件[重复] 的相关文章

将参数传递给 Scala 对象

是否可以从外部对象初始化 Scala 对象我尝试初始化的 Scala 对象没有任何 Companion 类这是一个例子 object ObjectA val mongoDBConnectionURI This is the Val th
凿子“Enum(UInt(), 5)”失败

当我尝试使用 Chisel 构建 FSM 时我使用了 Enum 如 Chisel 教程所述然而我遇到了这样的错误 my code val sIdle s1 s2 s3 s4 Nil Enum UInt 5 但是当我执行时sbt ru
从 Java 中的另一个应用程序部署 Apache Spark 应用程序，最佳实践

我是 Spark 的新用户我有一个 Web 服务允许用户请求服务器通过读取数据库并将结果推送回数据库来执行复杂的数据分析我已将这些分析转移到各种 Spark 应用程序中目前我使用spark submit来部署这些应用程序但是我很
Spark Driver 内存和 Application Master 内存

我是否正确理解客户端模式的文档客户端模式与驱动程序在应用程序主机中运行的集群模式相反在客户端模式下驱动程序和应用程序主机是单独的进程因此spark driver memory spark yarn am memory一定小于机器内存
作为单例集合的选项 - 现实生活中的用例

标题几乎概括了这一点 Option作为单例集合有时会令人困惑但有时它允许一个有趣的应用程序我脑子里有一个例子并且想了解更多这样的例子我唯一的例子是运行for对的理解Option List T 我们可以执行以下操作 val v Som
从 Monoids 的 HList 类型派生 0 的 HList

我正在学习 Shapeless 目前我正在尝试创建一个执行以下操作的函数给定一个类型HList它返回HList of Nones 与Option对应于给定的类型HList type 例如 create String Int HNil re
如何将Spark DataFrame插入Hive内表？

以追加模式将 DF 插入 Hive 内部表的正确方法是什么看来我们可以使用 saveAsTable 方法直接将 DF 写入 Hive 或将 DF 存储到临时表然后使用查询 df write mode append saveAsTable
当恰好有一个选项非空时执行某项操作

如果两个选项之一非空我想计算一些东西显然这可以通过模式匹配来完成但是有更好的方法吗 o1 o2 match case Some o None gt Some compute o case None Some o gt Some com
重载方法值与替代方法的聚合

我有以下函数但无法编译 private def save pea KStream String String Unit pea groupByKey aggregate gt folder String String value Stri
Scala 插入列表中的特定位置

这是我确实解决的问题但是作为一个完全命令式的 Scala 菜鸟我觉得我发现了一些完全不优雅的东西任何改进的想法表示赞赏 val l1 4 1 2 3 4 Nil original list val insert List 88 99
方法返回类型的类型推断

当存在显式方法时为什么 Scala 无法推断方法的返回类型return方法中使用的语句例如为什么下面的代码可以编译 object Main def who 5 def main args Array String println wh
在 URL 中嵌入 ETag

有关 Play 中资产指纹识别的问题如何要求 Play 在 URL 中嵌入 ETag 而不使用第三方插件例如如果 css resource cssETag 为1234 那么它就会变成 css responsive 1234 css 相
在 Scala 中定义具有多个隐式参数的函数

如何定义具有多个隐式参数的函数 def myfun arg String implicit p1 String implicit p2 Int doesn t work 它们必须全部放入一个参数列表中并且该列表必须是最后一个 def my
如何将参数传递给用户定义函数？

我有一个用户定义的函数 calc udf calculate FloatType param1 A result df withColumn col1 calc col type col pos groupBy pk sum events
使用值类参数的 Mockito 存根方法失败并出现 NullPointerException

使用类型化值类作为 ID 是 Scala 中的常见模式然而在存根以值类作为参数的方法时 Mockito 似乎遇到了问题在下面的示例中第一个具有实际值的存根工作得很好但第二个使用参数匹配器的存根会抛出 NullPointerExce
选择 PySpark 数据框中的列

我正在寻找一种在 PySpark 中选择数据帧列的方法对于第一行我知道我可以使用df first 但不确定列是否存在没有列名我有 5 列想循环浏览每一列 1 2 3 4 5 6 7 1 0 0 0 0 0 0 1 0 0 0 0 0
Spark sql 每组前 n 个

我怎样才能获得每组的前n名比如说前10名或前3名 spark sql http www xaprb com blog 2006 12 07 how to select the firstleastmax row per group in
这个错误是什么意思（SimpleHttpConnectionManager 被错误使用）？

我正在尝试从 ElasticSearch 中读取数据到 Spark conf es resource sflow sflow es nodes ES01 es query some query rdd sc newAPIHadoopRDD
从单个字符串创建 Spark DataFrame

我正在尝试采用硬编码字符串并将其转换为 1 行 Spark DataFrame 具有单列类型StringType 这样 String fizz buzz 将得到一个 DataFrame 其 show 方法如下 fizz buzz 迄今为止我
仅当要转换的函数至少有两个参数时，函数到二阶函数的隐式转换才有效

我有隐式转换和高阶函数的问题似乎只有当要转换的函数至少有两个参数时函数到二阶函数的隐式转换才有效 Works implicit def conv foo Integer gt String String gt String null 不

随机推荐

多选模式下具有 md-select 的 md-chips

当我尝试从 md select 中选择多个值时生成 md chips 时它不起作用 md chips 是否仅适用于自动完成分析器和输入字段
当 HTTP Status 为 Bad Request 时 HttpResponseMessage 内容丢失

var response new HttpResponseMessage HttpStatusCode BadRequest Content new StringContent Error in Validation ReasonPhras
如何将代码重构为新文件并保留 git 历史记录？

所以我想将一个大文件的一部分提取到一个新文件并保留 git 历史记录这样我就可以运行git blame并查看重构之前的变化 In Git the history is the commits There is no file histor
Kafka Producer：使用回调处理异步发送中的异常

我需要捕获异步发送到 Kafka 时的异常 Kafka生产者API带有一个函数send ProducerRecord record Callback回调但是当我针对以下两种情况进行测试时卡夫卡经纪人宕机主题未预先创建回调没有被调用
Kendo UI 图表 - 如何在加载数据时显示动画？

我有一个用 JavaScript 生成的 KendoUI 图表有没有办法用命令清除绘图区域目的是在等待数据源读取远程数据时显示正在加载图像 Thanks 显示和隐藏加载动画是 Display progress kendo ui pr
Scala for 循环可以修改其范围之外的变量吗？

例如假设我有以下内容 var lastSecurity def allSecurities for security lt lastTrade keySet toList lastSecurity security yield securi
-[GMSMapView animateToCameraPosition:]: 无法识别的选择器发送到实例

大家好我已经在我的应用程序上实现了谷歌地图 sdk 但我在这一特定行上遇到了错误 mapView GMSMapView mapWithFrame CGRectZero 相机相机任何人都可以帮我找到解决方案吗请说明您使用的是哪个版本的
将函数与 OUTER APPLY 一起使用时，返回值而不是 NULL

使用内联函数时我得到奇怪的结果这是代码 IF EXISTS SELECT FROM sys objects AS o WHERE name vendor relation users DROP FUNCTION dbo vendor re
Mongoid (Rails) 中的两个 1 - N 关系

场景是一个账户如何给另一个账户评分这会导致帐户上出现两个列表那些我评价过的人和那些评价过我的人我的评分和给出的评分这归结为与同一实体的多个 1 N 关系如何在 Mongoid 中工作在 Mongoid 的文档中 http mo
如何以编程方式订阅对象的所有事件？

我正在尝试订阅ALL由类似 WPF GridView 的第 3 方组件公开的事件以便进行一些调试除了建议这可能不是调试它的最佳方法以及类似的东西之外我想知道是否可以做到这一点对于路由事件它工作正常如下所示 var type tr
Windows 上基于 Android 配件的软件

我想使用我的应用程序将我的计算机变成 Android 配件因此这将不是专门的硬件而只是将手机切换到配件模式的 PC 从而在手机上启动一些与主机硬件关联的 Java 应用程序并创建通信通道我找到了一个示例代码 http android
在 Tensorboard 上显示图像（通过 Keras）

My X test是 128x128x3 图像我的Y test是 512x512x3 的图像我想在每个纪元之后显示输入 X test 的外观预期输出 Y test 的外观以及实际输出的样子到目前为止我只知道如何在 Tensorb
如何串联执行承诺？

var promiseReturningFuncs for var i 0 i lt 5 i promiseReturningFuncs push askQuestion var programmers Promise reduce pro
简化 Eclipse 中的完全限定名称

有人知道 Eclipse 的一个插件它可以用简单的类名和相应的导入如果可能替换完全限定的 Java 类名吗如果可以作为保存操作来执行那就更好了 No But you can use Add Import command Ctrl
从文本文件中提取特定字段

我有一个 csv 文件其中包含超过 5k 个带有标题名称的字段列我只想将一些特定字段导入到我的数据库中我正在使用本地 infile 来处理其他需要导入的较小文件 LOAD DATA LOCAL INFILE C wamp www i
如何在 React hook 中创建新的 JSON 对象？

我首先有两个问题如何在挂钩中添加更新 JSON 项目另一个是 React 不允许我使用以前的 JSON 文件中存储的名称基本上我对其他解决方案持开放态度因为我的输入字段是从 JSON 文件动态生成的我不确定存储或访问输入到其中
仅水平滚动的 Div 不起作用

我有一个具有以下样式的 div height 200px overflow x scroll overflow y hidden width 682px 我需要元素在一行上彼此相邻仅水平滚动里面的元素有以下样式 width 60px p
关于可移植性的 $PWD 与 pwd

我正在编写一个 shell 脚本它解析当前工作目录的路径打印当前目录上方的所有基本名称到目前为止我一直在使用环境变量PWD解析路径但我想知道是否我可以信赖PWD始终被设置在每个平台上给出相同的结果使用pwd外壳内置我需要这
java.lang.ClassCastException：java.util.ArrayList无法转换为javax.faces.model.SelectItem [重复]

这个问题在这里已经有答案了我正在尝试使我的下拉菜单动态化下面是我收到的代码和异常请帮帮我 bean private String dropDownValue List
如何将数组[字符串]存储到输出文件[重复]

这个问题在这里已经有答案了我有一个名为 samparr 的数组 String 其中包含一些值我希望将其存储为输出文件 var samparr Array String new Array String 4 samparr print1

如何将数组[字符串]存储到输出文件[重复]

如何将数组[字符串]存储到输出文件[重复] 的相关文章

随机推荐

热门标签