保存的数据带有不需要的引号

2024-05-04

我使用以下代码将数据框导出到 csv：

data.write.format('com.databricks.spark.csv').options(delimiter="\t", codec="org.apache.hadoop.io.compress.GzipCodec").save('s3a://myBucket/myPath')

请注意，我使用delimiter="\t"，因为我不想在每个字段周围添加额外的引号。但是，当我检查输出 csv 文件时，仍然有一些字段用引号引起来。例如

abcdABCDAAbbcd ....
1234_3456ABCD  ...
"-12345678AbCd"  ...

当字段的前导字符为“-”时，似乎会出现引号。为什么会发生这种情况？有办法避免这种情况吗？谢谢！

您没有使用 CSV 编写器提供的所有选项。它有quoteMode参数采用四个值之一（来自org.apache.commons.csv 文档 https://commons.apache.org/proper/commons-csv/apidocs/org/apache/commons/csv/QuoteMode.html_:

ALL - 引用所有字段
MINIMAL（默认） -包含特殊字符的引号字段，例如分隔符、引号字符或行分隔符中的任何字符
NON_NUMERIC - 引用所有非数字字段
NONE - 从不引用字段

如果想避免引用最后一个选项看起来是一个不错的选择，不是吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

apachespark

PySpark

保存的数据带有不需要的引号的相关文章

与区域指示符字符类匹配的 python 正则表达式

我在 Mac 上使用 python 2 7 10 表情符号中的标志由一对表示区域指示符号 https en wikipedia org wiki Regional Indicator Symbol 我想编写一个 python 正则表达式来在
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
加载数据infile，Windows和Linux的区别

我有一个需要导入到 MySQL 表的文件这是我的命令 LOAD DATA LOCAL INFILE C test csv INTO TABLE logs fields terminated by LINES terminated BY n
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo
使用随机放置的 NaN 创建示例 numpy 数组

出于测试目的我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

使用 ffmpeg 将 h.264 avi 容器转换为 mp4

我想使用 ffmpeg 将 h 264 avi 容器转换为 mp4 容器我发现这个有效 ffmpeg i myfile avi vcodec copy myfile mp4 ffmpeg version N 51169 gcedf276
服务无法放置任务

好吧我不知道在哪里可以解决这个问题我正在尝试启动一个堆栈其中有一个在 ECS 中运行的基本应用程序我将在下面展示云信息但我不断得到服务 sos ecs SosEcsService 1RVB1U5QXTY9S 无法放置任务因为没
初始化 FingerpringManager.Crypto 对象，获取 AndroidKeyStore 提供程序不支持的加密原语？

我使用的是安卓FingerPrintManagerAPI 并使用 KeyPairGenerator 创建密钥对我想用公钥加密密码然后在用户通过输入指纹进行身份验证时解密但是一旦我运行我的项目它就会崩溃并给出引起原因 java la
在最后（或第四次）出现“.”时分割字符串分隔符

我喜欢按如下方式分隔字符串给定以下字符串 Column 1 10 80 111 199 1345 127 0 0 1 3279 我想在最后一个之后分隔数字这将得到以下输出 Column 1 Column 2 10 1 12 5 134
Opencart 2.2.0 启用按制造商搜索

我正在使用 OC 2 2 0 并一直在努力解决以下问题示例我在标题搜索中输入西门子然后单击显示所有结果我的搜索页面将显示所有结果问题是结果列表仅包含名称中包含西门子的产品我需要的是展示all 搜索结果列表中属于该制造商的产品
AJAX Webmethod 调用在 MVC3 上返回 404

我一直在使用 EXTJS 4 并通过 AJAX 调用 aspx 页面代码隐藏上的 Webmethod 来加载我的商店此方法适用于我的所有项目直到我尝试将 EXTJS 4 工作移植到 MVC3 项目中我的电话现在返回 404 关键部分是
stdClass 类的对象无法转换为字符串

我现在在使用 PHP 时遇到问题收到此错误 Object of class stdClass could not be converted to string当我在我的网站中运行这部分代码时发生错误 function myaccount
列表：Count 与 Count() [重复]

这个问题在这里已经有答案了给定一个列表首选哪种方法来确定内部元素的数量 var myList new List
从控制器传递 gsp 参数

我如何通过不是域类实例的控制器将参数传递到groovy服务器页面您将参数放入返回给 GSP 的模型对象映射中例如 def index def hobbies basketball photography render view inde
如何在 Django 查询中动态提供查找字段名称？ [复制]

这个问题在这里已经有答案了我想在 Django 模型的几个字段中查找某个字符串理想情况下它会类似于 keyword keyword fields foo bar baz results for field in fields look
jQuery 函数在不应该运行的时候运行

我有一个函数仅当宽度小于特定值时才需要运行我已经这样做了if window width lt n 但当宽度大于 n 时该函数也会运行 The if if window width lt n 由于背景颜色发生变化浅灰色 1000px
VBA - 从 Internet Explorer 的框架通知栏中选择另存为

我正在尝试通过以下方式下载另存为的文件框架通知栏的互联网浏览器然而经过大量搜索后我只找到了点击解决方案save在框架通知栏上到目前为止我一直在尝试另存为示例站点上的文件 http www tvsubtitles net subti
Angular 5 webpack 3 aot

我正在尝试使用 webpack 3 和 Angular 5 进行 aot 构建但是网上有很多教程没有一个没有问题地显示完整的示例到目前为止我已经有了以下配置对于那些对路径有疑问的人我在 java 应用程序中使用它 webpack
Azure DataCache Windows Azure 模拟器出现问题，但未生成错误。应用程序只是挂起

我有一个现有的 mvc4 Web 项目我想将其部署到云服务并开始使用 azure 数据缓存我已将 Windows azure 缓存 nuget 包添加到解决方案中的两个项目中即 Web 项目和类库项目这两个项目都需要这些项目然后
CGContextSaveGState 无效上下文

我正在开发一个 iOS 应用程序它使用实时摄像头扫描条形码和二维码然而有时我会遇到错误这些错误不会使应用程序崩溃但修复它们可能是个好主意这些是错误
Firebase 的云功能：序列化 Promise

在 onWrite 处理程序中我想执行多次读取操作一些数据然后存储它我对 Promise 概念还很陌生关于 Firebase 在完成之前不会终止我的查询我对以下 Promise 处理是否安全 exports test funct
如何通过 JavaScript 设置输入值？

我有 id txt1 的输入字段但我无法从 JavaScript 更改该值
根据 VS 活动配置定义 Wix 属性和值

如何定义根据激活的 Visual Studio 配置而变化的 Wix 属性和值例如对于我们的发布版本 var x 1 对于导出版本 var x 2 我们使用 wixproj 文件将属性传递到 WiX
在 Fragment 和 Activity 之外通过 Hilt 进行现场注入

我想知道是否可以在片段或活动之外使用字段注入我知道我可以使用构造函数注入但是我想知道是否也可以使用字段注入我认为 Dagger 是可能的当我尝试用注入的东西做某事时yclass字段我收到此错误 lateinit property y
保存的数据带有不需要的引号

我使用以下代码将数据框导出到 csv data write format com databricks spark csv options delimiter t codec org apache hadoop io compress Gz

保存的数据带有不需要的引号

保存的数据带有不需要的引号 的相关文章

随机推荐

热门标签

保存的数据带有不需要的引号的相关文章