如何有条件地删除 write.csv 中的引号?

2024-01-24

使用时write.csv,通过使用以下命令删除引号,可以显着减小文件大小(对于大型数据集,大约可减小 25%)quote=FALSE。然而,这可能会导致read.csv如果数据中存在逗号,则会发生故障。例如:

x <- data.frame(a=1:2,b=c("hello,","world"))
dim(x)
[1] 2 2
f <- tempfile()
write.csv(x,f,row.names=FALSE,quote=FALSE)
dim(read.csv(f))
[1] 2 2
read.csv(f)
      a  b
1 hello NA
2 world NA

观察列名称未对齐以及数据丢失和虚假数据的添加。

通常是否可以删除引号,但为数据中包含逗号的字段保留引号?


我采用的解决方案是@TimPietzcker 和@BenBolker 的评论的组合。

quote可以是一个数字向量来指定引用哪些列。虽然我更愿意只在需要时引用,但这在我的情况下几乎可以完全减少文件大小(也使用na="").

commas <- which(sapply(x, function(y) any(grepl(",",y))))
write.csv(x,f,row.names=FALSE,quote=commas)
read.csv(f)
  a      b
1 1 hello,
2 2  world
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何有条件地删除 write.csv 中的引号? 的相关文章

  • 在rails中,如何将记录作为csv文件返回

    我有一个名为 Entries 的简单数据库表 class CreateEntries lt ActiveRecord Migration def self up create table entries do t t string firs
  • 美人鱼图:调整图表周围的空白

    我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图 在 HTML PDF 输出中 图表上方和下方有大量空白 请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
  • 如何有效地将多个光栅 (.tif) 文件导入 R

    我是 R 新手 尤其是在空间数据方面 我正在尝试找到一种方法来有效地将多个 600 单波段栅格 tif 文件导入到 R 中 所有文件都存储在同一文件夹中 不确定这是否重要 但请注意 在我的 Mac 和 Windows 并行 VM 上的文件夹
  • 将所有分号替换为空格 pt2

    我尝试对 2000 多行关键字的列表运行文本分析 但它们的列出方式如下 战略 管理风格 组织 所以当我使用 tm 删除标点符号时 它就变成了 组织的战略管理风格 我认为这在某种程度上破坏了我常用术语的分析 我尝试过使用 vector lt
  • 为每个因素级别添加日期时间序列

    我有一个带有因子列的数据框 s lt data frame id 901 910 s id lt as factor s id 我有一个日期时间序列 library lubridate start lt now as difftime 2
  • R:ifelse 中的字符串列表

    我正在寻找与 MySQL 中的 where var in 语句类似的东西 我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
  • 根据 R 数据框中的名称对列进行平均

    我想知道是否有一种有效的方法来获取每组的平均值类似命名的列谁的名字结尾为 1S and 2S ex ex1S ex2S at time 1并取每组的平均值类似命名的列谁的名字结尾为 1C or 2C ex ex1C ex2C at time
  • R 错误:无法更改锁定绑定的值

    我试图估计无限数字流的平均值和标准差 当我运行代码时 出现错误消息 无法更改锁定绑定的值 我做了一些研究 发现这个错误与我使用全局变量有关 但我无法弄清楚 任何帮助将非常感激 在此先感谢您的帮助 define global variable
  • 如何总结此R问题中的销售数量、售出酒类数量和花费金额

    我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
  • 修改linux下的路径

    虽然我认为我已经接近 Linux 专业人士 但显然我仍然是一个初学者 当我登录服务器时 我需要使用最新版本的R 统计软件 R 安装在 2 个地方 当我运行以下命令时 which R I get usr bin R 进而 R version
  • 在 Lavaan 生长曲线模型中提取个体轨迹

    我已经使用 R 的 Lavaan 包中的 Growth 函数成功地对一项研究的纵向数据进行了建模 我找不到任何关于如何提取每个参与者的预测轨迹的记录 我只能找到整个组的预测轨迹 在摘要输出的 拦截 部分下给出 使用 lavPredict m
  • 如何确定 R 包的作者?

    如何确定包的作者是谁 鉴于我们拥有这个广泛使用的代码库 我认为参考我在分析中使用的软件是合适的 有没有办法以编程方式检索作者和任何其他相关信息 在伪代码中 我想执行以下操作 references base 我怎样才能做到这一点 为了能够引用
  • R 多元一步预测和准确性

    我想使用 R 来比较两个预测模型的 RMSE 均方根误差 第一个模型使用 1966 年至 2000 年的估计值来预测 2001 年 然后使用 1966 年至 2001 年的估计值来预测 2002 年 依此类推直至 2015 年 第二个模型使
  • 将ADODB二进制流转换为字符串vba

    我有以下问题 我有一个存储在服务器上的 CSV 文件 但它有 3 个字符作为分隔符 我想从 URL 加载数据并使用 作为分隔符将数据填充到 Excel 页面的列中 到目前为止 我找到了使用 ADODB 记录集从网站加载文件的代码 但我无法进
  • 使用 RDCOMClient 搜索 Outlook 收件箱

    我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题 然后获取附件 我在一封电子邮件上进行了这项工作 但由于主题包含日期元素 我需要搜索成为一个类似的子句 但不太清楚这适合我的下面的查询 outlook
  • 如何绘制每条线之间具有特定距离的图形

    实际上 我尝试绘制一个图形 但它将所有列 线 放在一起并显示 因此它不具有代表性 我尝试制作模拟数据并向您展示我如何绘制它 并向您展示我想要的内容 我不知道如何制作像下面所示的示例的数据 但我在这里做了什么 set seed 1 M lt
  • 如何自动启动我的 ec2 实例、运行命令然后将其关闭?

    我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型 我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它 所以任务会在ec2实例启动然后继续运行 要让 R 脚本
  • 按特定样本前缀对列名称向量进行子集化

    假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
  • RStudio 如何确定控制台宽度,为什么它似乎总是出错?

    我刚刚发现wid lt options width在 RStudio 中 它似乎是我日常控制台使用中令人烦恼的根源 或者更确切地说 更接近根源 我应该先说一下 我目前使用的是 R 3 2 2 RStudio 0 99 491 Linux M
  • 无法部署 ShinyApp:readTableHeader 在“raw”上发现不完整的最后一行(使用默认值:en_US)

    我已经拼命尝试部署我的闪亮应用程序大约一周了 但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head

随机推荐

  • TextBox 自动换行将字符串拆分为行

    这是我第一次就这个令人惊叹的服务提出问题 因为今天它通过阅读它对我帮助很大 目前 我正在制作小型 C 应用程序 需要使用大量文本框 在文本框属性中我已经检查过多线 and 自动换行功能 因此 当用户输入文本时 它会正确显示在多行中 我的问题
  • 使用 DTO 可空引用类型的最佳实践 [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我有一个 DTO 它是通过从 DynamoDB 表读取数据来填充的 假设目前看起来像这样 public class Item public st
  • Torch / Lua,如何将训练好的神经网络模型保存到文件?

    我从事一个 Torch Lua 项目 在其中实现了一个人工神经网络模型 一切正常 但现在我想按以下方式修改我的代码 由于我的输入数据集非常大 我想将其划分为 N 20 个跨度 然后我只想在第一个数据集跨度上训练我的神经网络 然后并行测试其他
  • SSErrorDomain、SKReceiptRefreshRequest、SKRequest 确实失败并出现错误,代码 = 16,代码 = 110

    iOS 9 2 1 Xcode 7 2 1 启用 ARC 我正在使用以下方法来检查失败SKProductsRequest and SKReceiptRefreshRequest void request SKRequest request
  • 当父容器发生变换时如何强制固定位置?

    我需要将位置固定到应用了转换的父项内的子 div 的视口 不幸的是我无法删除父级的转换 有什么想法如何覆盖这种行为吗 我可以在子元素上使用变换使其看起来类似于固定位置吗 rotate transform rotate 30deg backg
  • openpyxl中如何进行列对齐?

    我试图在 openpyxl 中对齐列 但没有成功 wb Workbook ws wb active ws column dimensions A alignment Alignment horizontal left ws column d
  • 如何创建自定义 ExtJS 表单字段组件?

    我想创建自定义 ExtJS表单域组件中使用其他 ExtJS 组件 例如 TreePanel 我怎样才能最轻松地做到这一点 我读过的文档扩展表单字段基础 http docs sencha com ext js 4 0 api Ext form
  • wget 下载 CSS @import,但忽略其中引用的文件

    我在用着wget如下 wget page requisites convert links e robots off span hosts restrict file names windows directory prefix ASSET
  • Android 控制台错误:“需要将 .class 兼容性设置为 5.0。请修复项目属性”

    刚刚重新安装了 Eclipse 3 5 和 Android 平台 SDK 和 ADT 我已经在不同的机器上完成了几次这样的操作 所以我很确定我已经正确配置了所有内容 尝试导入 Android 项目并在控制台窗口中收到以下错误 Android
  • 将 boost 与 MinGW 一起使用时对 WinMain@16 的未定义引用

    我在 Windows 7 下使用 Eclipse 使用 C 进行编程 我的makefile如下 build g shared o lib libCacheOpt a src cpp enable auto import I CWD incl
  • 定制量角器测试报告/输出

    您好 我正在尝试通过在命令提示符中给出以下命令来获取文件中的量角器测试结果 量角器conf js gt 位置 result txt 我可以在其中看到量角器测试的完整输出 以自定义方式运行量角器测试后 我可以在 txt 文件中仅获取执行的 S
  • 在子进程中调用 execlp() 后如何 printf() ?

    我目前正在尝试在子进程中调用 execlp 后从子进程打印消息 但是 调用 execlp 后 终端上没有出现任何内容 是什么导致我的 printf 调用不显示任何内容 如何解决这个问题 成功后execlp http linux die ne
  • 自定义圆形视图[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我想创建一个如下图所示的视图 我认为这是很晚的回应 但它也对其他人有帮助 我找到了一个库 在列表视图上重新设计并实现了循环列表 图书馆
  • IIS 7 中托管的 WCF 服务 - 绑定配置设置被忽略

    我有一个 WCF 服务操作 它接受字节数组作为其数据协定的一部分 该服务仅在内部公开 不公开到互联网 我想增加配额以允许 10MB 字节数组 该服务托管在 IIS7 中 当我尝试发送超过默认长度的字节数组时 我收到以下异常消息 反序列化类型
  • python 列中字母的频率

    我想计算所有列中每个字母出现的频率 例如我有这三个序列 seq1 AATC seq2 GCCT seq3 ATCA 在这里 我们有 在第一列中 A 的频率是 2 G 是 1 对于第二列 A 的频率为 1 C 为 1 T 为 1 其余列中的频
  • mouseup、mouse down 在 android webview 中不起作用

    以下 jquery 在我的 android webview 中不起作用 当长按跨度超过 10 秒时 需要重定向到特定的 url 这在网站上有效 但在 android webview 上不起作用 function var longpress
  • Javascript 中的安全 OAuth

    我有一个 api 它使用 OAuth 1 0a 来验证使用它的应用程序 它正在取代旧的 API 旧的 API 使用了许多自定义构建和大杂烩调用 但这些调用已被弃用 众所周知 OAuth 1 0a 在 客户端 Javascript 中并不安全
  • 无法解析 netParameter 文件

    gt py yolo py video path F Data Science Python37 Scripts YOLO videos lowres mp4 Traceback most recent call last File yol
  • 将 R 设置为从头开始使用 Visual Studio Code - “未找到命令 `r.executeInTerminal`”

    尝试在 Windows 中从 R Studio 切换到 VSCode 2个问题 如何允许 VS Code 中的 R 脚本将代码发送到 VS Code 中的 R 终端 我目前收到 命令r executeInTerminal未找到 这里有一个屏
  • 如何有条件地删除 write.csv 中的引号?

    使用时write csv 通过使用以下命令删除引号 可以显着减小文件大小 对于大型数据集 大约可减小 25 quote FALSE 然而 这可能会导致read csv如果数据中存在逗号 则会发生故障 例如 x lt data frame a