循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复]

2023-12-08

我有一个包含 2500 万行的文件,需要根据因子级别将其拆分为更小的文件。我创建了一个数据框来包含不同的因子级别,并编写了一个循环来执行一些操作并写出一个csv.

数据看起来像这样:

Country Col2 Code   Year
 A       C     1    2020
 A       D     1    2020
 A       C     1    2020
 A       D     2    2020
 A       C     2    2020
 A       D     2    2020
 A       C     2    2020
 A       D     3    2020

目的是根据代码为每个子集编写一个csv文件

d1 <- data %>%
  distinct(Code)
for(i in 1:nrow(d1))
{
  
  subset <- data %>%
  filter(Code  == Code[i])
  co <- subset$Code[i]
  
  yr<- subset$Year[i]
  

  setwd("C:/Users/...")
  
  write.csv(subset, paste(co,"_",Year, ".csv", sep=""), append = FALSE, row.names = FALSE)
  
  }

输出不断写入同一文件,而不是在目录中创建单独的文件。

有更好的方法吗?谢谢。


Use split根据因子级别拆分数据。

df_dat <- split(df, df$Code)
lapply(df_dat, function(x) write.csv(x, paste0('df_', x$col2[1], '.csv'), row.names = FALSE))

这将在您的工作目录中创建单独的数据框。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复] 的相关文章

  • 计算网络中的周期

    最好的方法是什么 或者是否有任何方法可以实现对网络中的 3 个和 4 个周期进行计数 3 个周期等于从一个模式网络计算的三个节点 三角形 的连接组 4 个周期等于由两个模式网络计算的四个节点 方块 的连接组 如果我有这样的网络 onemod
  • 两个数据框之间逐元素的百分比变化

    我有 2 个数据框 它们具有相同数量的匹配列和行 例如 df 2010 lt data frame col1 c Connecticut Delaware District of Columbia Florida Georgia col2
  • 如何使用R在csv文件中按列添加数据?

    我有向量中包含的信息 例如 sequence1 lt seq 1 20 sequence2 lt seq 21 40 我想将该数据附加到文件中 所以我使用 write table sequence1 file test csv sep ap
  • 使用 dplyr::mutate 重新编码而不在函数中工作

    我正在尝试使用dplyr mutate across 重新编码 a 中的指定列tbl 单独使用它们效果很好 但我无法让它们在函数中工作 library dplyr library tidyr df1 lt tibble Q7 1 1 5 Q
  • 按组划分的模态值(最常见)的简明 R data.table 语法

    用于查找每个 id 最常见类别的高效且优雅的 data table 语法是什么 我保留一个指示 NA 位置的布尔向量 用于其他目的 dt data table id rep 1 2 7 category c x y NA print dt
  • 如何使用meteor将存储在数据库中的json转换为csv

    我想下载从数据库 nodeDB 生成的 CSV 文件 该文件包含以下条目 这些条目应该仅充当标题 META TEMPLATE NAME B TEMPLATE GROUP Product KEYWORDS cc TEMPLATE SUBGRO
  • 如何使用 caret 包解释模型输出的准确性

    我正在使用 caret 包来训练模型 并希望获得模型的准确性 我听说的一种常见方法是使用confusionMatrix 然而 当我运行下面的代码时 经过训练的模型给出了一些与confuseMatrix 报告的精度值略有不同的精度值 所以我的
  • 在 R 中组合/合并列

    我可能在这个问题上遗漏了一些很容易的东西 我在任何地方都找不到正确的答案 我真的需要继续前进 所以我过度简化了我的数据 eventID lt c 2 4 Time lt c 09 32 09 43 df1 lt data frame eve
  • 按组连接/粘贴列并添加到原始数据

    我有一个名称数据框 名称 按 部门 分组 Dept Date Name 30 07 DEC 02 Raphaely 30 18 MAY 03 Khoo 40 07 JUN 02 Mavris 50 01 MAY 03 Kaufling 50
  • 如何在闪亮的应用程序中初始化渲染项目的默认值

    介绍 In a shinyApp 我想用动态输入渲染输出 我的问题是 使用shinydashboard使用不同的选项卡 默认值来自 Input 仅当激活相应选项卡时才会呈现 想想输入和输出选项卡 当使用时我得到同样的行为switch声明in
  • 如何根据子字符串匹配选择 R data.table 行(类似于 SQL)

    我有一个带有字符列的 data table 并且只想选择其中包含子字符串的行 相当于SQLWHERE x LIKE substring E g gt Months data table Name month name Number 1 12
  • 在 R 中调用“boot”时没有数据

    我有一个包含很多列的数据框 第一列包含 系统 1 系统 2 等类别 第二列包含代表 0 和 1 的数字 请看下面 例如 SYSTEM Q1 Q2 S1 0 1 S1 1 0 S2 1 1 S2 0 0 S2 1 1 我在 R 中有这段代码来
  • 从谷歌街道地址中提取城市和州信息

    我有一个数据集 其中包含不同点位置的纬度 经度信息 我想知道与每个点关联的城市和州 按照此example https stackoverflow com questions 22911642 applying revgeocode to a
  • 按组渐进串联列[重复]

    这个问题在这里已经有答案了 假设我有这个输入 ID date 1 date 2 str 1 1 2010 07 04 2008 01 20 A 2 2 2015 07 01 2011 08 31 C 3 3 2015 03 06 2013
  • 如何在R中绘制堆积柱形图?

    有谁知道如何使用 R 绘制由超过 1 个变量堆叠的列的直方图 就像excel中的 堆积柱形图 一样 谢谢你 我假设您确实想要一个条形图而不是直方图 在这种情况下 barplot从标准图形或barchart格子包中的两者都可以做到 或者使用
  • R 矩阵到犰狳的转换非常慢

    观察 对于中等大小的矩阵 将矩阵从 R 传递到 C 的开销要慢得多arma mat类型比NumericMatrix类型 大约需要 250 倍的时间 这是一个最小的例子 include
  • uniVocity 不会将第一列解析为 beans

    我试图在 uniVocity parsers 的帮助下从 GTFS zip 读取 CSV 文件 但遇到了一个我无法解决的问题 由于某种原因 某些 CSV 文件的第一列似乎无法正确解析 例如 在 stops txt 文件中 如下所示 stop
  • 通过环境.yml 文件使用 conda 安装 R 包

    通常我会创建 conda 环境 例如 conda env create f environment yml conda activate env name 通常我使用 Python 工作 典型的environment yml简单的文件可能看
  • 在 ggplot2 中隐藏单个几何图例

    我将相同的变量 颜色 映射到两个不同几何图形中的颜色 我希望它们要么出现在单独的图例中 DHJ 和 EFI 要么最好完全跳过第二个图例 对于 E F 和 I 目前 R 将两者混合在一起 并给我一个图例 其中按字母顺序列出了 DEFHIJ 所
  • 使用 R 中的剪切函数对缺失值进行 NA 级别[重复]

    这个问题在这里已经有答案了 R 中的 cut 函数省略了 NA 但我想要一个缺失值的级别 这是我的 MWE set seed 12345 Y lt c rnorm n 50 mean 500 sd 1 NA Y1 lt cut log Y

随机推荐

  • 符合 MVC 4 站点 508

    我花了很多时间研究这个 但也许有人指出了我正确的方向 需要构建一个符合 508 标准的 MVC 4 网站 三年前我做了一些 508 合规性测试和标签插入 但我真的想再做一次 其他人用什么 寻找什么标签 什么测试工具 有免费的测试工具吗 AJ
  • iOS 登录/注销在 Swift 中的实现

    我一直在尝试快速实现 iOS 应用程序的登录 注销流程 这是我的故事板 在主视图控制器 即蓝屏 中 我实现了以下代码来检测用户是否已登录 然后自动将它们带到表视图控制器 覆盖 func viewDidAppear animated Bool
  • 作为文本框的 AutoCompleteCustomSource 的列表框项目

    我已使用数据源属性将一些项目填充到列表框中 现在我需要从列表框中列出的项目中为文本框设置 AutoCompleteCustomSource 准确地说 ListBox 的 DataSource 和 textBox 的 AutoComplete
  • 将 R 对象分组到列表中

    我已将一系列 SpatialPolygonsDataFrames 加载到我的工作区中 每个命名对象都有一个 adm0 adm1 or adm2 附有国家缩写 对于德国来说 这看起来像 DEU adm0 DEU adm1 and DEU ad
  • 用于检查 perl 模块是否已安装的 perl 脚本

    我希望能够对列表中的每个模块运行此测试 不知道如何 ger perl 循环遍历每个项目 use Module Load eval load Image Magick 1 or die you need Module to run this
  • LDAP Bind 似乎返回 true,密码为空

    我有这段代码根据 LDAP 目录对我的用户进行身份验证 当密码不正确时 它返回 false 但如果密码留空 它仍然会对用户进行身份验证 有什么想法可能会发生这种情况吗 if ldap bind ds user dn password sha
  • C 结构体顺序有任何保证吗?

    我广泛使用了结构 并且看到了一些有趣的东西 特别是 value代替value gt first value其中 value 是指向结构体的指针 first value是第一个成员 是 value safe 另请注意 由于对齐 无法保证大小
  • 使用 WPF 应用程序连接到数据库

    我不久前开始接触 WPF 由于我正处于学习 MVVM 的阶段 所以我正在使用THIS教程 继该教程之后 我现在有了一个涉及产品的基本项目 我想做的下一件事是了解如何连接到数据库并从中存储 检索信息 我的问题是 连接数据库的可用方法有哪些 最
  • 有没有办法检测用户何时更改了设备上的时钟时间?

    有没有办法检测Android系统时钟何时被重置由用户在安卓中 我正在设计一个应用程序 它使用系统时间来确定用户何时在特定时间位于特定地点 并且我不想依赖当时的网络可用性 显然 因此最好知道用户何时更改了系统时钟 这样他们就无法 作弊 就在这
  • 或 RequestDispatcher.forward 使用 GET 或 POST 吗?

    问题如标题所示
  • onServicesDiscovered(BluetoothGatt gatt, int status) 永远不会被调用

    我有一个从 IntentService 调用的 BluetoothLeService BLEService 在连接之前工作正常 与 iBeacon 建立连接后 它调用 public void onConnectionStateChange
  • Android 中的底线样式

    我需要创建一个 android 形状 以便只有底部有描边 虚线 当我尝试以下操作时 笔划将形状从中心一分为二 有谁知道如何做对吗 笔划必须是底线 边框 我使用该形状作为 TextView 的背景 请不要介意我为什么需要它
  • 编辑曲线和轴参数选项未显示在 matplotlib 中

    我正在使用 Python 2 6 和 PyQt4 matplotlib 后端设置为 Qt4Agg 绘图显示了 但编辑曲线参数的选项 看起来像绿色勾选框的选项 没有显示 有任何想法吗 编辑 这是我没有看到的复选框 示例代码 import ma
  • 如何从我的 EAGLLayer 抓取图像?

    我正在寻找方法来获取 opengl 的内容 如 UIImage 然后将其保存到文件中 我现在正在尝试 glReadPixels 尽管我不确定我应该做哪种 malloc 是否正确 我发现在 OSX 上它是 GL BGRA 但在 iPhone
  • 递归CTE-查找经理以下的所有员工

    我为此创建了一个示例小提琴SQLFIDDLE CREATE TABLE dbo Users userId int userName varchar 50 managerId int INSERT INTO dbo Users userId
  • 如何通知父视图控制器模态视图控制器中更改的屏幕方向?

    我在纵向模式下在 UISplitViewController 上方呈现一个模式视图控制器 现在 我将 iPad 旋转到横向模式并关闭模态视图控制器 UISplitViewController 似乎没有收到有关方向更改的通知 分割视图控制器的
  • caret 包中的 createGrid 函数 - 它被删除了吗?

    我在用着caretR 版本 3 0 2 中的包 版本 6 0 24 功能createGrid实际上被删除了 在caret版本 5 17 7 保留该功能 功能创建网格已从版本 6 0 24 中删除 http cran r project or
  • 在 Kubernetes cron 作业中运行的应用程序无法连接到同一 Kubernetes 集群中的数据库

    我有一个 Kubernetes 集群 运行 PostgreSQL 数据库 Grafana 仪表板和一个在 Kubernetes 内每小时运行的 Python 单运行应用程序 构建为 Docker 映像 CronJob 见下面的清单 此外 这
  • 如何检查字符串是否包含字母表中的任何字母?

    检查字符串是否包含字母表中的任何字母的最佳纯 Python 实现是什么 string 1 555 555 5555 string 2 555 555 5555 ext 5555 Where string 1会回来False因为其中没有字母表
  • 循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复]

    这个问题在这里已经有答案了 我有一个包含 2500 万行的文件 需要根据因子级别将其拆分为更小的文件 我创建了一个数据框来包含不同的因子级别 并编写了一个循环来执行一些操作并写出一个csv 数据看起来像这样 Country Col2 Cod