循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复]

2023-12-08

我有一个包含 2500 万行的文件，需要根据因子级别将其拆分为更小的文件。我创建了一个数据框来包含不同的因子级别，并编写了一个循环来执行一些操作并写出一个csv.

数据看起来像这样：

Country Col2 Code   Year
 A       C     1    2020
 A       D     1    2020
 A       C     1    2020
 A       D     2    2020
 A       C     2    2020
 A       D     2    2020
 A       C     2    2020
 A       D     3    2020

目的是根据代码为每个子集编写一个csv文件

d1 <- data %>%
  distinct(Code)

for(i in 1:nrow(d1))
{
  
  subset <- data %>%
  filter(Code  == Code[i])
  co <- subset$Code[i]
  
  yr<- subset$Year[i]
  

  setwd("C:/Users/...")
  
  write.csv(subset, paste(co,"_",Year, ".csv", sep=""), append = FALSE, row.names = FALSE)
  
  }

输出不断写入同一文件，而不是在目录中创建单独的文件。

有更好的方法吗？谢谢。

Use split根据因子级别拆分数据。

df_dat <- split(df, df$Code)
lapply(df_dat, function(x) write.csv(x, paste0('df_', x$col2[1], '.csv'), row.names = FALSE))

这将在您的工作目录中创建单独的数据框。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

loops

csv

dplyr

循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复] 的相关文章

计算网络中的周期

最好的方法是什么或者是否有任何方法可以实现对网络中的 3 个和 4 个周期进行计数 3 个周期等于从一个模式网络计算的三个节点三角形的连接组 4 个周期等于由两个模式网络计算的四个节点方块的连接组如果我有这样的网络 onemod
两个数据框之间逐元素的百分比变化

我有 2 个数据框它们具有相同数量的匹配列和行例如 df 2010 lt data frame col1 c Connecticut Delaware District of Columbia Florida Georgia col2
如何使用R在csv文件中按列添加数据？

我有向量中包含的信息例如 sequence1 lt seq 1 20 sequence2 lt seq 21 40 我想将该数据附加到文件中所以我使用 write table sequence1 file test csv sep ap
使用 dplyr::mutate 重新编码而不在函数中工作

我正在尝试使用dplyr mutate across 重新编码 a 中的指定列tbl 单独使用它们效果很好但我无法让它们在函数中工作 library dplyr library tidyr df1 lt tibble Q7 1 1 5 Q
按组划分的模态值（最常见）的简明 R data.table 语法

用于查找每个 id 最常见类别的高效且优雅的 data table 语法是什么我保留一个指示 NA 位置的布尔向量用于其他目的 dt data table id rep 1 2 7 category c x y NA print dt
如何使用meteor将存储在数据库中的json转换为csv

我想下载从数据库 nodeDB 生成的 CSV 文件该文件包含以下条目这些条目应该仅充当标题 META TEMPLATE NAME B TEMPLATE GROUP Product KEYWORDS cc TEMPLATE SUBGRO
如何使用 caret 包解释模型输出的准确性

我正在使用 caret 包来训练模型并希望获得模型的准确性我听说的一种常见方法是使用confusionMatrix 然而当我运行下面的代码时经过训练的模型给出了一些与confuseMatrix 报告的精度值略有不同的精度值所以我的
在 R 中组合/合并列

我可能在这个问题上遗漏了一些很容易的东西我在任何地方都找不到正确的答案我真的需要继续前进所以我过度简化了我的数据 eventID lt c 2 4 Time lt c 09 32 09 43 df1 lt data frame eve
按组连接/粘贴列并添加到原始数据

我有一个名称数据框名称按部门分组 Dept Date Name 30 07 DEC 02 Raphaely 30 18 MAY 03 Khoo 40 07 JUN 02 Mavris 50 01 MAY 03 Kaufling 50
如何在闪亮的应用程序中初始化渲染项目的默认值

介绍 In a shinyApp 我想用动态输入渲染输出我的问题是使用shinydashboard使用不同的选项卡默认值来自 Input 仅当激活相应选项卡时才会呈现想想输入和输出选项卡当使用时我得到同样的行为switch声明in
如何根据子字符串匹配选择 R data.table 行（类似于 SQL）

我有一个带有字符列的 data table 并且只想选择其中包含子字符串的行相当于SQLWHERE x LIKE substring E g gt Months data table Name month name Number 1 12
在 R 中调用“boot”时没有数据

我有一个包含很多列的数据框第一列包含系统 1 系统 2 等类别第二列包含代表 0 和 1 的数字请看下面例如 SYSTEM Q1 Q2 S1 0 1 S1 1 0 S2 1 1 S2 0 0 S2 1 1 我在 R 中有这段代码来
从谷歌街道地址中提取城市和州信息

我有一个数据集其中包含不同点位置的纬度经度信息我想知道与每个点关联的城市和州按照此example https stackoverflow com questions 22911642 applying revgeocode to a
按组渐进串联列[重复]

这个问题在这里已经有答案了假设我有这个输入 ID date 1 date 2 str 1 1 2010 07 04 2008 01 20 A 2 2 2015 07 01 2011 08 31 C 3 3 2015 03 06 2013
如何在R中绘制堆积柱形图？

有谁知道如何使用 R 绘制由超过 1 个变量堆叠的列的直方图就像excel中的堆积柱形图一样谢谢你我假设您确实想要一个条形图而不是直方图在这种情况下 barplot从标准图形或barchart格子包中的两者都可以做到或者使用
R 矩阵到犰狳的转换非常慢

观察对于中等大小的矩阵将矩阵从 R 传递到 C 的开销要慢得多arma mat类型比NumericMatrix类型大约需要 250 倍的时间这是一个最小的例子 include
uniVocity 不会将第一列解析为 beans

我试图在 uniVocity parsers 的帮助下从 GTFS zip 读取 CSV 文件但遇到了一个我无法解决的问题由于某种原因某些 CSV 文件的第一列似乎无法正确解析例如在 stops txt 文件中如下所示 stop
通过环境.yml 文件使用 conda 安装 R 包

通常我会创建 conda 环境例如 conda env create f environment yml conda activate env name 通常我使用 Python 工作典型的environment yml简单的文件可能看
在 ggplot2 中隐藏单个几何图例

我将相同的变量颜色映射到两个不同几何图形中的颜色我希望它们要么出现在单独的图例中 DHJ 和 EFI 要么最好完全跳过第二个图例对于 E F 和 I 目前 R 将两者混合在一起并给我一个图例其中按字母顺序列出了 DEFHIJ 所
使用 R 中的剪切函数对缺失值进行 NA 级别[重复]

这个问题在这里已经有答案了 R 中的 cut 函数省略了 NA 但我想要一个缺失值的级别这是我的 MWE set seed 12345 Y lt c rnorm n 50 mean 500 sd 1 NA Y1 lt cut log Y

随机推荐

符合 MVC 4 站点 508

我花了很多时间研究这个但也许有人指出了我正确的方向需要构建一个符合 508 标准的 MVC 4 网站三年前我做了一些 508 合规性测试和标签插入但我真的想再做一次其他人用什么寻找什么标签什么测试工具有免费的测试工具吗 AJ
iOS 登录/注销在 Swift 中的实现

我一直在尝试快速实现 iOS 应用程序的登录注销流程这是我的故事板在主视图控制器即蓝屏中我实现了以下代码来检测用户是否已登录然后自动将它们带到表视图控制器覆盖 func viewDidAppear animated Bool
作为文本框的 AutoCompleteCustomSource 的列表框项目

我已使用数据源属性将一些项目填充到列表框中现在我需要从列表框中列出的项目中为文本框设置 AutoCompleteCustomSource 准确地说 ListBox 的 DataSource 和 textBox 的 AutoComplete
将 R 对象分组到列表中

我已将一系列 SpatialPolygonsDataFrames 加载到我的工作区中每个命名对象都有一个 adm0 adm1 or adm2 附有国家缩写对于德国来说这看起来像 DEU adm0 DEU adm1 and DEU ad
用于检查 perl 模块是否已安装的 perl 脚本

我希望能够对列表中的每个模块运行此测试不知道如何 ger perl 循环遍历每个项目 use Module Load eval load Image Magick 1 or die you need Module to run this
LDAP Bind 似乎返回 true，密码为空

我有这段代码根据 LDAP 目录对我的用户进行身份验证当密码不正确时它返回 false 但如果密码留空它仍然会对用户进行身份验证有什么想法可能会发生这种情况吗 if ldap bind ds user dn password sha
C 结构体顺序有任何保证吗？

我广泛使用了结构并且看到了一些有趣的东西特别是 value代替value gt first value其中 value 是指向结构体的指针 first value是第一个成员是 value safe 另请注意由于对齐无法保证大小
使用 WPF 应用程序连接到数据库

我不久前开始接触 WPF 由于我正处于学习 MVVM 的阶段所以我正在使用THIS教程继该教程之后我现在有了一个涉及产品的基本项目我想做的下一件事是了解如何连接到数据库并从中存储检索信息我的问题是连接数据库的可用方法有哪些最
有没有办法检测用户何时更改了设备上的时钟时间？

有没有办法检测Android系统时钟何时被重置由用户在安卓中我正在设计一个应用程序它使用系统时间来确定用户何时在特定时间位于特定地点并且我不想依赖当时的网络可用性显然因此最好知道用户何时更改了系统时钟这样他们就无法作弊就在这
或 RequestDispatcher.forward 使用 GET 或 POST 吗？

问题如标题所示
onServicesDiscovered(BluetoothGatt gatt, int status) 永远不会被调用

我有一个从 IntentService 调用的 BluetoothLeService BLEService 在连接之前工作正常与 iBeacon 建立连接后它调用 public void onConnectionStateChange
Android 中的底线样式

我需要创建一个 android 形状以便只有底部有描边虚线当我尝试以下操作时笔划将形状从中心一分为二有谁知道如何做对吗笔划必须是底线边框我使用该形状作为 TextView 的背景请不要介意我为什么需要它
编辑曲线和轴参数选项未显示在 matplotlib 中

我正在使用 Python 2 6 和 PyQt4 matplotlib 后端设置为 Qt4Agg 绘图显示了但编辑曲线参数的选项看起来像绿色勾选框的选项没有显示有任何想法吗编辑这是我没有看到的复选框示例代码 import ma
如何从我的 EAGLLayer 抓取图像？

我正在寻找方法来获取 opengl 的内容如 UIImage 然后将其保存到文件中我现在正在尝试 glReadPixels 尽管我不确定我应该做哪种 malloc 是否正确我发现在 OSX 上它是 GL BGRA 但在 iPhone
递归CTE-查找经理以下的所有员工

我为此创建了一个示例小提琴SQLFIDDLE CREATE TABLE dbo Users userId int userName varchar 50 managerId int INSERT INTO dbo Users userId
如何通知父视图控制器模态视图控制器中更改的屏幕方向？

我在纵向模式下在 UISplitViewController 上方呈现一个模式视图控制器现在我将 iPad 旋转到横向模式并关闭模态视图控制器 UISplitViewController 似乎没有收到有关方向更改的通知分割视图控制器的
caret 包中的 createGrid 函数 - 它被删除了吗？

我在用着caretR 版本 3 0 2 中的包版本 6 0 24 功能createGrid实际上被删除了在caret版本 5 17 7 保留该功能功能创建网格已从版本 6 0 24 中删除 http cran r project or
在 Kubernetes cron 作业中运行的应用程序无法连接到同一 Kubernetes 集群中的数据库

我有一个 Kubernetes 集群运行 PostgreSQL 数据库 Grafana 仪表板和一个在 Kubernetes 内每小时运行的 Python 单运行应用程序构建为 Docker 映像 CronJob 见下面的清单此外这
如何检查字符串是否包含字母表中的任何字母？

检查字符串是否包含字母表中的任何字母的最佳纯 Python 实现是什么 string 1 555 555 5555 string 2 555 555 5555 ext 5555 Where string 1会回来False因为其中没有字母表
循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复]

这个问题在这里已经有答案了我有一个包含 2500 万行的文件需要根据因子级别将其拆分为更小的文件我创建了一个数据框来包含不同的因子级别并编写了一个循环来执行一些操作并写出一个csv 数据看起来像这样 Country Col2 Cod

循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复]

循环分割大数据帧并在 R 中写入多个 CSV 文件 [重复] 的相关文章

随机推荐

热门标签