按因子级别拆分数据帧并按这些级别命名数据帧

2024-01-01

我想按因子变量之一的级别拆分现有数据帧,以便拆分数据帧的名称与因子的级别相对应。

df <- data.frame(cbind(X = 1:10, Y = rnorm(10)), Z = sample(LETTERS[1:3], 10, replace = TRUE))

If df是原始数据帧,我想将其分成三个数据帧,称为A, B and C,这样:

A = subset(df, Z == 'A')
B = subset(df, Z == 'B')
...

有没有一种简单的方法可以一次性完成此操作?我有一个巨大的数据集,因子变量的级别太多。


在基本 R 中,您应该使用该函数split. And split has a default方法和一种用于data.frame。然而,我发现split.data.frame由于要分割的级别数量变得巨大,因此速度非常慢。那是,

# inefficient in my opinion
split(df, df$Z)

上述解决方案将直接为您提供您所要求的名称,但在大级别上会令人窒息。

如果您愿意使用外部包来提高速度/效率,我建议使用data.table包裹:

require(data.table)
dt <- data.table(df)
oo <- dt[, list(list(.SD)), by = Z]$V1
names(oo) <- unique(dt$Z)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

按因子级别拆分数据帧并按这些级别命名数据帧 的相关文章

  • dplyr +“meta”-columns:当列包含要使用的其他列的名称而不是数据时

    我想知道以下问题在 dplyr 中是否有一个优雅的解决方案 要提供一个简单的可重现示例 请考虑以下 data frame df lt data frame a 1 5 b 2 6 c 3 7 ref c a a b b c stringsA
  • R 中的 ddply:对于每个组,查找特定变量的出现百分比

    我有一个数据集 其中包含两列 user type 和滞后响应时间 以天为单位 user type imp date lag Consumer 20130613 1 Consumer 20130612 2 Consumer 20130611
  • 使用 ggplot 添加到投影地图时 R 饼图扭曲

    我想使用 ggplot 将饼图绘制到投影地图上 然而 饼图可能由于投影而变得扭曲 有谁知道如何在不变形的情况下绘制饼图 示例代码如下 谢谢 lib c ggplot2 scatterpie lapply lib library charac
  • 收集四列,其中两个键中包含值

    已经提出了类似的问题 但它们都涉及在一个关键列中收集多个列 我需要两个键中的多个列 这是我的数据框 ID measure A 1 measure A 2 measure B 1 measure B 2 1 8 25 23 5 4 5 2 8
  • R 中 nlme 包中的 gls 函数出错

    我不断收到这样的错误 Error in coef lt corARMA tmp value c 18 3113452983211 1 56626248550284 Coefficient matrix not invertible 或者像这
  • 从每小时中提取/子集分钟值

    我的数据框包含以下格式的日期值YYYY MM DD HH MM SS跨越 125000 多行 按分钟细分 每行代表一分钟 1 2018 01 01 00 04 00 2 2018 01 01 00 05 00 3 2018 01 01 00
  • dplyr:带引号变量名的 mutate 的标准评估

    我将如何使用mutate 我的假设是我正在寻找标准评价就我而言 因此mutate 但我对此并不完全有信心 当使用接受变量名列表的函数时 如下所示 createSum function data variableNames data gt m
  • 距数据帧中最近的非 NA 值的距离

    我有以下数据帧 df 我想添加一列 其中包含与每行最接近的非 NA 值的距离 df lt data frame x 1 20 df c 1 3 4 5 11 14 15 16 x lt NA 换句话说 我正在寻找以下值 df distanc
  • ggsubplot 是否适用于 R 3.2.1+?

    CRAN 提供的 ggsubplot 版本与 R 的最新版本 例如 3 1 1 不兼容 运行 ggsubplot 示例会返回以下错误 Error in layout base data vars drop drop At least one
  • 如何在R中将英尺转换为厘米?

    我得到了一个高度的字符向量 如下所示 859 5 10 5 8 5 11 6 0 5 10 6 2 5 11 6 2 6 2 5 7 5 9 5 7 6 1 6 0 5 11 6 0 6 5 6 1 6 1 5 10 5 11 5 11 6
  • XLConnect 无法确定 JAVA_HOME 错误

    感谢您的帮助 我正在尝试运行 XLconnect 但收到此错误消息 gt library XLConnect lib loc C Users 1144143929 Documents R win library 2 15 Error onL
  • 使用神经网络包进行多项分类

    这个问题应该很简单 但文档没有帮助 我正在使用 R 我必须使用neuralnet多项式分类问题的包 所有示例均针对二项式或线性输出 我可以使用二项式输出进行一些一对一的实现 但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点 其中
  • 将模式的所有元素与向量以相同的顺序匹配

    我创建了一个函数yes seq需要两个参数 一个模式pat和数据dat 该函数以相同的顺序查找数据中是否存在模式 例如 dat lt letters 1 10 dat 1 a b c d e f g h i j pat lt c a c g
  • 在 Windows / Linux 中创建 Mac 包

    我自己努力制作一个 r 包 我按照 stackoverflow 中上一个问题的说明进行操作如何为外行开发软件包 http cran r project org bin windows Rtools 以下是我根据上一个问题采取的步骤 在新的
  • 如何创建 highcharter 事件函数以在 Shiny R 中创建“下拉函数”

    我正在建造一个shiny应用程序 我想要完成的事情之一是创建一个下拉菜单 我想将劳动力变量绘制为不同级别的年份变量的函数 请参阅下面的示例数据框 year level 2 level 3 labour 1 2013 10 101 1 2 2
  • 连接树状图和热图

    我有一个heatmap 一组样本的基因表达 set seed 10 mat lt matrix rnorm 24 10 mean 1 sd 2 nrow 24 ncol 10 dimnames list paste g 1 24 sep p
  • 构造奎因(自我复制功能)

    有没有人构建过 quine 生成自己源文本的副本作为其完整输出的程序 http www nyx net gthompso quine htm http www nyx net gthompso quine htm 在 R 中 quine 标
  • 基本 dyplr 函数给出错误:“check_dots_used”

    试图找出为什么我会收到此错误 以前从未见过 谷歌没有帮助 check dots used action warn 中的错误 未使用参数 action warn 我在下面的非常基本的试验中收到错误 而且在 group by count 中也收
  • ggplot2 中的中心图标题

    这个简单的代码 以及今天早上我的所有脚本 已经开始在 ggplot2 中给我一个偏离中心的标题 Ubuntu version 16 04 R studio version Version 0 99 896 R version 3 3 2 G
  • 如何使用 Facet R 添加线条[重复]

    这个问题在这里已经有答案了 所以我有一个多面图 我希望能够向其中添加随每个面而变化的线 这是代码 p lt ggplot mtcars aes x wt geom histogram bins 20 aes fill factor cyl

随机推荐

  • 查看 CFHTTP 调用的原始 HTML

    有没有办法输出原始htmlCFHTTP称呼 我试图了解一些标头身份验证信息是如何出现的 我对浏览器插件或代码更新持开放态度 只要能帮助我了解期间发生的情况即可cfhttp call 例如
  • 为什么 Hibernate Search 需要花费这么多时间来构建索引?

    我正在尝试通过 hibernate 搜索构建 lucene 索引FullTextSession createIndexer startAndWait 但即使测试数据非常少 它也不会结束 这是我的代码 Component hibernateS
  • ExtJS 4 中服务器调用后取消 store.remove

    我正在使用 ExtJS 4 并有一个带有 ajax 代理和 api 的 Ext data Store var gridStore Ext create Ext data Store autoSync true proxy type ajax
  • 如何在 PHP 中进行 URL 重写?

    这是一个双重问题 正确的答案将是 How you do it in PHP 解释是否有任何优势 如果可能的话也很重要 我只是很好奇 因为我真的不知道 而且我在网页上看到很多 编辑 我不知道技术名称 但例如 Stackoverflow 上的示
  • SSIS 包未在 SQL Server 2012 中以 32 位运行

    我有一个在 VS2012 中开发的包 使用 SQL 数据工具组件 它使用 VFPOLEDB 提供程序从 DBF 文件收集数据 并将其放入 SQL Server 2012 X64 服务器上的数据库中 包含该包的项目将 Run64BitRunt
  • 使用 Shiny 中的文本输入创建数据框

    尝试创建如下数据框 X Y 20 30 使用textInput 创建数据框 但在文本区域中输入的值未正确分配给数据框 请你帮助我好吗 ui R library shiny shinyUI pageWithSidebar headerPane
  • 是否可以在使用sql的更新语句中使用MAX?

    我正在尝试在sql语句中使用MAX函数 这就是我想做的 像这样的东西 UPDATE MainTable SET Date GETDATE where ID Max 我知道这是错误的 特别是在我放置 where 条件但无法弄清楚如何在同一语句
  • 在 Google Analytics iOS SDK v3 中设置用户性别和年龄

    使用最新的Google Analytics SDK v3 0 6 我在文档中找不到任何地方 通过头文件搜索或网络搜索如何设置当前用户的年龄和性别以进行GA跟踪 我成功地将自定义维度用于其他事情 并且可以将其中两个用于年龄和性别 但当已经有年
  • Firebase 数据库带宽计算

    两周前 我发布了一款名为 MyPetrol 的 Android 应用程序 三天之内 马来西亚就有大约 9 万用户 之后 由于 Firebase 数据库带宽消耗巨大 3 天 117GB 我关闭了该应用程序 我是一个自学成才的爱好者 没有IT相
  • android playstore支持非续订订阅吗?

    我的问题是我们可以在我们的 Android 应用程序中提供非续订订阅的功能吗 因此 用户将通过邮件收到他 她的订阅已过期的通知 因此他将像 IOS 一样手动重新订阅 是的 它确实 参见Android官方文档的描述 您可以创建关联的数字商品的
  • 当我第一次获取 nginx 时发生错误 CORS/503 [关闭]

    Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案 这与我之前的问题有关从这里 https stackoverflow com questions 75287786 cor
  • 在 java 8 中迭代和映射两个列表

    我有 2 个清单 列表1 对象1 名称1 id1 列表2 对象2 名称2 id2 假设 list1 的大小与 list2 相同 我想迭代列表 2 如果列表 2 的名称不为空 则更新列表 1 的名称 1 这是使用旧java的代码 for Ob
  • 在 React Native 的 onPress 事件期间 this.state 未定义

    你好 我是 React Native 的新手 我的代码是 import React View Text TextInput Component from react native import Style from styles signi
  • 使用 iTextSharp 编辑现有 PDF 文件

    我有一个 pdf 文件 我正在通过使用以下编码将其转换为文本来处理它 ITextExtractionStrategy strategy new SimpleTextExtractionStrategy string currentText
  • MySQL 从流读取失败

    我间歇性地面临以下错误 通过在 mysql 服务器设置中使用 跳过名称解析 选项可以解决此问题 但是 根据网上发现的许多建议 使用 127 0 0 1 应该可以解决该问题 但这也没有帮助 您能否建议我一个解决方法或一个 SQL 命令 通过它
  • 文件描述符规范

    我试图理解文件描述符的标志和模式 手册页 http man7 org linux man pages man2 fcntl 2 html for fcntl manipulate file descriptor int fcntl int
  • Neo4j 关系索引 - 搜索关系属性

    我有一个具有以下结构的 neo4j 图 账户 交易 账户 Transaction是neo4j关系 Account是节点 每笔交易都设置了各种属性 例如交易 ID 金额 日期和各种其他银行信息 我可以按帐户 ID 运行搜索 结果返回正常 但是
  • 如何防止 iPhone 屏幕在应用程序运行时变暗或关闭?

    我正在开发一个不需要用户输入的应用程序 但我不希望 iPhone 进入省电模式 是否可以通过应用程序禁用省电功能 Objective C UIApplication sharedApplication setIdleTimerDisable
  • Kendo Ui 下拉列表集通过 Javascript 可见

    我需要在 javaScript 中以编程方式设置可见的kendo dropdownlist 我曾尝试过 dropdownlist ddl data kendoDropDownList dropdownlist visible false d
  • 按因子级别拆分数据帧并按这些级别命名数据帧

    我想按因子变量之一的级别拆分现有数据帧 以便拆分数据帧的名称与因子的级别相对应 df lt data frame cbind X 1 10 Y rnorm 10 Z sample LETTERS 1 3 10 replace TRUE If