dplyr：将计数出现次数放入新变量中[重复]

2024-04-17

想要了解 dplyr 代码，但无法弄清楚这一点。已经看到这里描述的许多变量的类似问题（用 dplyr 总结一个因子的计数 https://stackoverflow.com/questions/25811756/summarizing-counts-of-a-factor-with-dplyr and 将值出现的行计数放入新变量中，如何在 R 中使用 dplyr 做到这一点？ https://stackoverflow.com/questions/23838322/putting-rowwise-counts-of-value-occurences-into-new-variables-how-to-do-that-in），但是我的任务有点小。
给定一个数据框，如何计算变量的频率并将其放入新变量中。

set.seed(9)
df <- data.frame(
    group=c(rep(1,5), rep(2,5)),
    var1=round(runif(10,1,3),0))

然后我们有：

>df
   group var1
1      1    1
2      1    1
3      1    1
4      1    1
5      1    2
6      2    1
7      2    2
8      2    2
9      2    2
10     2    3

想要第三列指示每组（group）多少次var1发生时，在本例中为：count=(4,4,4,4,1,1,3,3,3,1)。我尝试过 - 但没有成功 - 类似的事情：

df %>%  group_by(group) %>% rowwise() %>% do(count = nrow(.$var1))

非常感谢解释！

您需要做的就是按“group”和“var1”两列对数据进行分组：

df %>% group_by(group, var1) %>% mutate(count = n())
#Source: local data frame [10 x 3]
#Groups: group, var1
#
#   group var1 count
#1      1    1     4
#2      1    1     4
#3      1    1     4
#4      1    1     4
#5      1    2     1
#6      2    1     1
#7      2    2     3
#8      2    2     3
#9      2    2     3
#10     2    3     1

评论后编辑

以下是您不应该这样做的示例：

df %>% group_by(group, var1) %>% do(data.frame(., count = length(.$group)))

dplyr 的实现n()肯定更快、更干净、更短，并且应该始终优于上述实现。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

dplyr：将计数出现次数放入新变量中[重复] 的相关文章

如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
访问 R 工作区中的数据[重复]

这个问题在这里已经有答案了我是自学 R 的可能有一些非常基本的东西我可能不熟悉如果是这样我道歉我正在尝试访问外部来源提供给我的数据它作为一个工作空间出现我的流程如下 gt ls 1 2003OHT HR gt attach 20
如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
如何有效地将多个光栅 (.tif) 文件导入 R

我是 R 新手尤其是在空间数据方面我正在尝试找到一种方法来有效地将多个 600 单波段栅格 tif 文件导入到 R 中所有文件都存储在同一文件夹中不确定这是否重要但请注意在我的 Mac 和 Windows 并行 VM 上的文件夹
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac
在`rmarkdown`中，如何在句子中添加图标？

In rmarkdown 如何在句子中添加图标例如如下如何添加markdown icon单词 Markdown 和 is 之间有一个很好的 R 包可以轻松下载 RMarkdown 文档并将图标添加到其中 icons https gi
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
R 错误：无法更改锁定绑定的值

我试图估计无限数字流的平均值和标准差当我运行代码时出现错误消息无法更改锁定绑定的值我做了一些研究发现这个错误与我使用全局变量有关但我无法弄清楚任何帮助将非常感激在此先感谢您的帮助 define global variable
根据 row_number() 过滤 data.frame

更新自从提出这个问题以来 dplyr 已经更新现在按照 OP 的要求执行我正在尝试获取第二行到第七行data frame using dplyr 我正在这样做 require dplyr df lt data frame id 1 1
dplyr 中的标准评估：全局环境中的函数出现“无法找到函数”错误

我试图在 dplyr 中对全局环境中的函数使用标准评估但出现无法找到函数错误这是一些代码 create data frame df lt data frame x rnorm 10 y rnorm 10 define arbitra
R data.table fwrite 到 fread 空间分隔符并清空

我在使用 fread 以作为分隔符和散布的空白值时遇到问题例如这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd
R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple

随机推荐

Github 多个帐户 - globalUserName 拒绝访问 individualUserName/repoName.git

更新 2018 年 5 月 14 日我更新了我的操作系统并不得不重新启动我的机器所以这显然搞乱了我对这个问题的修复这似乎是暂时的为了再次暂时解决这个问题我必须执行以下操作 ran eval ssh agent s ssh add s
无法安装 pygraphviz

我在 macOS Mojave 10 14 1 上安装 pygraphviz 时遇到问题我使用的Python版本是3 6 7 执行命令时pip install pygraphviz 我收到以下冗长的错误消息 Collecting pygr
意象。将颜色更改为透明

我想更改此图像的黑色边框 http dev loungeup net im http dev loungeup net im 使用 PHP 中的 Imagick 实现透明结果图像应该具有可见的灰色边框灰色边框内的图像可见灰色边框之外的
如何以编程方式更改 ListView 内 TextView 的背景颜色？

我有一个包含多个 TextView 项目的 ListView 该列表是在运行时创建的并且大小可能会有所不同我想根据运行时生成的浮点值设置 TextView 项目的背景我正在使用 ArrayAdapter setListAdapter
包含所需部分的最大长度字符串的正则表达式？

我不完全是正则表达式专家所以我在为以下情况找到正则表达式时遇到一些困难我想匹配以下形式的字符串
DropzoneJS 上传后隐藏了 dropzone 区域，如何恢复？

我在用着angular2 dropzone wrapper我几乎按照我的需要工作了我有这样的配置 this dropZoneConfig server this url maxFilesize 50 acceptedFiles xml p
红宝石来整理单词[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在尝试编写一个 ruby 脚本来解读排列的单词生成所有排列并在 txt 目录中搜索该单词我遇到了问题这是我所拥有的简单概述 pr
如何在 GEOS 中制作矩形？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案如何使用 GEOS 库的 C API 制作矩形以下实现完成了工作GEOS http trac osg
来自 WEBVTT 的 RDF/JSON Javascript 解析器

晚上好开门见山我需要一个脚本来从 WEBVTT 文件中的特定时间间隔获取 RDF JSON 结构这样的事情存在吗 RDF JSON 是 Talis 指定的文件结构如下所示 S P O WEBVTT 实现上述结构如下 0 00 00
将有状态 LSTM 称为功能模型？

我有一个状态 LSTM 定义为顺序模型 model Sequential model add LSTM stateful True 后来我将其用作功能模型 input 1 input 2 Input Input output 1 mode
使用 ruby-install/ruby-build 在 Archlinux 上安装 Ruby 2.1.x 和 2.3.x 时出现 OpenSSL 错误

我在 Archlinux 上使用 ruby install 构建旧版本的 Ruby 时遇到了一些问题我怀疑 ruby build 也会发生同样的情况尝试安装 Ruby 2 1 5 2 1 6 2 3 0 2 3 1 2 3 4 后我看
ArgumentError：写入密钥必须初始化 Rails

您好我是 Rails 新手我使用 nitrous io 作为我的 IDE 我刚刚使用 Rails 生成了一个模型generate model Micropost content text user references 当我跑步时bun
如何删除 DataGrid 中焦点上的轮廓

我试图删除当您关注 Material UI 的 DataGrid 组件中的单元格时出现的轮廓这些方法都不起作用 const useStyles makeStyles theme gt Method 1 global MuiDataGrid
Java 中的字符串到 Clob？

我在java中有一个字符串但数据库中的数据类型是Clob 如何从 String 中获取 Clob clob setString position string 将 String 写入 Clob 对象 http download oracl
H2O 是否或将会提供任何与 h2o word2vec 一起使用的预训练向量？

H2O 最近在其 API 中添加了 word2vec 能够在您自己提供的语料库上轻松训练自己的词向量真是太好了然而使用大数据和大型计算机存在更大的可能性由于网络带宽和计算能力的限制谷歌或 H2O ai 等软件供应商可能无法访问这种类
如何使用数组在 FilterExpression 中使用“IN”语句 - dynamodb

检查了AWS文档但没有找到任何有效的示例这是我的尝试 var params TableName User IndexName a b index KeyConditionExpression Country country and s
Chrome DevTool Timeline View中的渲染和绘画事件有什么区别

我觉得render and paint只是两者都意味着渲染页面显示 DOM 有什么区别渲染事件是关于计算与每个 DOM 节点关联的样式即样式重新计算和页面上的元素位置布局绘制类别是关于实际绘制像素的包括绘制本身和解码图
GET_SIGNATURES 已弃用

我试图在我的 Android 应用程序中将内容分享到 Facebook 我需要一个密钥哈希但我无法查看HashKey on my logcat因为GET SIGNATURES已弃用有什么方法可以查看我的哈希键吗这是代码 public
并发可变优先级队列

是否存在并发可变优先级队列理想情况下我正在寻找 C 实现但是对于初学者来说指向算法的指针会非常有帮助需要明确的是我正在寻找一个优先级队列可以在其中调整元素的优先级特别是TBBconcurrent priority queue
dplyr：将计数出现次数放入新变量中[重复]

这个问题在这里已经有答案了想要了解 dplyr 代码但无法弄清楚这一点已经看到这里描述的许多变量的类似问题用 dplyr 总结一个因子的计数 https stackoverflow com questions 25811756 su

dplyr：将计数出现次数放入新变量中[重复]

评论后编辑

dplyr：将计数出现次数放入新变量中[重复] 的相关文章

随机推荐

热门标签