R:统计每个ID每天区分的变量数量

2024-03-25

这是我的数据：

ID        Date             v
ID1         1              v1
ID1         1              v1
ID1         1              v8
ID1         2              v5
ID1         2              v3
ID1         3              v3
ID2         1              v7
ID2         2              v15
ID2         2              v15
ID2         3              v3

我想计算v的个数区分 per day and per ID。正如我上面的数据，我想得到如下结果：

ID        Date             v         daily_v_distinguish_ID
ID1         1              v1            2
ID1         1              v1            NA
ID1         1              v8            NA
ID1         2              v5            2
ID1         2              v3            NA
ID1         3              v3            1
ID2         1              v7            1
ID2         2              v15           1
ID2         2              v15           NA
ID2         3              v3            1

怎么解决呢？预先感谢您！

然后，如果我只想计算每日的 v 数量（不区分）每个ID，如何更改代码？

预期结果：

ID        Date             v         daily_v_distinguish_ID    daily_v_ID
ID1         1              v1            2                       3
ID1         1              v1            NA                      3
ID1         1              v8            NA                      3
ID1         2              v5            2                       2
ID1         2              v3            NA                      2
ID1         3              v3            1                       1
ID2         1              v7            1                       1
ID2         2              v15           1                       2
ID2         2              v15           NA                      2
ID2         3              v3            1                       1

您可以尝试使用devel的版本data.table ie. v1.9.5。安装开发版本的说明是here https://github.com/Rdatatable/data.table/wiki/Installation

library(data.table)#v1.9.5+
setDT(df1)[,  daily_v_ID:= ifelse((1:.N)==1L, uniqueN(v), NA) , by = .(ID, Date)]

setDT(df1)[,  daily_v_ID := c(uniqueN(v), rep(NA, .N-1)), by = .(ID, Date)]

或者按照@David Arenburg 的建议

indx <- setDT(df1)[, .(.I[1L], uniqueN(v)), by = .(ID, Date)] 
df1[indx$V1, daily_v_ID := indx$V2]

或者使用dplyr

library(dplyr)
df1 %>% 
  group_by(ID,Date) %>%
  mutate(daily_v_ID= ifelse(row_number()==1, n_distinct(v), NA))

Or with base R

df1$daily_v_ID <- with(df1, ave(as.numeric(factor(v)), Date,ID,
      FUN= function(x) NA^(seq_along(x)!=1)*length(unique(x))))

Update

对于编辑后的帖子，我们通过获取变量来创建一个变量（'daily_v_ID'）length(v)或在data.table，我们可以用.N

setDT(df1)[, c('daily_v_distinguish_ID', 'daily_v_ID'):= list( c(uniqueN(v),
                  rep(NA, .N-1)), .N), by = .(ID, Date)]
df1
#       ID Date   v daily_v_distinguish_ID daily_v_ID
#  1: ID1    1  v1                      2          3
#  2: ID1    1  v1                     NA          3
#  3: ID1    1  v8                     NA          3
#  4: ID1    2  v5                      2          2
#  5: ID1    2  v3                     NA          2
#  6: ID1    3  v3                      1          1
#  7: ID2    1  v7                      1          1
#  8: ID2    2 v15                      1          2
#  9: ID2    2 v15                     NA          2
# 10: ID2    3  v3                      1          1

NOTE: uniqueN被介绍在v1.9.5。对于早期版本，我们可以使用unique(length(v))

或者使用dplyr

df1 %>% 
    group_by(ID, Date) %>%
    mutate(daily_v_distinguish_ID = ifelse(row_number()==1,
                                        n_distinct(v), NA), 
           daily_v_ID =n())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

count

R:统计每个ID每天区分的变量数量的相关文章

mtext：使用布局时较小的标签描述

使用 mtext 作为标签描述与使用 xlab 的作用不同如何使 mtext 标签始终与使用 xlab 时的大小相同无需始终定义 cex 参数在下面的最小示例中两个图的 cex cex lab 1 不过大小不同 layout mat
使用 R 数学独立库使用 C++ 编写矩阵/向量？

All 我一直在使用 C 中的 R 数学独立库我非常喜欢能够生成随机数并使用我熟悉的 R 分布函数我的问题是是否可以使用 R 中可用的矩阵运算乘法转置逆 Chol 等一个独立的库我在 Rmath h 中没有看到它们如果矩阵
在 R 中将 ascii 数字转换为字符串

要将 R 中的字符串转换为 ascii 代码我通常使用 gt strtoi charToRaw abcd 16L 1 97 98 99 100 是否有一个函数可以做相反的事情即 gt myDesiredFunc c 97 98 99 1
在r中水平旋转直方图

谁能帮我如何在 r 中将直方图旋转 90 度我知道箱线图中有一个选项 horiz T 但我不知道直方图是否有类似的选项我认为你必须使用 hist 和 barplot 来完成它如下所示直接来自文档你可以在这里检查它 layout x
如何将曲线拟合到直方图

我已经探讨了有关该主题的类似问题但在我的直方图上生成漂亮的曲线时遇到了一些麻烦我知道有些人可能会认为这是重复的但我目前还没有找到任何可以帮助解决我的问题的东西尽管数据在此处不可见但这里是我使用的一些变量以便您可以在下面的代码中看
R 语言 NaN + NA 行为

我有一个关于 R 中算术行为的问题看下面这段代码 gt NaN NA 1 NaN gt gt gt NaN as integer NA gt NA 所以我很困惑这两个添加给出了不同的结果有谁知道这是否是真正想要的行为还是只是某种错误
R 彩色树状图建议？

我想制作彩色树状图但尚未找到足够的库 http addictedtor free fr graphiques RGraphGallery php graph 79 http addictedtor free fr graphiques R
如何找到连续数字的区间开始和结束的位置？

我有一个向量 vec lt c 2 3 5 6 7 8 16 19 22 23 24 连续的数字是 c 2 3 c 5 6 7 8 c 22 23 24 所以第一个向量从 2 开始到 3 结束第二个向量从 5 开始到 8 结束对于第
R中的函数重新排序和排序值[重复]

这个问题在这里已经有答案了我正在尝试以下功能 stest lt data frame group c John Jane James mean c 3 5 1 transform stest group reorder group mea
如何有条件地选择一列，并从 R 中另一个有条件选择的列中的行中减去这些行中的值？

我知道我的问题标题很冗长可能很难理解所以我会尽力在这里解释一下这是一些示例数据 transactions lt tibble id seq 1 7 day paste rep day each 7 seq 1 7 sep sent t
我可以在 data.table 连接中访问“j”中重复的列名称吗？ [复制]

这个问题在这里已经有答案了如果我尝试连接两个具有相同列名的 data tables 那么 1附加到其中一个名称但我似乎无法访问该名称j的一部分DT 表达 Example DT1 data table name letters value
使用 dplyr 对 R 中所有因变量进行分组汇总统计

我正在尝试为 10 个因变量中的每一个生成分组听力我的自变量因此 HL 和 NH 是两个组汇总统计数据平均值标准差最小值最大值标准误差等我可以使用以下 2 个代码对一个变量 R PTA 执行此操作 1 RightPTA
如何在r中找到按业务分组的第二高薪水

我想要的是每个企业的输出应该只包含第二高的工资条目例如 customer id name sales firstname lastname income business 6 Priyank Dwivedi 2 Priyank Dwive
错误消息：fn(x, ...) 中的错误：已过时的 VtV 不是正定的

我正在尝试使用 lmer 函数创建一个最小足够模型我的模型已配对尺寸尝试状态随机因素 as logical Mated as numeric Size as factor Attempts as factor Status 这些都
merge.zoo 删除时区

的结果merge zoo与其输入的时区不同考虑下面的例子 library zoo zoo a zoo data frame a 1 5 seq as POSIXct 2014 01 01 00 00 01 tz UTC as POSIXc
如何从 R 中的嵌套 json 数据中提取数据

我需要能够从这个包含许多 json 条目的文件中提取这些字段 sender Hostname mem used p cpu user p load load 5 cat tmp txt senderDateTimeStamp 2016 04
ggplot2极坐标图轴标签位置

This is just a extension for a old question ggplot2 polar plot arrows https stackoverflow com questions 10515703 ggplot2
R 语言与 php 集成以获取 R 的结果

我有以下 R 脚本 assign data path data path lt C Users Owner Desktop R work assign valus to the following three percent train p
即使设置了语言环境，data.frames中的藏文字符也无法在R控制台中显示（中文可以，矩阵中的藏文可以）

在 R 中藏文字符位于 data frames 中时无法正确显示 gt Sys setlocale LC CTYPE Tibetan 1 Tibetan China 950 gt data frame a a 1
条件格式 DT 中的样式

我想根据 B 列中的值对 A 列中的行进行着色下面的代码基于小插图中的示例Link https rstudio github io DT 010 style html 但仅显示两列的条件 mobile number by mobile f

随机推荐

NuGet 如何将属性应用于文件

我正在创建 NuGet 包我已经放入了两个文件content用户安装此软件包时将添加的文件夹 exe 和配置文件另外我想更改这两个文件的 VS 项目属性构建包时我需要做什么当您说应用属性更改时您是指文件系统属性例如上次修改时
通过 Xcode 发布时：下载的软件组件已损坏且无法使用

在尝试通过 Xcode 发布 iOS 应用程序并通过大部分验证后我收到以下错误下载的软件组件已损坏且无法使用 https contentdelivery itunes apple com transporter repositories
如何使用 Fabric.js 在画布上画一条线

我正在使用 Fabric js 在画布上画一条线这是我的代码但我没有得到任何输出 Line click function alert Line canvas add new fabric Line 50 100 200 200 left
使用 php 创建像 Twitter 或 Convore 这样的提及

你好我只是好奇关于他们如何做事我认为他们会做这样的事情 someone1 im stacking on stackoverflow RT someone2 hello guys what are you doing 在我以我的方式做之
静态库 API 问题（std::string 与 char*）

我以前没有使用过静态库但现在我需要设想我正在 Unix 中编写一个控制台应用程序我自由使用std string无处不在因为这样做很容易然而我最近发现我必须在 Windows 中支持它并且第三方应用程序需要 API 来连接我的
使用 iText 检测动态 XFA

我需要将预先填充的 PDF XFA 表单设置为只读因为没有输入例如文本复选框单选按钮等可以更改其值对于常规 AcroForms PDF 和静态 XFA 表单我可以通过调用来完成此操作setFormFlattening true
为什么python的subprocess.call是这样实现的？

subprocess模块具有便捷的功能call 在2 6和3 1中都是这样实现的 def call popenargs kwargs return Popen popenargs kwargs wait 该函数的文档带有红色警告内容如下
多用户应用程序无需安装任何东西 - 允许并发用户写入的嵌入式数据库？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要创建一个应用程序被多个用户同时使用不需要any安装有一个集中的数据存储数据必须被存储inside公司网络 i 无权访问到公司内部数
更新 UpdatePanel 内的标签

我在更新面板中有一个标签和按钮当我尝试从按钮单击上的标签获取值时我从标签获取值但是当我尝试将值设置为标签时它不会发生我检查了 JavaScript 错误但没有任何错误有人猜测可能是什么原因吗我正在使用 dotnetnuke
程序“[4432] iisexpress.exe”已退出，代码为-2147023895 (0x800703e9)

我在使用 IIS Express 时遇到了非常令人沮丧的问题当我开始调试时一切正常但在几次请求后 IIS 挂起并崩溃我的浏览器 Chrome 版本 37 0 2062 120 m 等待响应几秒钟然后 IIS Express 停止运行
在 webview android 中启用复制和粘贴

是否可以从网络视图中选择文本然后进行复制和粘贴有什么特殊的方法可以做到这一点吗请帮助我希望对你有帮助 public void selectAndCopyText try Method m WebView class getMethod
如何在启用协程的改造界面中重试 API 调用

我有一个用例每当 API 调用中发生诸如互联网丢失或未知错误之类的一般错误时需要显示带有重试按钮的错误 UI 当用户按下重试之前失败的 API 时应该调用并恢复用户流程迁移协程方法前的API接口 interface TodoServ
如何更改单选按钮的文本

我有一个单选按钮需要根据用户输入动态更新但正常情况下 val text and html 行不通的如何使用 jQuery 或纯 JavaScript 更改单选按钮的文本无线电输入没有文字一切都是这样的
Go程序陷入死锁

这是我的 Golang 程序我正在使用它只是为了让我的概念正确当我运行程序时它陷入僵局我不明白为什么请有人指出出了什么问题吗 package main import fmt sync var wg sync WaitGroup f
无法调用 DLL 导入条目、C# -> C++、EntryPointNotFoundException

我正在尝试从 C 调用用 C 编写的自定义 DLL 中的函数但是我在代码分析期间收到警告并在运行时收到错误警告 CA1400 Microsoft 互操作性正确的声明 SafeNativeMethods SetHook 这样它正
java.lang.NoClassDefFoundError Main（错误名称：com/leslie/quiz/Main）

我有三节课主要核心和开始这是主要的代码 package com leslie quiz public class Main public static void main String args com leslie quiz Sta
Python 中的动态/运行时方法创建（代码生成）

我需要在运行时为方法生成代码能够运行任意代码并拥有文档字符串非常重要我想出了一个结合的解决方案exec and setattr 这是一个虚拟示例 class Viking object def init self code def dy
如何根据与第三列的匹配将数据帧的一列中的值替换为另一列的值？

当尝试根据第三列之间的匹配将具有四个变量的数据帧的值转换为具有两个变量的另一个数据帧中特定列的值时遇到问题在数据帧 df1 中我有一个meta 它对应于与meta 在同一行中表示的iso 当数据帧中的meta 匹配时我希望相应的iso
如何在合成图像中加载可绘制的形状

我想在合成中为图像设置一个可绘制的形状可绘制的看起来像这样curved rect xml
R:统计每个ID每天区分的变量数量

这是我的数据 ID Date v ID1 1 v1 ID1 1 v1 ID1 1 v8 ID1 2 v5 ID1 2 v3 ID1 3 v3 ID2 1 v7 ID2 2 v15 ID2 2 v15 ID2 3 v3 我想计算v的个数区分

R:统计每个ID每天区分的变量数量

Update

R:统计每个ID每天区分的变量数量 的相关文章

随机推荐

热门标签

R:统计每个ID每天区分的变量数量的相关文章