dplyr

计算 dplyr 中列子集的按行计数

我想使用 dplyr 跨列子集按行计算某些文本或因子级别的实例数这是输入 gt input df num col 1 num col 2 text col 1 text col 2 1 1 4 yes yes 2 2 5 no yes

r dplyr

R：具有重复数据框的扩展函数

我有一个需要旋转的数据框但该数据框有重复的标识符所以spread函数给出错误Error Duplicate identifiers for rows 5 6 Dimension c A A B B A A Date c Mon Tue

r Aggregate dplyr tidyr spread

如何在 mutate 语句中对两列进行排序和粘贴？

我希望对两列进行排序并将其粘贴到新列中 test data frame a jump b jam test gt mutate new paste sort a b 预期输出是包含三列的数据框 a jump b jam c jamjump

r dplyr

dplyr：根据一个变量中的值逐行替换值

我想从分析中排除年龄太大年龄 gt 90 岁的参与者通常我会这样做 df lt data frame age c 1 10 100 x 1 3 y 1 3 df df age gt 90 lt NA 我不知道如何使用 dplyr 来做

r dplyr conditionalstatements

dplyr：标准评估和 enquo()

我听说 dplyr 中不推荐标准评估我们可以做类似的事情enquo and quo 我的原始代码简化是 my function lt function data x OriginalX y OriginalY data gt muta

r dplyr tidyeval

用于可视化或过滤 P 值的整洁 chisq.test 输出的函数

对于数据 library productplots library ggmosaic 对于代码 library tidyverse library broom 我正在尝试创建整洁的 chisq test 输出以便我可以轻松过滤或可视化 p

r dplyr purrr tidyverse broom

dplyr 自定义滞后函数用于不规则时间序列

我有一个不规则的时间序列数据集中存在间隙此外数据被分组滞后函数我已经能够通过观察找到滞后因此它们在数据集中找到先前的记录但我想指定一个时间变量并通过匹配滞后时间来计算滞后这个问题 R滞后超前不规则时间序列数据正在做类似的事情

r TimeSeries dplyr

R：如何从管道中的 Spark 连接（sparklyr）中的数据列中提取元素

我有一个数据集如下由于数据量较大我通过sparklyr包所以我只能使用管道语句 pos lt str sub csj helpful 2 neg1 lt str sub csj helpful 4 csj lt csj gt muta

r sparklyr dplyr

使用 dplyr 填充缺失值（通过连接？）

我有一个数据框 df1 其中缺少一些值城市州 SiteID City StateBasedIn Lat Lon Var1 Var2 4227 Richmond KY 39 113 6 0 4987 Nashville TN 33 97

r dplyr tidyverse

使用此列中的数据时排除“dplyr”“mutate_at”中的列

我想重新调整所有变量但是year and gender in a df由一个具体的year 分组依据gender set seed 1 df lt data frame gender c rep m 5 rep f 5 year rep

r dplyr

在某些观察结果之前选择组，通过将 R 中的 var 分组与 NA 控制分开

我的样品 data structure list add structure c 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 2

r dplyr dataTable

在过去 365 天窗口中执行运行总计的有效方法

这就是我的数据框的样子库数据表 df lt fread Name EventType Date SalesAmount RunningTotal Runningtotal prior365Days John Email 1 1 201

r vectorization dplyr zoo rollapply

从虚拟变量中最简单地创建因子变量

此处问题的选定答案使用 dplyr 创建因子变量没有给哈德利留下深刻的印象后续的答案并不能很好地概括我遇到的一些问题我想知道社区是否可以通过一个更简单的示例做得更好 DATA A round runif 200 0 1 0 B c

r dplyr

对列中的多个值使用 ifelse 语句

我有一个大约有 3000 行的表其数据格式为 Number Type 10001 0 10005 7 10006 0 10007 14 10012 16 10022 14 10023 0 10024 0 10029 7 10035 17

r ifstatement dplyr

为 R 中所有列的多行创建摘要（第 90 个百分位）统计数据的新数据框

我正在开展一个学校项目有一个包含 4 000 行的数据集有 40 名参与者每人大约有 100 行我想创建一个数据集将每个参与者的行折叠成汇总统计数据最好是第 90 个百分位我知道如何用 dplyr 找到平均值 Means lt

r dplyr percentile

R dplyr 根据多个选定列的条件过滤行

我有一个数据框DF 我想根据几个选定列的条件对其进行过滤例如我想过滤 DF 中满足该行包含任何值的条件的行小于0 03在列中PCS AB PCS AD PCS BD DF lt cbind data frame A c 100 10 1

r filter dplyr

使用 mutate_at 用列名更新单元格值

我正在处理调查数据有些问题要求参与者检查所有适用于他们的选项在我当前拥有的数据框中每个可能的响应都有一列如果参与者选择了该选项则记录值为 1 例如对于问题您在工作中经历过以下哪种情绪使用选项无聊压力满足我的数据框将如

r dplyr

将中间输出分配给临时变量作为 dplyr 管道的一部分

问在 R dplyr 管道中如何将一些中间输出分配给临时变量以便在管道中进一步使用我下面的方法有效但它分配到全局框架中这是不可取的一定有更好的方法对吧我认为涉及注释行的方法会得到预期的结果没有骰子很困惑为什么这不起作用

r dplyr pipeline

使用 df2 的日期时间中 df1 的“小时”和“分钟”的条件合并 2 个数据帧

我有一个数据框df sample像这样 id lt c A A A A A A A A A A A date lt c 2018 11 12 2018 11 12 2018 11 12 2018 11 12 2018 11 12 2018

r DataFrame dplyr dataTable nonequijoin

R中按组删除异常值

在我的数据集中我必须分别删除每个组的异常值这是我的数据集 vpg structure list customer c 1L 1L 1L 1L 2L 2L 2L 2L 1L 1L 1L 1L 2L 2L 2L 2L code c 2L 2

r DataFrame dplyr