Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
计算 dplyr 中列子集的按行计数
我想使用 dplyr 跨列子集按行计算某些文本 或因子级别 的实例数 这是输入 gt input df num col 1 num col 2 text col 1 text col 2 1 1 4 yes yes 2 2 5 no yes
r
dplyr
R:具有重复数据框的扩展函数
我有一个需要旋转的数据框 但该数据框有重复的标识符 所以spread函数给出错误Error Duplicate identifiers for rows 5 6 Dimension c A A B B A A Date c Mon Tue
r
Aggregate
dplyr
tidyr
spread
如何在 mutate 语句中对两列进行排序和粘贴?
我希望对两列进行排序并将其粘贴到新列中 test data frame a jump b jam test gt mutate new paste sort a b 预期输出是包含三列的数据框 a jump b jam c jamjump
r
dplyr
dplyr:根据一个变量中的值逐行替换值
我想从分析中排除年龄太大 年龄 gt 90 岁 的参与者 通常我会这样做 df lt data frame age c 1 10 100 x 1 3 y 1 3 df df age gt 90 lt NA 我不知道如何使用 dplyr 来做
r
dplyr
conditionalstatements
dplyr:标准评估和 enquo()
我听说 dplyr 中不推荐标准评估 我们可以做类似的事情enquo and quo 我的原始代码 简化 是 my function lt function data x OriginalX y OriginalY data gt muta
r
dplyr
tidyeval
用于可视化或过滤 P 值的整洁 chisq.test 输出的函数
对于数据 library productplots library ggmosaic 对于代码 library tidyverse library broom 我正在尝试创建整洁的 chisq test 输出 以便我可以轻松过滤或可视化 p
r
dplyr
purrr
tidyverse
broom
dplyr 自定义滞后函数用于不规则时间序列
我有一个不规则的时间序列 数据集中存在间隙 此外 数据被分组 滞后函数我已经能够通过观察找到滞后 因此它们在数据集中找到先前的记录 但我想指定一个时间变量并通过匹配滞后时间来计算滞后 这个问题 R滞后 超前不规则时间序列数据正在做类似的事情
r
TimeSeries
dplyr
R:如何从管道中的 Spark 连接(sparklyr)中的数据列中提取元素
我有一个数据集如下 由于数据量较大 我通过sparklyr包 所以我只能使用管道语句 pos lt str sub csj helpful 2 neg1 lt str sub csj helpful 4 csj lt csj gt muta
r
sparklyr
dplyr
使用 dplyr 填充缺失值(通过连接?)
我有一个数据框 df1 其中缺少一些值 城市 州 SiteID City StateBasedIn Lat Lon Var1 Var2 4227 Richmond KY 39 113 6 0 4987 Nashville TN 33 97
r
dplyr
tidyverse
使用此列中的数据时排除“dplyr”“mutate_at”中的列
我想重新调整所有变量 但是year and gender in a df由一个具体的year 分组依据gender set seed 1 df lt data frame gender c rep m 5 rep f 5 year rep
r
dplyr
在某些观察结果之前选择组,通过将 R 中的 var 分组与 NA 控制分开
我的样品 data structure list add structure c 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 1L 2
r
dplyr
dataTable
在过去 365 天窗口中执行运行总计的有效方法
这就是我的数据框的样子 库 数据 表 df lt fread Name EventType Date SalesAmount RunningTotal Runningtotal prior365Days John Email 1 1 201
r
vectorization
dplyr
zoo
rollapply
从虚拟变量中最简单地创建因子变量
此处问题的选定答案 使用 dplyr 创建因子变量 没有给哈德利留下深刻的印象 后续的答案并不能很好地概括我遇到的一些问题 我想知道社区是否可以通过一个更简单的示例做得更好 DATA A round runif 200 0 1 0 B c
r
dplyr
对列中的多个值使用 ifelse 语句
我有一个大约有 3000 行的表 其数据格式为 Number Type 10001 0 10005 7 10006 0 10007 14 10012 16 10022 14 10023 0 10024 0 10029 7 10035 17
r
ifstatement
dplyr
为 R 中所有列的多行创建摘要(第 90 个百分位)统计数据的新数据框
我正在开展一个学校项目 有一个包含 4 000 行的数据集 有 40 名参与者 每人大约有 100 行 我想创建一个数据集 将每个参与者的行折叠成汇总统计数据 最好是第 90 个百分位 我知道如何用 dplyr 找到平均值 Means lt
r
dplyr
percentile
R dplyr 根据多个选定列的条件过滤行
我有一个数据框DF 我想根据几个选定列的条件对其进行过滤 例如 我想过滤 DF 中满足该行包含任何值的条件的行小于0 03在列中PCS AB PCS AD PCS BD DF lt cbind data frame A c 100 10 1
r
filter
dplyr
使用 mutate_at 用列名更新单元格值
我正在处理调查数据 有些问题要求参与者检查所有适用于他们的选项 在我当前拥有的数据框中 每个可能的响应都有一列 如果参与者选择了该选项 则记录值为 1 例如 对于问题 您在工作中经历过以下哪种情绪 使用选项 无聊 压力 满足 我的数据框将如
r
dplyr
将中间输出分配给临时变量作为 dplyr 管道的一部分
问 在 R dplyr 管道中 如何将一些中间输出分配给临时变量以便在管道中进一步使用 我下面的方法有效 但它分配到全局框架中 这是不可取的 一定有更好的方法 对吧 我认为涉及注释行的方法会得到预期的结果 没有骰子 很困惑为什么这不起作用
r
dplyr
pipeline
使用 df2 的日期时间中 df1 的“小时”和“分钟”的条件合并 2 个数据帧
我有一个数据框df sample像这样 id lt c A A A A A A A A A A A date lt c 2018 11 12 2018 11 12 2018 11 12 2018 11 12 2018 11 12 2018
r
DataFrame
dplyr
dataTable
nonequijoin
R中按组删除异常值
在我的数据集中 我必须分别删除每个组的异常值 这是我的数据集 vpg structure list customer c 1L 1L 1L 1L 2L 2L 2L 2L 1L 1L 1L 1L 2L 2L 2L 2L code c 2L 2
r
DataFrame
dplyr
«
1 ...
37
38
39
40
41
42
43
...48
»