Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Sparklyr:如何将列表列分解为 Spark 表中自己的列?
我的问题与中的问题类似here 但我在实现答案时遇到问题 并且我无法在该线程中发表评论 因此 我有一个包含嵌套数据的大 CSV 文件 其中包含由空格分隔的 2 列 假设第一列是 Y 第二列是 X X 列本身也是一个逗号分隔值 21 66 2
r
apachespark
dplyr
tidyr
sparklyr
动态选择group_by的多列
当存在多个分组变量时 group by 的数据屏蔽不起作用 粘贴下面的代码 grpByCols lt model mpg gt group by data grpByCols grpByCols lt c model manufacture
r
dplyr
tidyeval
group_by(across(all_of(vars, YEARS))) - 按具有固定 YEAR 变量的变量进行分组
我有一些数据想总结一下 我想对所有列进行总结 并固定 年份 列 即对于一个变量我可以这样做 df gt group by LG1 YEAR gt summarise Freq n 不过我想对每个变量都进行此操作 下面的内容不能按我想要的方式
r
dplyr
将 dplyr SE 与 ggplot2 结合使用
我经常结合dplyr with ggplot2在包装函数中进行分析 当我转向 v 0 7 1 的新 NSE SE 范例时tidyeval 我正在努力让这个组合发挥作用 我找到ggplot 还 不理解未引用的引用者 以下不起作用 exampl
r
ggplot2
dplyr
使用 dplyr 将唯一 ID 分配给组内的不同值
问题 我需要为具有两级分组的数据创建一个唯一的 ID 字段 在这里的示例代码中 它是Emp and Color ID 的结构需要如下 Emp 每个的唯一编号Color 重复的序列号Colors 这些值由句点分隔 示例数据 dat lt da
r
dplyr
根据条件和分组更新列
我的数据是 Prod Vend Capac Dema Price p1 v2 2 6 1 p1 v1 3 6 2 p1 v3 3 6 2 p2 v1 1 1 1 p2 v3 2 1 2 p2 v2 5 1 2 p3 v1 5 3 3 p3
r
dplyr
dplyr r:选择名称位于外部向量中的列[重复]
这个问题在这里已经有答案了 Purpose 我可以使用选择列dplyr条件是列名位于外部向量中 我发现一些帖子解释了如何使用名称向量对数据框进行子集化 但当向量中的某些名称在数据框中不存在时 我找不到帖子 示例数据集 library tid
r
select
dplyr
conditionalstatements
如何使用 dplyr 在行组之间进行划分
我有类似的数据 我想要与此链接所述的确切结果 如何使用 dplyr 在行组之间进行划分 然而 与我的数据的唯一区别是 有时 条件 列并不总是有 A 或 B 因此有时没有分母或分子 x lt data frame name rep lette
r
dplyr
Dplyr Mutate_each 用于成对的列集
有没有办法使用 dplyr mutate each 实现以下转换 data frame x1 1 5 x2 6 10 y1 rnorm 5 y2 rnorm 5 gt mutate diff1 x1 y1 diff2 x2 y2 x1 x2
r
dplyr
将列名传递给函数
我怎样才能把这个ggplot 调用一个函数 我不知道如何让 R 识别我想要传递给函数的列名称 我遇到过几个听起来类似的问题 但我没有成功地调整想法 看here for substitute setup library dplyr libra
r
ggplot2
dplyr
根据其他列的值创建包含其他列名称的新列
我试图根据其他变量的值创建一个新的字符变量 在我的示例 V4 中 我需要使用列名来填充这个新变量 我有这个 V1 V2 V3 1 1 0 1 2 0 1 1 3 0 0 0 4 1 1 1 我希望新变量包含所有值等于 1 的列名 像这样 V
r
DataFrame
dplyr
当最后一个和下一个非 NA 值相等时替换 NA
我有一个示例表some但不是所有的NA需要替换的值 gt dat id message index 1 1
r
dplyr
dataTable
使用“rle”函数和“dplyr”“group_by”命令来映射分组变量
我有一个包含三列的数据框 其信息类似于下面给出的数据框 现在我希望根据列中的信息提取信息搜索模式a 基于少数开发人员 thelatemail 和 David T 的支持 我能够识别该模式rle函数 请看这里 使用 rle 函数识别模式 现在
r
dplyr
tidyr::收集不同类型的多个列
我的问题类似于这个问题 我试图tidyr gather多列 但是 链接中提供的解决方案不太理想 因为所有列的属性通常不相同 因此它们被删除 请注意 我知道如何使用基本 R 执行此操作 但我正在尝试学习如何使用 tidyr 和 或 dplyr
r
dplyr
tidyr
tidyverse
将一个数据帧拆分为多个数据帧
我有一个数据框 需要根据正则表达式搜索将其拆分为多个数据框 搜索没有固定的模式 即有时只有一个正则表达式 有时是多个正则表达式的组合 这是一个仅提取一组行的最小示例 Name lt c John Jane Arthur Maggie Age
r
dplyr
dplyr 创建因子水平的合计百分比
如何使用 dplyr 为每个州创建因子变量水平的比例 例如 我想添加一个变量来指示数据框中每个州内女性的百分比 gen data state lt rep c rep Idaho 10 rep Maine 10 2 student id l
r
dplyr
当逻辑条件意味着不应评估输出时,为什么 dplyr 会在此嵌套 if_else 中出错?
我有一个嵌套的if else里面的声明mutate 在我的示例数据框中 tmp df2 lt data frame a c 1 1 2 b c T F T c c 1 2 3 a b c 1 1 TRUE 1 2 1 FALSE 2 3 2
r
dplyr
使用 dplyr mutate 根据列名向量创建新列
我想获取一些列的日志 并创建全部命名为 log 原始列名称 的新列 下面的代码有效 但是我如何传递名为columnstolog变异 谢谢 library dplyr data mtcars columnstolog lt c mpg cyl
r
dplyr
如何使用 dplyr 过滤数据而不丢失 NA 行
如何在 R 中对数据进行子集化而不丢失 NA 行 上面的帖子使用逻辑索引的子集 有没有办法在 dplyr 中做到这一点 Also dplyr什么时候自动删除NA 根据我的经验 当我过滤掉特定字符串时 它会删除 NA 例如 b a gt fi
r
filter
dplyr
dplyr 可以连接多个列或复合键吗?
我意识到dplyrv3 0 允许您连接不同的变量 left join x y by c a b 将匹配x a to y b 但是 是否可以加入变量组合 或者我是否必须事先添加复合键 像这样的事情 left join x y by c a c
r
dplyr
«
1 ...
38
39
40
41
42
43
44
...48
»