在 case_when 中创建 tidyeval 函数

2024-04-28

我有一个数据集，我喜欢根据这些值的概率分布来估算其中一个值。让我们先做一些可重现的例子

library(tidyverse)
library(janitor)

dummy1 <- runif(5000, 0, 1)
dummy11 <- case_when(
    dummy1 < 0.776 ~ 1,
    dummy1 < 0.776 + 0.124 ~ 2,
    TRUE ~ 5)

df1 <- tibble(q1 = dummy11)

这是输出：

df1 %>% tabyl(q1)
 q1    n percent
  1 3888  0.7776
  2  605  0.1210
  5  507  0.1014

I used mutate and sample在值 1 和 2 之间共享 value= 5，如下所示：

df1 %>%
    mutate(q1 = case_when(q1 == 5 ~ sample(
        2,
        length(q1),
        prob = c(0.7776, 0.1210),
        replace = TRUE
    ),
    TRUE ~ as.integer(q1))
    )

这是结果：

q1    n percent
  1 4322  0.8644
  2  678  0.1356

这种方法似乎有效，但是由于我需要将其应用于多个变量，我尝试编写一个与 tidyverse 一起使用的函数tidyeval，像这样

    my_impute <- function(.data, .prob_var, ...) {
        .prob_var <- enquo(.prob_var)

        .data %>%
            sample(2, prob=c(!!.prob_var), replace = TRUE) 
    }

# running on data 
df1 %>%
    mutate(q1 = case_when(q1 == 5 ~ !!my_impute(q1),
    TRUE ~ as.integer(q1))
    )

错误是：

Error in eval_tidy(pair$lhs, env = default_env) : object 'q1' not found

我们需要prob来自生成的“百分比”列的值tabyl，因此函数可以修改为

library(janitor)
library(dplyr)

my_impute <- function(.data, .prob_var, vals, ...) {
        .prob_var = enquo(.prob_var)
        .prob_vals <- .data %>%
             janitor::tabyl(!!.prob_var) %>%
             filter(!!.prob_var %in% vals) %>%
             pull(percent)

         .data %>%
              mutate(!! .prob_var := case_when(!! .prob_var == 5 ~ 
                sample(
                        2,
                        n(),
                        prob = .prob_vals,
                        replace = TRUE
                    ),
                    TRUE ~ as.integer(q1))
                    )
    }


df1 %>% 
     my_impute(q1, vals = 1:2) %>%
     tabyl(q1)
# q1    n percent
# 1 4285   0.857
# 2  715   0.143

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

tidyverse

CaseWhen

tidyeval

在 case_when 中创建 tidyeval 函数的相关文章

如何将环境变量传递给shinyapps

我想将安全参数传递给shinyapps io部署以便我的应用程序可以通过以下方式获取它们 Sys getenv PASSWORD X 我找不到任何相关内容deployApp函数在rsconnect包裹您可以使用Renviron网站 or
粘贴两个 data.table 列

dt lt data table L 1 5 A letters 7 11 B letters 12 16 L A B 1 1 g l 2 2 h m 3 3 i n 4 4 j o 5 5 k p 现在我想粘贴列 A 和 B 以获得一个新
plot xts if (on == "years") { 中的错误：缺少 TRUE/FALSE 需要的值

我正在尝试绘制 xts 对象但出现有关年份的错误 xts 对象只有一个数值和一个 POSIXct 索引下面的代码显示了 xts 和尝试绘图时的错误关于需要对 xts 对象做什么才能正确绘制的任何想法 xTest lt as xts 3
访问动态创建的 Shiny 模块的返回值

我正在寻找构建一个闪亮的应用程序它动态创建返回简单表单的模块通过 callmodule 我有两个未解决的问题希望得到一些指导首先当向用户提供多个表单通过单击按钮时先前呈现的表单上的值将恢复为默认值如何停止这种行为以便值保
如何缩放（标准化）每列内的 ggplot2 stat_bin2d 值（按 X 轴）

我有一个 ggplot stat bin2d 热图 library ggplot2 value lt rep 1 5 1000 df lt as data frame value df group lt rep 1 7 len 5000 d
计算数据帧 R 中字符串的频率

我想计算数据框中某些字符串的频率 strings lt c pi pie piece pin pinned post df lt as data frame strings 然后我想计算字符串的频率 counts lt c pi in pi
如何在r中进行左连接[重复]

这个问题在这里已经有答案了我有两个数据集一和二数据集一 a b c 111 a 1 112 b 2 113 c 3 114 d 4 115 e 5 数据集二 e d g 222 ss 11 111 ff 22 113 ww 33 114
删除绘图轴值

我只是想知道是否有一种方法可以消除 r 图中的轴值分别是 x 轴或 y 轴我知道axes false将摆脱整个轴但我只想摆脱编号删除 x 轴或 y 轴上的编号 plot 1 10 xaxt n plot 1 10 yaxt n 如果
SQL Server RODBC 连接

有没有人有使用 RODBC 并连接到 MS SQL Server 2005 或 2008 的连接字符串示例谢谢 library RODBC dbhandle lt odbcDriverConnect driver SQL Server s
R Shiny UI 子选项复选框？

我有一个基本的 RShiny 应用程序它有一个反应式复选框它根据复选框中选择的数据 df 列绘制时间序列数据我当前的代码生成一个带有复选框输入的 UI 如下所示 Load R packages library shiny libra
RPostgreSQL 无法关闭连接

我有一个闪亮的应用程序使用它连接到数据库RPostgreSQL 在应用程序结束时连接关闭驱动程序应该被卸载但我收到错误警告我连接未关闭代码看起来像这样 in the app R file but not in the serve
不理解..密度的行为

在下面的数据框中我预计密度的 y 轴值为 0 6 和 0 4 但它们是 1 0 我觉得我使用的方式显然缺少一些非常基本的东西密度但是我的大脑冻结了我将如何使用密度获得所需的行为任何帮助将不胜感激 df lt data fram
递归累积函数

我需要在 R 中编写一个累积求和函数但我一直碰壁该函数具有以下结构 a x1 a x2 a 2 x1 a x3 a 2 x2 a 3 x1 a x4 a 2 x3 a 3 x2 a 4 x1 等等 cumsum 似乎不适用于此类功能有
指定生存图的自定义时间点

我正在努力使用以下方法创建生存累积事件图ggsurvplot函数从survminer包裹我想为我的绘图指定自定义时间点但我不知道该怎么做这xlim and break x by参数有点帮助但它们创建了均匀间隔的时间点和比我想要的更
R 和 Python 中 LU 分解结果不一致

我有以下矩阵A in R 1 2 3 4 1 1 1527778 0 4444444 0 375 0 3333333 2 0 5555556 1 4888889 0 600 0 3333333 3 0 6250000 0 4000000 1
R 抑制系统或 shell 命令的控制台输出

我有这个 Windows 批处理文件我使用 R 从 R 调用该文件shell 命令该批处理文件执行一些计算并将它们写入磁盘上也写入屏幕上我只对磁盘输出感兴趣我无法更改批处理文件批处理文件可能有点愚蠢例如 echo off ec
通过删除连续的重复项来减少字符串长度

我有一个包含 2 个字段的 R 数据框 ID WORD 1 AAAAABBBBB 2 ABCAAABBBDDD 3 我想通过仅保留字母而不是重复中的重复项来简化具有重复字母的单词 e g AAAAABBBBB应该给我AB and ABCAA
在闪亮的应用程序中使用传单地图作为过滤器

是否可以使用传单地图来过滤闪亮应用程序中的数据就像在 Tableau 或 Power BI 中一样方法是单击地图上的某个状态然后根据条件过滤另一个图表或表格选择 None
替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
如何在 R 树形图中省略标签？

我一直在使用R 树形图包 http cran r project org web packages treemap treemap pdf我有一个 2 层深的树形图我希望打印第二级标签但不打印第一级标签使用手册页中的示例 tmPlot

随机推荐

键入提示以返回类的实例，其中 typevar 是类类型[重复]

这个问题在这里已经有答案了如何编写返回类型提示来指示函数返回类 Class 的实例 Class TypeVar Class bound type def make class class Class gt Class return cla
为什么 Apollo Server 不是 Express 的中间件，而是接受 Express 作为中间件的服务器？

我只是想知道这种看似尴尬的配置的原因是什么来自Apollo 服务器入门 https www apollographql com docs apollo server getting started html const server ne
pandas 数据框中的 count 和 countif

我有一个 DF 如下所示 trainee course completed days overdue Ava ABC Yes 0 Bob ABC Yes 1 Charlie DEF No 10 David DEF Yes 0 Emily D
django：自动为现有用户创建用户配置文件

我今天在我的项目中添加了一个新的 UserProfile 模型 class UserProfile models Model user models OneToOneField User def unicode self return u
在dynamodb中使用batchWriteItem

我的 dynamo 数据库中有两个表一个是候选表另一个是用户表我想在 dynamo 数据库中使用 batchWriteItem 以便在表中添加数据我格式化的查询如下 var user userid usrid role candida
使用 v-bind Vue.js 的多个变量

我试图在以下代码中传递多个变量 div div 但我收到以下错误 Vue warn 无法生成渲染函数 SyntaxError 意外的标记在我尝试更换 with a 但我得到 Vue warn 无法生成渲染函数 SyntaxError I
减小散点图的文件大小

我目前正在尝试减小散点图的文件大小我的代码如下所示 plt scatter a1 b1 plt savefig test ps 其中 a1 b1 是大小为 400 000 左右的数组它给出的文件大小为 7 8MB 我尝试过添加 plt
有没有办法获取正在运行或新打开的资源管理器窗口的 IExplorerBrowser 接口以供后续 BrowseToXXX 调用？

这么问是因为在上一个问题 https stackoverflow com questions 6220899 answer 6221898我是指向 IExplorerBrowser 的指针但是它创建了一个子窗口而我想模拟资源管理器的查
如何在带有空格的目录上使用 find ？

这里有一些奇怪的事情 mkdir p 1 2 3 4 touch 1 2 3 4 file jpg for f in find type f name jpg do echo f done 这返回 1 2 3 4 file jpg and
IE：无法从 * 下载 *。无法打开此 Internet 站点。请求的站点不可用或找不到

我的网站和 IE 出现问题我有一个文件文件 ashx根据查询字符串中传递的参数它会成为我的数据库中的文档该文件在以下情况下有效您访问我的网站并单击下载链接您可以访问我网站上的任何内容然后将 URL 粘贴到地址栏中并访问它您之前
如何在 ASP.NET Core 控制器中接收“multipart/mixed”

旧系统会向我发送以下内容 POST xml HTTP 1 1 Host localhost 9000 User Agent curl 7 64 1 Accept Content Length 321 Content Type multipa
如何在类库中添加配置文件，后跟 .NET Core 1.1 的连接字符串

我正在开发 n 层应用程序其中有数据访问层它独立于任何其他应用程序我已经为 NET Core 1 1 创建了类库我可以看到依赖项文件夹但看不到任何配置 JSON 文件我想知道我可以在类库项目中添加 AppSetting JSO
将数据帧转换为多列的系列

我尝试将数据帧转换为系列但它显示以下错误我使用 pandas Series Dataframe gt 将 Dataframe 转换为系列我想要第一张图像格式的输出请尝试以下方法从提到的数据中获取 Series 对象假设data是您正
加载所有腌制对象[重复]

这个问题在这里已经有答案了 import pickle ListNames Name1 City1 Email1 Name2 City2 Number2 ListNumbers 1 2 3 4 5 6 7 8 with open TestP
IServiceLocator 接口是什么？

据我了解 IServiceLocator 是一个抽象实际 IoC 容器的接口我问的是与 Prism 相关的问题我想在哪里用 Prism 替换 Unity https stackoverflow com questions 2621248
是否可以在 Visual Studio 2010 项目中使用多个“字符集”？

如您所知在 Visual Studio 2010 c 中我们有 noset unicode 和 MBCS 字符集我们可以通过菜单或预处理器指令如 define UNICODE 来设置它我正在开发一个项目它有一个使用 MBCS 字
强制节点在 Windows 上使用 git bash

我有一个 package json 文件如下所示 name APP version 3 0 0 private true scripts start node app js test test dbLoad env db test tes
如何在 c# ASP.Net 中创建具有有效 JSON 输出的 JSON WebService 并使用 JQuery/Ajax 进行查询

我创建了一个时间 2019 03 17 标签 c ASP NetJSONWebService 但是我在从这个 WebService 读取数据时遇到了很大的麻烦因为在我看来输出不是有效的 JSON 格式通常你应该得到一个对象对象作为
如何加载4通道的png图像？

我一直在尝试加载带有透明通道 RGB 和 Alph 的 png 文件但没有成功看来 openCV 从图像中剥离了第四个通道即使我必须修改 OpenCV 源代码并重建它是否有任何方法可以加载包含 alpha 通道在内的完整 4 个通道
在 case_when 中创建 tidyeval 函数

我有一个数据集我喜欢根据这些值的概率分布来估算其中一个值让我们先做一些可重现的例子 library tidyverse library janitor dummy1 lt runif 5000 0 1 dummy11 lt case w

在 case_when 中创建 tidyeval 函数

在 case_when 中创建 tidyeval 函数 的相关文章

随机推荐

热门标签

在 case_when 中创建 tidyeval 函数的相关文章