如何按因子生成随机治疗变量?

2024-03-11

Define

x <- data.frame(
     ID=letters[1:10],
     class = as.factor(c(rep(1,5),rep(2,5))),
     treat = rep(0,10))

s.t.

> x
   ID class treat
1   a     1     0
2   b     1     0
3   c     1     0
4   d     1     0
5   e     1     0
6   f     2     0
7   g     2     0
8   h     2     0
9   i     2     0
10  j     2     0

我有两个级别的治疗,1 和 2。我想为每个级别分配一个单元。随机化后,我们得到类似的结果:

> x
   ID class treat
1   a     1     0
2   b     1     0
3   c     1     1
4   d     1     0
5   e     1     2
6   f     2     0
7   g     2     0
8   h     2     0
9   i     2     2
10  j     2     1 

英石。单位c and j获得 1 级治疗并且e and i2级。

如何在 R 中生成治疗向量?


我假设你只是想分配one1 级治疗和one每班2级待遇。您可以使用ddply函数从plyr包即可轻松完成:

  set.seed(1)
  require(plyr)
> ddply(x, .(class), transform, 
        treat = replace(treat, sample(seq_along(treat),2), 1:2))

   ID class treat
1   a     1     0
2   b     1     1
3   c     1     0
4   d     1     0
5   e     1     2
6   f     2     0
7   g     2     0
8   h     2     1
9   i     2     2
10  j     2     0

解释一下:ddply函数将数据帧分割为class变量,并且在每个数据帧内,它“transforms" the treat列,将 2 个随机选择的条目替换为 1 和 2。sample(...,2)函数在中选择两个随机索引treat柱子。其他变体(例如,为每种治疗类型分配 1 个以上)可以类似地完成。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何按因子生成随机治疗变量? 的相关文章

  • 从 R 到 C 处理列表并访问它

    我想使用从 R 获得的 C 列表 我意识到这个问题与此非常相似 使用 call 在 R 和 C 之间传递数据帧 https stackoverflow com questions 6658168 passing a data frame f
  • 将 read.csv 与符号链接文件一起使用

    我正在尝试做什么 我的源文件非常大 我想避免将其复制到其他文件夹中 我决定创建一个指向大文件的符号链接并想使用read csv读取文件 文件夹结构 项目1 数据 源文件 csv 项目2 数据 别名到源文件 csv 什么地方出了错 读取源文件
  • 在 R 中将时间间隔数据扩展为天数

    假设我有如下所示的数据 interval id indiv id role start date end date 1 1 A 2006 05 01 2006 06 16 2 1 B 2006 06 16 2006 10 16 3 1 A
  • R:编写抛硬币的随机采样程序

    假设我们有以下情况 有一枚硬币 如果它正面朝上 那么下一次抛掷正面的概率是 0 6 如果是反面 那么下一次抛掷反面的概率也是 0 6 一个班有100名学生 每个学生随机抛掷硬币几次 Student n 的最后一次抛硬币不会影响 Studen
  • 使用滑动窗口动画 ggplot 时间序列图

    我正在寻找在不失去分辨率的情况下对长时间序列图进行动画处理的方法 我希望视图能够 平移 数据 显示从开始到结束的滑动子集 假设我有以下内容 library ggplot2 library dplyr library gganimate df
  • 如何在 R 中只为直方图的一个标签着色?

    我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
  • rpart是自动剪枝吗?

    Is rpart自动修剪 生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多 否 但拟合函数的默认值可能会 提前 停止分割 对于 早期 的某些定义 See rpart control对于您可
  • 如何使用 sprintf 函数在字符中添加前导“0”而不是空格?

    我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同 然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
  • 使用 readHTMLTable 从 https 网页读取表格

    我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
  • 聚合日期时间以总结在特定条件下花费的时间

    我很困惑我应该如何继续 我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
  • 美人鱼图:调整图表周围的空白

    我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图 在 HTML PDF 输出中 图表上方和下方有大量空白 请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
  • 线性同余生成器 - 如何选择种子和统计检验

    我需要做一个线性同余生成器 它将成功通过所选的统计测试 我的问题是 如何正确选择发电机的数字以及 我应该选择哪些统计检验 我想 均匀性的卡方频率测试 每代收集10 000个号码的方法 将 0 1 细分为10个相等的细分 柯尔莫哥洛夫 斯米尔
  • 为每个因素级别添加日期时间序列

    我有一个带有因子列的数据框 s lt data frame id 901 910 s id lt as factor s id 我有一个日期时间序列 library lubridate start lt now as difftime 2
  • 在 R 中导入 csv 文件时如何保留前导零?

    当我写一个 csv来自 R 的文件 其中我的组名称以前导零值开头 前导零被保留 但是当我导入 csv前导零被删除 组名称被转换为整数 当我导入一个组时 如何保留组名称中的前导零 csvR 中的文件 Example df lt data fr
  • R data.table 多个条件连接

    我设计了一种解决方案 用于从两个单独数据表的多个列中查找值 并添加基于新列的值计算 多个条件比较 代码如下 它涉及在计算两个表中的值时使用 data table 和联接 但是 这些表没有联接在我正在比较的列上 因此我怀疑我可能无法获得 da
  • 如何在R中匹配具有相同主键的两个表中的数据

    我有两个表 其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
  • 修改linux下的路径

    虽然我认为我已经接近 Linux 专业人士 但显然我仍然是一个初学者 当我登录服务器时 我需要使用最新版本的R 统计软件 R 安装在 2 个地方 当我运行以下命令时 which R I get usr bin R 进而 R version
  • 简单 Haskell Monad - 随机数

    我正在尝试扩展代码这个帖子 https stackoverflow com questions 3944170 haskell and state 接受的答案 允许我能够基于以种子作为参数的函数 randomGen 调用 randomGen
  • R参考类问题

    我正在尝试在 R 中创建一个简单的参考类 这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
  • 通过 Shiny 中的串扰将 Plotly 与 DT 结合使用

    我正在编写一个应用程序来将 csv 文件读取为闪亮的并将散点图与 DT 表链接起来 我几乎遵循了 Plotly 网站上 DT 数据表上的示例 https plot ly r datatable https plot ly r datatab

随机推荐

  • 字段“功能”不存在。 SparkML

    我正在尝试使用 Zeppelin 在 Spark ML 中构建模型 我是这个领域的新手 需要一些帮助 我想我需要为该列设置正确的数据类型并将第一列设置为标签 任何帮助将不胜感激 谢谢 val training sc textFile hdf
  • 出现异常“IllegalStateException:无法在 onSaveInstanceState 后执行此操作”

    我有一个 Live Android 应用程序 并且从市场上我收到了以下堆栈跟踪 我不知道为什么会发生这种情况 因为它没有发生在应用程序代码中 而是由应用程序中的某些或其他事件引起的 假设 我没有使用Fragments 仍然有Fragment
  • Hystrix 仪表板卡在加载屏幕上

    我在 localhost 8988 hystrix 上运行 Hystrix 仪表板 我想监视 OrderService 和 ProductService 之间的请求 端点 hystrix stream 已经注册 并且 hystrix 仪表板
  • 了解为什么 Zipper 是一个 Comonad

    这是对answer https stackoverflow com a 23984628 521070对于我之前的问题 假设我需要映射每个项目a A of List A to b B有功能def f a A leftNeighbors Li
  • 无法在 pgAdmin 4 上查询数据,但可以使用 psql 和 Python

    我在 rds 上创建了一个 postgresql 数据库 我可以在终端上使用 psql 或在 Python 上使用 sqlalchemy 连接和查询它 使用 pgAdmin4 时 我无法查询或可视化数据 但可以创建 更改表 导入数据 我也尝
  • Ruby 错误:“没有这样的文件或目录 -- 脚本/生成 (LoadError)”

    我知道这个错误已经在网络上的其他地方讨论过 这可能看起来是一个愚蠢的问题 但我在这里遇到了一个非常奇怪的情况 我正在 Snow Leopard 上运行 并使用完全更新的 Ruby 和 Rails gem 我使用创建了一个新的 Rails 项
  • 什么是“命名空间清洁度”,glibc 是如何实现的?

    我从以下地方看到这一段 zwol 的回答 https stackoverflow com a 57728805 10795151最近 The libc 前缀于read是因为实际上有三个不同的名称read在 C 库中 read read an
  • 什么是二进制空字符?

    我需要创建 sysDesk 日志文件 在此要求中 我应该创建一个 XML 文件 该文件在元素之间的某些位置包含二进制空字符 有人可以向我解释一下 首先什么是二进制空字符 以及如何将其写入文本文件 我怀疑这意味着 Unicode U 0000
  • 应用程序打开时不显示通知

    应用程序运行时不显示通知 当应用程序关闭时它会起作用 MyFirebaseMessagingService java public class MyFirebaseMessagingService extends FirebaseMessa
  • 即使更改别名后,终端也仅运行 2.7

    如何让终端运行像 manage py 这样的脚本 它将使用 python3 而不是 python2 如果我输入 python 它会运行 python3 但此命令会运行 python2 你的第一行manage py应该 usr bin env
  • Node.js 中的活动句柄是什么

    我发现我的应用程序活动句柄数不断增加 活动句柄的数量究竟是多少 这是我必须注意防止应用程序崩溃的事情吗 活动手柄 句柄是对开放资源 例如打开的文件 数据库连接或请求 的引用 为了理解为什么句柄应该处于关闭状态却可能处于活动状态 我给你一个简
  • 可以在 Spark 批处理上创建模型并在 Spark 流中使用它吗?

    我可以在 Spark Ba tch 中创建模型并将其用于 Spark Streaming 进行实时处理吗 我在 Apache Spark 网站上看到了各种示例 其中训练和预测都是基于相同类型的处理 线性回归 构建的 我可以在 Spark B
  • 使用没有 json 文件的 Google 应用程序默认凭据

    我使用 C 创建了一个控制台应用程序 我使用了谷歌云语音API 我跟着this https github com GoogleCloudPlatform dotnet docs samples tree master speech api
  • 在 Atom 中使用多个游标时有没有办法增加数字?

    我发现自己一遍又一遍地这样做 这可能非常耗时 有哪些选项可用于此 The 增量选择 https atom io packages increment selection包可能就是您正在寻找的 它似乎可以使用多个游标 因此应该非常接近您的用例
  • 获取 DataFrame 的日期时间列的工作日/星期几

    我有一个数据框df如下所示 摘录 时间戳 是索引 Timestamp Value 2012 06 01 00 00 00 100 2012 06 01 00 15 00 150 2012 06 01 00 30 00 120 2012 06
  • 如何在recyclerView中设置可见性小部件

    我有谷歌地图和集群数据 当我单击某个集群时 会显示水平回收器视图 我有 imageButton 它是 CardView 中的下一个或上一个按钮 当我单击它时 cardView 会滚动到下一个位置 它工作完美 但我有一个问题 我的第一个 Ca
  • 如何在 data.frame 中引用 data.frame 的列?

    我有一个名为 series to plot df 的 data frame 它是通过将许多其他 data frame 组合在一起创建的 如下所示 我现在只想从每个列中提取 mm 列 以便我可以绘制它们 所以我想拉出每个 data frame
  • 如何root Genymotion Android 模拟器?

    我已经下载了 Genymotion Android Emulator 供个人使用 我在互联网上搜索以root此设备 论坛说通过adb shell它已经root 同意 Sumits MacBook Pro sdk eSumit adb s 1
  • 模拟Python的内置打印功能

    我试过了 from mock import Mock import builtin builtin print Mock 但这会引发语法错误 我也尝试过像这样修补它 patch builtin print def test somethin
  • 如何按因子生成随机治疗变量?

    Define x lt data frame ID letters 1 10 class as factor c rep 1 5 rep 2 5 treat rep 0 10 s t gt x ID class treat 1 a 1 0