组合物品

2024-02-18

假设我有以下因素列表：

factor_1 = c("A1", "A2", "A3")
factor_2 = c("B1", "B2")
factor_3 = c("C1", "C2", "C3", "C4")
factor_4 = c("D1", "D2", "D3")

我制作了以下数据框，其中包含这些因素的所有 (3 * 2 * 4 * 3 = ) 72 种组合：

data_exp <- expand.grid(factor_1, factor_2, factor_3, factor_4) 
data_exp$id = 1:nrow(data_exp)

> head(data_exp)
  Var1 Var2 Var3 Var4 id
1   A1   B1   C1   D1  1
2   A2   B1   C1   D1  2
3   A3   B1   C1   D1  3
4   A1   B2   C1   D1  4
5   A2   B2   C1   D1  5
6   A3   B2   C1   D1  6

我想随机将此数据 (data_exp) 拆分为 3 个数据集，以便每一行仅出现在这些数据集之一中 - 此外，这 3 个数据集不必具有相同的大小。我尝试使用以下代码来执行此操作。

首先，我随机生成 3 个随机数，对应于每个数据集的行数，使得这 3 个随机数相加为 72：

# https://stackoverflow.com/questions/24845909/generate-n-random-integers-that-sum-to-m-in-r

rand_vect <- function(N, M, sd = 1, pos.only = TRUE) {
  vec <- rnorm(N, M/N, sd)
  if (abs(sum(vec)) < 0.01) vec <- vec + 1
  vec <- round(vec / sum(vec) * M)
  deviation <- M - sum(vec)
  for (. in seq_len(abs(deviation))) {
    vec[i] <- vec[i <- sample(N, 1)] + sign(deviation)
  }
  if (pos.only) while (any(vec < 0)) {
    negs <- vec < 0
    pos  <- vec > 0
    vec[negs][i] <- vec[negs][i <- sample(sum(negs), 1)] + 1
    vec[pos][i]  <- vec[pos ][i <- sample(sum(pos ), 1)] - 1
  }
  vec
}

r = rand_vect(3, 72)
[1] 26 23 23

接下来，我尝试使用这些随机数创建这些数据集：

data_1 = data_exp[sample(nrow(data_exp), r[1]), ]
data_2 = data_exp[sample(nrow(data_exp), r[2]), ]
data_3 = data_exp[sample(nrow(data_exp), r[3]), ]

这种方法的问题在于data_1, data_2, data_3具有公共行，并且并非 data_exp 中的所有行都必须存在于data_1, data_2, data_3.

有办法解决这个问题吗？

谢谢你！

使用以下内容：

 n <- 3
 split(data_exp, sample(rep(seq(n), rmultinom(1, nrow(data_exp), rep(1, n)))))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Random

Integer

datamanipulation

组合物品的相关文章

如何在 conda 中静音或抑制 gfortran （或 clang？）后端？

我一直致力于构建一个非常特殊的 conda 环境专为python and R与串扰使用rpy2 我想出的方法可以安装正确的R包如下 install main environment sh now date T echo Start Tim
当按多列分组时，如何命名 dplyr 中的 group_split 列表

我在 dplyr 中使用 group split 在分割了多个列后我很难命名列表当我们按一列分组时我知道该怎么做here https stackoverflow com questions 57107721 how to name t
如何对无法存储在一个变量中的大数字进行运算

在Java中我希望能够对非常大的整数不能存储在long中进行操作我该怎么做在表现良好的情况下处理这个问题的最佳方法是什么我应该创建自己的包含多个长变量的数据类型吗 Example public class MyBigInteg
从 data.frame 创建新列

我有一个长格式的数据集其中测量时间嵌套在 Networkpartners NP 中而 Networkpartners NP 又嵌套在人员 ID 中下面是它的示例真实数据集有数千行 ID NP Time Outcome 1 11
如何处理重叠的因子水平？（例如，生成表格和图表时）

我面临一个数据集的问题重叠因素水平我想按因素级别生成时间线条形图和统计数据但是我希望因子水平是模棱两可的这意味着属于多个级别的观察结果应该在图中出现多次这是我的数据结构的示例 head lt c ID YEAR BRAZIL G
如何从类外部更改公共 R6 类方法？

我希望能够在我的 R6 类中重新定义公共方法以便它根据该类保存的数据类型进行更改如下所示 library R6 Simple lt R6Class Simple public list dt mtcars my print functi
如何在ggplot2中使用希腊符号？

我的类别需要用希腊字母命名我在用ggplot2 并且它与数据配合得很好不幸的是我无法弄清楚如何将这些希腊符号放在 x 轴上在刻度线处并使它们出现在图例中有什么办法可以做到吗更新我看了一下link https github c
Rglpk - 梦幻足球阵容优化器 - For 循环输出的 Rbind

我有一个使用 Rgplk 的梦幻足球阵容优化器它使用for循环生成多个最佳阵容其数量由用户输入代码如下 Lineups lt list for i in 1 Lineup no matrix lt rbind as numeric D
使 matplotlib 图形默认看起来像 R？

Is there a way to make matplotlib behave identically to R or almost like R in terms of plotting defaults For example R t
如何用月份的全名替换数字月份

使用 tidyverse 包将月份的列更改为完整的实际月份名称请记住尽管这些数据只有四个月但我的真实数据集包含一年中的所有实际月份我是 tidyverse 的新手 mydata lt tibble camp c Platinum 2
R 中使用 randomForest 进行内存高效预测

TL DR我想知道使用基于大型数据集数百个特征数十万行构建的随机森林模型执行批量预测的内存有效方法 Details 我正在处理一个大型数据集内存中超过 3GB 并且想要使用以下方法进行简单的二进制分类randomForest 由于我
R igraph - 保存布局？

我想知道是否可以保存 igraph 网络的布局以便其他人能够重现相同的图表目前 Fruchterman Reingold 算法总是创建一个新的网络 par mfrow c 1 2 g lt erdos renyi game 100 1
创建后修改 ggplot 对象

有没有首选的修改方式ggplot创建后的对象例如我建议我的学生将 r 对象与 pdf 文件一起保存以供以后更改 library ggplot2 graph lt ggplot mtcars aes x mpg y qsec fill c
R中的等值线绘图问题

编辑我已经意识到问题的根源我只有我有数据的县的计数信息该信息少于我正在绘制的区域中的县数量按理说问题代码行在这里 mapnames lt map county plot FALSE 4 names colorsmatched lt
如何将环境变量传递给shinyapps

我想将安全参数传递给shinyapps io部署以便我的应用程序可以通过以下方式获取它们 Sys getenv PASSWORD X 我找不到任何相关内容deployApp函数在rsconnect包裹您可以使用Renviron网站 or
如何在knitr中安装软件包？

到目前为止我一直在使用这段代码来加载 R 包并编写 R 文件但我正在尝试使用knitr rm list ls all TRUE kpacks lt c ggplot2 install github devtools mapdata ne
VBA rand 如何使用上限和下限生成随机数？

所以也许这是多余的也许这就像问为什么大多数人生来就有 5 个手指最后的简短答案总是因为事情就是这样而且它就是这样工作的但我讨厌这个答案该死的我想知道怎么做VBA 中的 Rnd 函数有效 Ms Office Excel 的 MSD
计算数据帧 R 中字符串的频率

我想计算数据框中某些字符串的频率 strings lt c pi pie piece pin pinned post df lt as data frame strings 然后我想计算字符串的频率 counts lt c pi in pi
dplyr 总结小计

Excel 中数据透视表的一大优点是它们会自动提供小计首先我想知道 dplyr 中是否已经创建了任何可以实现此目的的东西如果没有实现它的最简单方法是什么在下面的示例中我按气缸和化油器的数量显示了平均排量对于每组气缸 4 6 8
使用 lpSolve 优化 R 团队名单

我是 R 新手有一个想要解决的特定幻想运动队优化问题我见过其他帖子使用 lpSolve 来解决类似的问题但我似乎无法理解代码下面的示例数据表每个球员都在一个球队中扮演着特定的角色有薪水并且每场比赛都有平均得分我需要的限制是

随机推荐

命令“PassengerAppRoot”无效，可能拼写错误或由服务器配置中未包含的模块定义

我已按照中给出的每一个安装步骤进行操作在 Linux Unix 生产服务器上安装 Passenger Apache 适用于 Node js 应用程序 Red Hat 6 CentOS 6 带 RPM https www phusionpas
是否可以将带有空格或特殊字符的字符串添加到枚举中？

是否可以将带有空格或特殊字符的字符串添加到枚举中例如我有一个字符串Insurance KR Users Name 我尝试将此字符串包含到枚举中 public enum MemberGroup Insurance KR Users Nam
使用 CSS3 动画的脉动传单标记

我想在Leaflet http leafletjs com 地图出于学习目的我不想使用第三方插件我使用以下 CSS 代码来创建脉动动画 gps ring border 3px solid 999 webkit border rad
具有 C 链接的函数能够返回类类型吗？

我观察到 dll 中有一个具有 C 链接的函数该函数返回类类型我不确定这是如何实现的因为 C 不理解类我自己编写了一个示例 dll 并编写了程序并注意到 VC 编译器会显示对此效果的警告但不会阻止您程序能够获取该函数的GetP
错误：发布单击一次应用程序 Wpf 时无法连接

I got an error while publishing my WPF application I am publishing on the desktop and the location of the installation f
在链接反应路由器中传递道具

我正在使用反应与反应路由器我正在尝试在反应路由器的链接中传递属性 var React require react var Router require react router var CreateIdeaView require c
使用 xlsxwriter 设置多个工作表的格式

如何使用以下命令将相同的格式复制到同一 Excel 文件的不同工作表xlsxwriterPython 中的库我尝试的代码是 import xlsxwriter import pandas as pd import numpy as np
如何为material.Slider视图创建Binding Adapter？

我的目标是 2 路数据绑定材质从我的视图模型到 MutableLiveData 的滑块视图
Windows 上的 post-receive 挂钩 - GIT_WORK_DIR：没有这样的文件或目录

我尝试在 git windows 上设置我的接收后挂钩这是脚本 bin sh echo post receive hook GIT WORK TREE d test git checkout f 当我在本地存储库上执行 git Push
如何在运行时更改Spring的@ScheduledfixedDelay？

我需要以固定的时间间隔运行批处理作业并且能够在运行时更改该批处理作业的时间为此我遇到了 ScheduledSpring框架下提供的注解但我不确定如何在运行时更改fixedDelay 的值我做了一些谷歌搜索但没有发现任何有用的东西
如何使用 django Rest api 上传多个文件？

我正在尝试使用 django Rest api 上传多个图像我遵循以下approach https stackoverflow com questions 39645410 how to upload multiple files in
如何使用 maskRe 限制 ExtJs Textfield 仅接受数字。（应该接受 Positive 、 Negative 、整数和小数。）

我需要将 ExtJs 文本字段配置为仅接受正数负数整数和最多 2 位小数的数字我尝试过maskeRe和正则表达式 0 9 d d 但它只接受正整数用户不应该能够输入受限制的字符它还应该只在第一位接受而之间且仅一次所以它应该接
出于计费目的，ndb 缓存的读取操作是否仍算作数据存储读取操作？

From NDB 缓存 https cloud google com appengine docs standard python ndb cache NDB 为您管理缓存有两个缓存级别上下文缓存和 App Engine 标准缓存的网关
和 - 为什么它会这样工作？

另一个新手试图理解 Java 泛型我发现我已经观察了所有主题但我仍然有很多问题您能否向我解释以下事项
Firefox SDK：如何为特定域创建触发器

我需要捕获带有 URL 的网站上的请求 net并采取一些操作停止请求并从磁盘中放入 HTML 代码但这我可以做到我如何捕获这些请求我尝试使用进度侦听器但出现了问题 const STATE START Ci nsIWebProgre
使用 Google Endpoint 保存 blob

我有一个应用程序允许用户在 blobstore 中保存 blob 我目前有一个这样做的模式但我对更简单更少扭曲的东西感兴趣对于上下文假设我的应用程序允许用户上传动物的图片并附上描述动物正在做什么的段落呈现模式用户调用我的端点
部署时是否应该生成 *.pyc 文件？

开发 Python Web 应用程序 Flask uWSGI 并在本地计算机上运行它时 pyc文件由解释器生成我的理解是这些编译后的文件可以使东西load更快但不一定run faster 当我将同一个应用程序部署到生产环境时它在本地文
哈希集不添加重复项，但为 Add() 返回 true

编辑更多信息首先注意新虚拟该类继承了一个基类该基类应该是一个通用的父级感知类可以使用任何 ICollection 类型创建这是描述符基本上是 public abstract class ParentAwareCollecti
在 Chrome 中获取扩展文件夹中的本地文件

我知道我无法从扩展目录中获取本地文件可以获得一个文件inside扩展目录本身您可以使用chrome runtime getURL https developer chrome com docs extensions reference
组合物品

假设我有以下因素列表 factor 1 c A1 A2 A3 factor 2 c B1 B2 factor 3 c C1 C2 C3 C4 factor 4 c D1 D2 D3 我制作了以下数据框其中包含这些因素的所有 3 2 4 3

组合物品

组合物品 的相关文章

随机推荐

热门标签

组合物品的相关文章