R 中没有替换或重复的示例

2023-11-24

我有一个很长的列表，其中包含相当多的重复项，例如 100,000 个值，其中 20% 是重复项。我想从这个列表中随机抽样，将所有值分组，比如 400 个。但是，我不希望任何后续组中包含重复的值 - 即我希望每个组的所有 250 个成员都是唯一的。

我尝试过使用 vegan、picante、EcoSimR 的各种排列方法，但它们并没有完全达到我想要的效果，或者似乎难以处理大量数据。

我想知道是否有某种我无法弄清楚的使用示例函数的方法？任何帮助或替代建议将不胜感激......

正如所指出的nico你可能只需要使用unique功能。下面是一个非常简单的抽样程序，它确保各组之间不会出现重复（这并不完全合理，因为您可以只创建一个大样本......）

# Getting some random values to use here
set.seed(seed = 14412)
thevalues <- sample(x = 1:100,size = 1000,replace = TRUE)

# Obtaining the unique vector of those values
thevalues.unique <- unique(thevalues)

# Create a sample without replacement (i.e. take the ball out and don't put it back in)
sample1 <- sample(x = thevalues.unique,size = 10,replace = FALSE)

# Remove the sampled items from the vector of values
thevalues.unique <- thevalues.unique[!(thevalues.unique %in% sample1)]

# Another sample, and another removal
sample2 <- sample(x = thevalues.unique,size = 10,replace = FALSE)
thevalues.unique <- thevalues.unique[!(thevalues.unique %in% sample2)]

做什么eipi10提到并得到加权分布，你只需要先得到分布的频率。这样做的一种方法：

set.seed(seed = 14412)
thevalues <- sample(x = 1:100,size = 1000,replace = TRUE,prob = c(rep(0.01,100)))

thevalues.unique <- unique(thevalues)
thevalues.unique <- thevalues.unique[order(thevalues.unique)]
thevalues.probs <- table(thevalues)/length(thevalues)
sample1 <- sample(x = thevalues.unique,
                  size = 10,
                  replace = FALSE,
                  prob = thevalues.probs)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

permutation

Random

R 中没有替换或重复的示例的相关文章

循环遍历列并将字符串长度添加为新列

我有一个包含多列的数据框并且希望为每个列输出一个单独的列其中包含每行的长度我试图迭代列名称并为每列输出一个附加有 length 的相应列例如 col1 col2 将转到 col1 列2 col1 长度列2 长度我正在使用的代码
在闪亮仪表板中显示/隐藏菜单项

当进入应用程序时我需要隐藏一个菜单项当用户选择某个值时菜单项必须出现我努力了shinyjs功能hidden 并且它隐藏了一个 menuItem 但是当使用show or toggle 菜单项不会出现我发现了Rshinydashbo
R、GeoJSON 和 Leaflet

我最近从 R Bloggers com 的帖子中了解了 leafletjs com 我想要实现的一个此类教程是使用传单创建交互式分区统计图 http leafletjs com examples choropleth html http l
不同大小组的高效递归随机抽样

这个问题是我之前关于递归随机抽样问题的后续问题高效的递归随机采样 https stackoverflow com questions 69824065 efficient recursive random sampling 当组大小相同或每
php洗一副牌

我想使用 php 创建随机桥手的集合我认为我可以将有序的卡片包编码为字符串 deal下面我喜欢它有 52 个字母同时考虑大小写我发现了 php 函数str shuffle 所以我想我可以做以下事情 pack abcdefghijkl
在 R 中将本地日期时间转换为 UTC

如何将本地日期时间转换为以下格式 12 31 2014 6 42 52 PM R 中的 UTC 我试过这个 as POSIXct as Date 12 31 2014 6 42 52 PM format m d Y H M S tz UTC
为 PDF 输出添加 natbib 选项

有没有办法指定natibib输出 PDF 时的选项bookdown 我希望 tex 输出具有命令 usepackage sort compress natbib 但似乎没有任何方法可以在 YAML 中指定它我无法将命令添加到我的序言中因
添加不同的标签以在 ggplot R 中的堆积条形图中显示总计？

我的问题有点类似如何添加文本标签以显示ggplot中堆叠比例条的每个条中的总数n https stackoverflow com questions 65201095 how to add text label to show total
如何编写一个也接受字符输入的 NES 函数？

我正在开发一个将字符串作为函数参数的 R 包现在我想使用非标准评估来允许非字符串输入另外为了保持向后兼容性我想保留函数接受字符串的可能性哈德利给出了example https cran r project org web pack
哪种 LaTeX 包与 knit 一起使用以获得更多的表格控制？禁忌？

我正在用 knitr 写一张更长的桌子xtable和tabular environment longtable 在 longtable 包中时print将它们纳入我的 Rnw file 问题是我对longtable环境控制不够我有一些文本
R 中的 For 循环分配给数据框

运行 for 循环后我在分配给数据帧时遇到问题当我使用 print 时它给出了我的价值有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
没有垂直线的直方图

当我创建直方图时它看起来很像这样 set seed 1 x lt 1 100 y lt x rnorm 50 y round y hist y Is there a way to make a histogram look a bit l
如何在闪亮的应用程序中显示矩阵，并用条件指定颜色？

我有一个具有正值和负值的矩阵 M 我正在尝试使用 DT 包在闪亮的应用程序中显示为表格我想用不同的颜色显示矩阵红色的正数和负数例如到目前为止我只能以一对一的方式添加颜色但我想以这种方式添加颜色如果matrix values g
根据感兴趣的特定单词绘制高度相关的单词[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在尝试绘制一个单词的最高相关性例如我想绘制鲸鱼一词的最高十个相关性的图表有人可以帮我执行类似的命令吗如果有帮助的话我已经安装
对 R/Sweave 进行编程以获得正确的 \Sexpr 输出

我在为 Sweave 进行 R 编程时遇到了一些问题 rstats twitter 小组经常指出这里所以我想我应该把这个问题向大家提出我是一名分析师而不是程序员所以在我的第一篇文章中请放轻松问题是我正在使用 R 在 Sweave
根据第二个数据帧中的匹配创建新列

如果有两个数据框 top3df http dpaste com 1709875 and qw qw lt structure list id structure 1 25 Label c w01 w02 w03 w04 w05 w06 w0
将英寸高度的字符向量转换为厘米？

我得到一个字符向量 tibble H c 6 2 5 10 5 5 5 1 5 5 5 4 我想将其转换为厘米请告知我该怎么做有几种方法可以使用 1 阅读与fread粘贴到单个字符串后 library data table fread
生成（非常）大的非重复整数序列而不进行预洗牌

背景我编写了一个简单的媒体客户端服务器我想生成一个不明显的时间值随从客户端到服务器的每个命令一起发送时间戳中将包含相当多的数据纳秒分辨率即使它不是真正准确因为现代操作系统中计时器采样的限制等我想做的在 Linux 上
生成与现有变量具有预定义相关性的二进制变量

对于模拟研究我想生成一组随机变量连续变量和二元变量这些变量与已经存在的变量具有预定义的关联binary变量此处表示为x 对于这篇文章假设x是按照下面的代码生成的但请记住在现实生活中 x是一个已经存在的变量 set seed 1
修改x轴刻度标签

我正在尝试更改由生成的箱线图的 x 轴刻度标签ggplot2 x 轴是一个分类变量 HabFac 我想要的是将其刻度更改为 6 个化学品 A E 下面是我的代码 raw data read table Read data p TT ggpl

随机推荐

Android - Google 云端硬盘 HTTP 请求

我正在尝试编写一个可以将文件上传到 Google Drive 的应用程序我选择通过原始 http 请求与此服务交互因为我在 Android 上没有找到任何有用的 API 示例而且它看起来比提供的库更轻量级我用过https devel
如何从 Eclipse 运行 Javah

所以我试图在 Eclipse 中编译的 class 文件上运行 javah 工具但我不知道该怎么做我发现的例子只是说了一些类似在你的类上运行 javah 的内容但我真的不知道在 Eclipse 中哪里可以找到这样的命令行如果有人能
从句子生成 N 元语法

如何生成字符串的 n 元语法例如 String Input This is my car 我想用这个输入生成 n gram Input Ngram size 3 输出应该是 This is my car This is is my my
android 动态设置listview高度

i have ExpandableListview inside ScrollView我知道这不好但我也有显示整个列表的唯一解决方案是使用代码设置其高度layoutParams relativeLayout LayoutParams 参
Angular Material mat-table 定义组件中可重用的列

有人知道是否可以创建一个与 mat table 一起使用的列组件我尝试为常用的列定义创建一个组件但是在添加到表时出现错误无法找到列选择器我的列定义如下 Component selector iam select column t
在 python 3.5 中模拟异步调用

如何使用以下命令模拟从一个本机协程到另一个协程的异步调用unittest mock patch 我目前有一个相当尴尬的解决方案 class CoroutineMock MagicMock def await self args kwargs
制作适合打印的 ASP.NET 页面的最佳方法？

我只是好奇大多数人如何使他们的 ASP NET 页面适合打印您是否使用 CSS 或其他内容创建单独的适合打印的 ASPX 页面版本您如何处理分页符和宽表等情况是否有一种适用于大多数情况的优雅解决方案您基本上可以创建另一个 CSS 文
温莎城堡的多接口注入

当容器中有多个实现时如何让温莎城堡在运行时选择正确的接口植入例如假设我有一个名为 IExamCalc 的简单界面它可以通过计算来了解某人在该考试中的表现不我们有几种实现方式如下所示 public interface IExam
如何将Appium与C#集成？

我找不到一篇可以在 C 中使用 appium 自动化移动测试的帖子我已经在规范流中编写了我的网站自动化代码我也可以重复使用它吗 Appium 提供了dotnet appium 驱动程序这是与 Appium 交互的 API 您可以使用它来
.svg url 到 UIImage iOS

我从服务器获取 svg 网址如何将 NSData 从 svg url 转换为 UIImage 我得到的网址类似于 https storage googleapis com pgcdn ca svg lock svg 我正在使用这段代码 N
Zend 框架用户身份验证与 Twitter 和 Facebook 集成

是否有基于 ZF 的脚本支持普通用户注册登录系统以及通过 Twitter 和 Facebook 进行用户身份验证看一下Zend Framework 1 11 中的 OpenID Facebook 和 Twitter 身份验证示例不
如何定义“类型析取”（联合类型）？

一种方法有被建议处理重载方法的双重定义就是用模式匹配代替重载 object Bar def foo xs Any xs foreach case String gt println str case Int gt println int c
C# 在 AD 中链接组策略

如何在AD中设置组策略我可以创建我的 OU 但我还需要附加链接到它的组策略这就是我到目前为止所拥有的 string strOU OU test454545 OU Clients OU Clients DC domain DC net G
Jquery 树形图 [关闭]

Closed 这个问题需要多问focused 目前不接受答案我正在寻找可以执行以下任务的 javascript 或 jquery 解决方案 1 Dynamically generate tree hierarchy structure o
.NET 中的 SetForegroundWindow 问题

我在 NET 中使用 PInvoke 使用 SetForegroundWindow API 当我在 Visual Studio 中调试时使用 API 时它工作得很好但当应用程序正常运行时它并不总是有效我在调用 SetForegrou
Java中final字段的继承？

当超类有一个标记为 Final 的字段但子类覆盖隐藏该字段时会发生什么最终并不能阻止这一切不是吗我正在研究的具体示例是一个 Building 类不同类型的建筑物继承自该类除其他外每种类型的成本对于每个子类来说应该是最终
使用自定义注释进行组件扫描

我正在使用 Maven 依赖项将 Spring Boot 项目作为另一个 Spring Boot 应用程序中的 jar 使用仅当我从微服务启用自定义注释时我才想对 jar 进行组件扫描 SpringBootApplication Com
Javascript：滚动时从一个div滚动到另一个div？

我希望能够在向下滚动时直接转到下一个 div 在向上滚动时直接转到上一个 div 这是我的文件其中包含两个 div 的示例 document ready function var lastScrollTop 0 function find
有没有一个python json库可以将json转换为模型对象，类似于google-gson？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案标准的python json模块只能将json字符串转换为dict结构但我更喜欢将 json 转换为具有父子关系的模型对象结构我在 Andr
R 中没有替换或重复的示例

我有一个很长的列表其中包含相当多的重复项例如 100 000 个值其中 20 是重复项我想从这个列表中随机抽样将所有值分组比如 400 个但是我不希望任何后续组中包含重复的值即我希望每个组的所有 250 个成员都是唯一的

R 中没有替换或重复的示例

R 中没有替换或重复的示例 的相关文章

随机推荐

热门标签

R 中没有替换或重复的示例的相关文章