R 中没有替换或重复的示例

2023-11-24

我有一个很长的列表,其中包含相当多的重复项,例如 100,000 个值,其中 20% 是重复项。我想从这个列表中随机抽样,将所有值分组,比如 400 个。但是,我不希望任何后续组中包含重复的值 - 即我希望每个组的所有 250 个成员都是唯一的。

我尝试过使用 vegan、picante、EcoSimR 的各种排列方法,但它们并没有完全达到我想要的效果,或者似乎难以处理大量数据。

我想知道是否有某种我无法弄清楚的使用示例函数的方法?任何帮助或替代建议将不胜感激......


正如所指出的nico你可能只需要使用unique功能。下面是一个非常简单的抽样程序,它确保各组之间不会出现重复(这并不完全合理,因为您可以只创建一个大样本......)

# Getting some random values to use here
set.seed(seed = 14412)
thevalues <- sample(x = 1:100,size = 1000,replace = TRUE)

# Obtaining the unique vector of those values
thevalues.unique <- unique(thevalues)

# Create a sample without replacement (i.e. take the ball out and don't put it back in)
sample1 <- sample(x = thevalues.unique,size = 10,replace = FALSE)

# Remove the sampled items from the vector of values
thevalues.unique <- thevalues.unique[!(thevalues.unique %in% sample1)]

# Another sample, and another removal
sample2 <- sample(x = thevalues.unique,size = 10,replace = FALSE)
thevalues.unique <- thevalues.unique[!(thevalues.unique %in% sample2)]

做什么eipi10提到并得到加权分布,你只需要先得到分布的频率。这样做的一种方法:

set.seed(seed = 14412)
thevalues <- sample(x = 1:100,size = 1000,replace = TRUE,prob = c(rep(0.01,100)))

thevalues.unique <- unique(thevalues)
thevalues.unique <- thevalues.unique[order(thevalues.unique)]
thevalues.probs <- table(thevalues)/length(thevalues)
sample1 <- sample(x = thevalues.unique,
                  size = 10,
                  replace = FALSE,
                  prob = thevalues.probs)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 中没有替换或重复的示例 的相关文章

  • 循环遍历列并将字符串长度添加为新列

    我有一个包含多列的数据框 并且希望为每个列输出一个单独的列 其中包含每行的长度 我试图迭代列名称 并为每列输出一个附加有 length 的相应列 例如 col1 col2 将转到 col1 列2 col1 长度 列2 长度 我正在使用的代码
  • 在闪亮仪表板中显示/隐藏菜单项

    当进入应用程序时 我需要隐藏一个菜单项 当用户选择某个值时 菜单项必须出现 我努力了shinyjs功能hidden 并且它隐藏了一个 menuItem 但是当使用show or toggle 菜单项不会出现 我发现了Rshinydashbo
  • R、GeoJSON 和 Leaflet

    我最近从 R Bloggers com 的帖子中了解了 leafletjs com 我想要实现的一个此类教程是使用传单创建交互式分区统计图 http leafletjs com examples choropleth html http l
  • 不同大小组的高效递归随机抽样

    这个问题是我之前关于递归随机抽样问题的后续问题高效的递归随机采样 https stackoverflow com questions 69824065 efficient recursive random sampling 当组大小相同或每
  • php洗一副牌

    我想使用 php 创建随机桥手的集合 我认为我可以将有序的卡片包编码为字符串 deal下面 我喜欢它有 52 个字母 同时考虑大小写 我发现了 php 函数str shuffle 所以我想我可以做以下事情 pack abcdefghijkl
  • 在 R 中将本地日期时间转换为 UTC

    如何将本地日期时间转换为以下格式 12 31 2014 6 42 52 PM R 中的 UTC 我试过这个 as POSIXct as Date 12 31 2014 6 42 52 PM format m d Y H M S tz UTC
  • 为 PDF 输出添加 natbib 选项

    有没有办法指定natibib输出 PDF 时的选项bookdown 我希望 tex 输出具有命令 usepackage sort compress natbib 但似乎没有任何方法可以在 YAML 中指定它 我无法将命令添加到我的序言中 因
  • 添加不同的标签以在 ggplot R 中的堆积条形图中显示总计?

    我的问题有点类似 如何添加文本标签以显示ggplot中堆叠比例条的每个条中的总数n https stackoverflow com questions 65201095 how to add text label to show total
  • 如何编写一个也接受字符输入的 NES 函数?

    我正在开发一个将字符串作为函数参数的 R 包 现在我想使用非标准评估来允许非字符串输入 另外 为了保持向后兼容性 我想保留函数接受字符串的可能性 哈德利给出了example https cran r project org web pack
  • 哪种 LaTeX 包与 knit 一起使用以获得更多的表格控制?禁忌?

    我正在用 knitr 写一张更长的桌子xtable和tabular environment longtable 在 longtable 包中时print将它们纳入我的 Rnw file 问题是我对longtable环境控制不够 我有一些文本
  • R 中的 For 循环分配给数据框

    运行 for 循环后 我在分配给数据帧时遇到问题 当我使用 print 时 它给出了我的价值 有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
  • 没有垂直线的直方图

    当我创建直方图时 它看起来很像这样 set seed 1 x lt 1 100 y lt x rnorm 50 y round y hist y Is there a way to make a histogram look a bit l
  • 如何在闪亮的应用程序中显示矩阵,并用条件指定颜色?

    我有一个具有正值和负值的矩阵 M 我正在尝试使用 DT 包在闪亮的应用程序中显示为表格 我想用不同的颜色显示矩阵 红色的正数和负数 例如 到目前为止 我只能以一对一的方式添加颜色 但我想以这种方式添加颜色 如果matrix values g
  • 根据感兴趣的特定单词绘制高度相关的单词[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我正在尝试绘制一个单词的最高相关性 例如 我想绘制 鲸鱼 一词的最高十个相关性的图表 有人可以帮我执行类似的命令吗 如果有帮助的话我已经安装
  • 对 R/Sweave 进行编程以获得正确的 \Sexpr 输出

    我在为 Sweave 进行 R 编程时遇到了一些问题 rstats twitter 小组经常指出这里 所以我想我应该把这个问题向大家提出 我是一名分析师 而不是程序员 所以在我的第一篇文章中请放轻松 问题是 我正在使用 R 在 Sweave
  • 根据第二个数据帧中的匹配创建新列

    如果有两个数据框 top3df http dpaste com 1709875 and qw qw lt structure list id structure 1 25 Label c w01 w02 w03 w04 w05 w06 w0
  • 将英寸高度的字符向量转换为厘米?

    我得到一个字符向量 tibble H c 6 2 5 10 5 5 5 1 5 5 5 4 我想将其转换为厘米 请告知我该怎么做 有几种方法可以使用 1 阅读与fread粘贴到单个字符串后 library data table fread
  • 生成(非常)大的非重复整数序列而不进行预洗牌

    背景 我编写了一个简单的媒体客户端 服务器 我想生成一个不明显的时间值 随从客户端到服务器的每个命令一起发送 时间戳中将包含相当多的数据 纳秒分辨率 即使它不是真正准确 因为现代操作系统中计时器采样的限制 等 我想做的 在 Linux 上
  • 生成与现有变量具有预定义相关性的二进制变量

    对于模拟研究 我想生成一组随机变量 连续变量和二元变量 这些变量与已经存在的变量具有预定义的关联binary变量 此处表示为x 对于这篇文章 假设x是按照下面的代码生成的 但请记住 在现实生活中 x是一个已经存在的变量 set seed 1
  • 修改x轴刻度标签

    我正在尝试更改由生成的箱线图的 x 轴刻度标签ggplot2 x 轴是一个分类变量 HabFac 我想要的是将其刻度更改为 6 个化学品 A E 下面是我的代码 raw data read table Read data p TT ggpl

随机推荐

  • Android - Google 云端硬盘 HTTP 请求

    我正在尝试编写一个可以将文件上传到 Google Drive 的应用程序 我选择通过原始 http 请求与此服务交互 因为我在 Android 上没有找到任何有用的 API 示例 而且它看起来比提供的库更轻量级 我用过https devel
  • 如何从 Eclipse 运行 Javah

    所以我试图在 Eclipse 中编译的 class 文件上运行 javah 工具 但我不知道该怎么做 我发现的例子只是说了一些类似 在你的类上运行 javah 的内容 但我真的不知道在 Eclipse 中哪里可以找到这样的命令行 如果有人能
  • 从句子生成 N 元语法

    如何生成字符串的 n 元语法 例如 String Input This is my car 我想用这个输入生成 n gram Input Ngram size 3 输出应该是 This is my car This is is my my
  • android 动态设置listview高度

    i have ExpandableListview inside ScrollView我知道这不好 但我也有 显示整个列表的唯一解决方案是使用代码设置其高度layoutParams relativeLayout LayoutParams 参
  • Angular Material mat-table 定义组件中可重用的列

    有人知道是否可以创建一个与 mat table 一起使用的 列 组件 我尝试为常用的列定义创建一个组件 但是在添加到表时出现错误 无法找到列选择器 我的列定义如下 Component selector iam select column t
  • 在 python 3.5 中模拟异步调用

    如何使用以下命令模拟从一个本机协程到另一个协程的异步调用unittest mock patch 我目前有一个相当尴尬的解决方案 class CoroutineMock MagicMock def await self args kwargs
  • 制作适合打印的 ASP.NET 页面的最佳方法?

    我只是好奇大多数人如何使他们的 ASP NET 页面适合打印 您是否使用 CSS 或其他内容创建单独的适合打印的 ASPX 页面版本 您如何处理分页符和宽表等情况 是否有一种适用于大多数情况的优雅解决方案 您基本上可以创建另一个 CSS 文
  • 温莎城堡的多接口注入

    当容器中有多个实现时 如何让温莎城堡在运行时选择正确的接口植入 例如 假设我有一个名为 IExamCalc 的简单界面 它可以通过计算来了解某人在该考试中的表现 不 我们有几种实现方式 如下所示 public interface IExam
  • 如何将Appium与C#集成?

    我找不到一篇可以在 C 中使用 appium 自动化移动测试的帖子 我已经在规范流中编写了我的网站自动化代码 我也可以重复使用它吗 Appium 提供了dotnet appium 驱动程序这是与 Appium 交互的 API 您可以使用它来
  • .svg url 到 UIImage iOS

    我从服务器获取 svg 网址 如何将 NSData 从 svg url 转换为 UIImage 我得到的网址类似于 https storage googleapis com pgcdn ca svg lock svg 我正在使用这段代码 N
  • Zend 框架用户身份验证与 Twitter 和 Facebook 集成

    是否有基于 ZF 的脚本 支持普通用户注册 登录系统 以及通过 Twitter 和 Facebook 进行用户身份验证 看一下Zend Framework 1 11 中的 OpenID Facebook 和 Twitter 身份验证示例 不
  • 如何定义“类型析取”(联合类型)?

    一种方法有被建议处理重载方法的双重定义就是用模式匹配代替重载 object Bar def foo xs Any xs foreach case String gt println str case Int gt println int c
  • C# 在 AD 中链接组策略

    如何在AD中设置组策略 我可以创建我的 OU 但我还需要附加链接到它的组策略 这就是我到目前为止所拥有的 string strOU OU test454545 OU Clients OU Clients DC domain DC net G
  • Jquery 树形图 [关闭]

    Closed 这个问题需要多问focused 目前不接受答案 我正在寻找可以执行以下任务的 javascript 或 jquery 解决方案 1 Dynamically generate tree hierarchy structure o
  • .NET 中的 SetForegroundWindow 问题

    我在 NET 中使用 PInvoke 使用 SetForegroundWindow API 当我在 Visual Studio 中调试时使用 API 时 它工作得很好 但当应用程序正常运行时 它并不总是有效 我在调用 SetForegrou
  • Java中final字段的继承?

    当超类有一个标记为 Final 的字段 但子类覆盖 隐藏 该字段时 会发生什么 最终 并不能阻止这一切 不是吗 我正在研究的具体示例是一个 Building 类 不同类型的建筑物继承自该类 除其他外 每种类型的成本对于每个子类来说应该是最终
  • 使用自定义注释进行组件扫描

    我正在使用 Maven 依赖项将 Spring Boot 项目作为另一个 Spring Boot 应用程序中的 jar 使用 仅当我从微服务启用自定义注释时 我才想对 jar 进行组件扫描 SpringBootApplication Com
  • Javascript:滚动时从一个div滚动到另一个div?

    我希望能够在向下滚动时直接转到下一个 div 在向上滚动时直接转到上一个 div 这是我的文件 其中包含两个 div 的示例 document ready function var lastScrollTop 0 function find
  • 有没有一个python json库可以将json转换为模型对象,类似于google-gson? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 标准的python json模块只能将json字符串转换为dict结构 但我更喜欢将 json 转换为具有 父子 关系的模型对象结构 我在 Andr
  • R 中没有替换或重复的示例

    我有一个很长的列表 其中包含相当多的重复项 例如 100 000 个值 其中 20 是重复项 我想从这个列表中随机抽样 将所有值分组 比如 400 个 但是 我不希望任何后续组中包含重复的值 即我希望每个组的所有 250 个成员都是唯一的