返回很大范围内的非重复随机值

2024-02-20

我想要一个函数，它可以从一组 n 个整数（0 到 n-1）中生成 k 个伪随机值，而不重复任何先前的结果。 k小于或等于n。O(n) 内存不可接受由于尺寸较大n以及我需要重新洗牌的频率。

这些是我到目前为止考虑过的方法：

Array：通常，如果我想要无重复的随机值，我会打乱数组，但这是 O(n) 内存。 n 可能太大而无法正常工作。

long nextvalue(void) {
  static long array[4000000000];
  static int s = 0;
  if (s == 0) {
    for (int i = 0; i < 4000000000; i++) array[i] = i;
    shuffle(array, 4000000000);
  }
  return array[s++];
}

n态PRNG：有多种随机数生成器，可以将其设计为具有以下周期：n并参观n那个时期的独特状态。最简单的例子是：

long nextvalue(void) {
static long s = 0;
static const long i = 1009; // assumed co-prime to n
  s = (s + i) % n;
  return s;
}

这样做的问题是，对于给定的情况，动态设计一个好的 PRNG 并不一定容易。n，如果 PRNG 没有很多可变参数（甚至更难设计），它就不太可能近似公平的洗牌。但也许有一个我不知道的好东西。

m位哈希：如果集合的大小是 2 的幂，那么就有可能设计出完美的哈希函数f()它执行从范围内的任何值到范围内的某个其他值的 1:1 映射，其中每个输入都会产生唯一的输出。使用这个函数我可以简单地维护一个静态计数器s，并将生成器实现为：

long nextvalue(void) {
  static long s = 0;
  return f(s++);
}

这并不理想，因为结果的顺序由以下因素决定f()，而不是随机值，因此它会遇到与上述相同的问题。

NPOT 哈希：原则上我可以使用与上面相同的设计原则来定义一个版本f()它可以在任意基础上工作，甚至可以在与所需范围兼容的复合基础上工作；但这可能很困难，而且我很可能会出错。相反，可以为大于或等于的下一个二的幂定义一个函数n，并在此结构中使用：

long nextvalue(void) {
  static long s = 0;
  long x = s++;
  do { x = f(x); } while (x >= n);
}

但是这个still有同样的问题（不太可能给出公平洗牌的良好近似值）。

有没有更好的方法来处理这种情况？或者也许我只需要一个好的功能f()高度参数化且易于设计以准确访问n离散状态。

我正在考虑的一件事是类似哈希的操作，我设法获得第一个j通过精心设计的映射，结果完全随机，然后之间的任何结果j and k会简单地推断该模式（尽管以可预测的方式）。价值j然后可以选择在公平洗牌和可容忍的内存占用之间找到折衷方案。

首先，对任何使用 O(n) 内存的东西打折扣，然后讨论引用底层数组的解决方案似乎是不合理的。你有一个数组。洗牌。如果这不起作用或不够快，请向我们提出相关问题。

您只需执行一次完整的随机播放。之后，从索引中提取n，将该元素与随机位于其之前的元素交换并增加n，模元素计数。例如，对于如此大的数据集，我会使用像这样的东西 https://gist.github.com/Sebbyastian/40be860d95f9df95f319a2f17dc74dde.

质数是哈希的一种选择，但可能与您想象的不同。使用两个梅森素数 (low and high，也许0xefff and 0xefffffff）你应该能够想出一个更通用的哈希算法。

size_t hash(unsigned char *value, size_t value_size, size_t low, size_t high) {
    size_t x = 0;
    while (value_size--) {
        x += *value++;
        x *= low;
    }
    return x % high;
}
#define hash(value, value_size, low, high) (hash((void *) value, value_size, low, high))

例如，对于大于大约两个八位位组的所有输入，这应该产生相当好的分布，但零字节前缀有一个小麻烦的例外。您可能想以不同的方式对待它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

返回很大范围内的非重复随机值的相关文章

MEX 文件中的断言导致 Matlab 崩溃

我正在使用mxAssert 宏定义为matrix h在我的 C 代码中 mex 可以完美编译当我调用的 mex 代码中违反断言时该断言不会导致我的程序崩溃而是导致 Matlab 本身崩溃我错过了什么吗这是有意的行为吗当我查看 M
添加对共享类的多个 WCF 服务的服务引用

我正在尝试将我的 WCF Web 服务拆分为几个服务而不是一个巨大的服务但是 Visual Studio Silverlight 客户端复制了两个服务共享的公共类这是一个简单的例子来说明我的问题在此示例中有两个服务两者都返回类
捕获 foreach 条件中抛出的异常

我有一个foreach在 foreach 本身的条件下循环期间中断的循环有没有办法try catch抛出异常然后继续循环的项这将运行几次直到异常发生然后结束 try foreach b in bees exception is in
使用实体框架从集合中删除项目

我正在使用DDD 我有一个 Product 类它是一个聚合根 public class Product IAggregateRoot public virtual ICollection
在 Xcode4 中使用 Boost

有人设置 C Xcode4 项目来使用 Boost 吗对于一个简单的 C 控制台应用程序我需要在 Xcode 中设置哪些设置 Thanks 用这个来管理它和这个
C++11 函数局部静态 const 对象的线程安全初始化

这个问题已在 C 98 上下文中提出并在该上下文中得到回答但没有明确说明有关 C 11 的内容 const some type create const thingy lock my lock some mutex static con
在 C# 中将位从 ulong 复制到 long

所以看来 NET 性能计数器类型 http msdn microsoft com en us library system diagnostics performancecounter aspx有一个恼人的问题它暴露了long对于计数器
转到 C# WPF 中的第一页

我正在 WPF 中使用导航服务为了导航到页面我使用 this NavigationService Navigate new MyPage 为了返回我使用 this NavigationService GoBack 但是如何在不使用的情况
Xamarin Android：获取内存中的所有进程

有没有办法读取所有进程而不仅仅是正在运行的进程如果我对 Android 的理解正确的话一次只有一个进程在运行其他所有进程都被冻结后台进程被忽略您可以使用以下代码片段获取当前正在运行的所有 Android 应用程序进程 Activ
通过不同 DLL 或 EXE 中的指针或引用访问 STL 对象时发生访问冲突

我在使用旧版 VC6 时遇到以下问题我只是无法切换到现代编译器因为我正在处理遗留代码库 http support microsoft com kb 172396 http support microsoft com kb 172396
std::bind 重载解析

下面的代码工作正常 include
如何排列表格中的项目 - MVC3 视图 (Index.cshtml)

我想使用 ASP NET MVC3 显示特定类型食品样本中存在的不同类型维生素的含量如何在我的视图 Index cshtml 中显示它 an example 这些是我的代码 table tr th th foreach var m in
通过等待任务或访问其 Exception 属性都没有观察到任务的异常

这些是我的任务我应该如何修改它们以防止出现此错误我检查了其他类似的线程但我正在使用等待并继续那么这个错误是怎么发生的呢通过等待任务或访问其 Exception 属性都没有观察到任务的异常结果未观察到的异常被终结器线程重新抛出
32位PPC rlwinm指令

我在理解上有点困难rlwinmPPC 汇编指令旋转左字立即然后与掩码我正在尝试反转函数的这一部分 rlwinm r3 r3 0 28 28 我已经知道什么了r3 is r3在本例中是一个 4 字节整数但我不确定这条指令到底是什么rlw
为什么我使用google'smtp'无法发送电子邮件？

我有以下程序使用 smtp gmail com 587 发送电子邮件 namespace TestMailServer class Program static void Main string args MailMessage mail
过度使用委托对性能来说是一个坏主意吗？ [复制]

这个问题在这里已经有答案了考虑以下代码 if IsDebuggingEnabled instance Log GetDetailedDebugInfo GetDetailedDebugInfo 可能是一个昂贵的方法因此我们只想在调试模式
如何查明CONFIG_FANOTIFY_ACCESS_PERMISSIONS是否启用？

我想利用fanotify 7 http man7 org linux man pages man7 fanotify 7 html我遇到的问题是在某些内核上CONFIG FANOTIFY ACCESS PERMISSIONS不起作用虽然C
在基类集合上调用派生方法

我有一个名为 A 的抽象类以及实现 A 的其他类 B C D E 我的派生类持有不同类型的值我还有一个 A 对象的列表 abstract class A class B class A public int val get privat
如何从 CouchDB 加载随机文档（高效且公平）？

我想从存储在 CouchDB 数据库中的一组文档中加载随机文档单据的取放方式应符合下列要求效率文档的查找应该高效最重要的是加载文档的时间不能随文档总数线性增长这意味着skip无法使用查询参数均匀分布选择应该是真正随机的尽可能
Azure函数版本2.0-应用程序blobTrigger不工作

我有一个工作功能应用程序它有一个 blob 输入和一个事件中心输出在测试版中工作随着最新的更改我的功能不再起作用我尝试根据发行说明更新 host json 文件但它没有引用 blob 触发器 version 2 0 extens

随机推荐

如何运行由“lein jar”命令制作的jar？

这是后续这个问题 https stackoverflow com questions 3390268 how to setup the classpath when running the jar made from lein uberja
如何获取和设置WPF文本框的当前光标位置

我想从 WPF TextBox 获取当前光标位置如果一个TextBox包含文本abhishek并且光标在之后闪烁abhi然后我想要那个索引以便稍后清除后TextBox以编程方式分配一些其他或相同的文本以编程方式我想让光标在 4 个字符后
金字塔：多个资源工厂——如何

我有一个简单的根资源工厂 class Root acl Allow Authenticated edit 现在对于一些特殊路线我需要创建另一个资源工厂 config add route special special test fac
如何在Gitlab-ci中登录docker账户

我已经订阅了 Pro 计划docker https www docker com pricing帐户到提高速率限制 https www docker com increase rate limit在我自己托管的 Gitlab CI 工作中
类“PreferredSizeWidget”不能用作 mixin，因为它既不是 mixin 类也不是 mixin

升级到 Flutter 3 10 和 Dart 3 后我收到此错误类 PreferredSizeWidget 不能用作 mixin 因为它是既不是 mixin 类也不是 mixin 当前版本的代码 class MyAppBar ex
自动生成层次结构值

我有一个带列的树表ID ParentID and Hierarchy并想要生成Hierarchy列值取决于ParentID 为此我使用触发器是否存在更好的方法来生成层次结构列值 ALTER TRIGGER TR MyTable Befo
使用 Paramiko 保留时间戳

使用 Paramiko 将 SFTP 文件从一台服务器传输到另一台服务器时是否有一种方法可以保留时间戳类似于 pLinux 中的争论原始文件 jim vm3634 ls la rwxrwx 1 jim admin 2214 Mar 3
如何列出检查点中的某些变量？

我正在使用自动编码器我的检查点包含网络的完整状态即编码器解码器优化器等我想玩弄编码因此在我的评估模式中我只需要网络的解码器部分如何从现有检查点中仅读取一些特定变量以便我可以在另一个模型中重用它们的值 There s li
计算 sqlalchemy 模型中的相关项数

我正在尝试计算各自类别中的项目数量并最终得到一个可以在 jinja 模板中迭代的集合我的最终输出是这样的类别1 5 类别2 10 类别3 0 零物品案例很重要我的模型是 class Category Base tablename c
是否可以从 VS Code 内的 Android 或 iOS 模拟器查看 SQLite 数据库？

我正在 Flutter 中编写一个跨平台移动应用程序但遇到了 SQLite 数据库的错误为了调试它我真的希望能够查看数据库中保存的内容由于这是移动开发因此数据库文件保存在模拟器内以及我的 Android 手机内是否可以从模拟器
如何在 ExcelInterop 中查找第一个和最后一个单元格以及 C# 中的图形范围

尝试在 Excel 中绘制一个简单的 csv 文件 1 2 3 4 5 6 7 8 9 如何以编程方式确定绘图范围为 A1 C3 我努力了 var lastCell worksheet Cells get End XlDirection x
if (condition) try {...} 在 C++ 中合法吗？

例如 if true try works as expected with both true and false but is it legal catch 换句话说放置 try 块是否合法紧接在 if 条件之后 a 的语法try块这
使用 while() 和 sleep() 让程序进入睡眠模式的区别

我创建了一个共享对象并从两个不同的程序访问它并测量时间 DATA 数组是两个进程之间的共享对象您没有准确描述如何运行不同版本不同的进程但假设它们是连续的您可能会看到 sleep 的影响当然这取决于具体的实现和硬件但很可能会让您
从 Access 数据库获取数据到 datagridview Vb.Net 时出错

当我单击 datagridview 中的项目以获取更多信息时我遇到问题好的我的代码 Try If DataGridView1 Rows Count 0 Then Return TextBox1 Text String Empty Te
我想要在“drawRect”内进行动画制作，实际上是淡入淡出

有没有办法让drawRect动画化从上一个场景到下一个令人惊讶的是你可以在drawRect中设置动画尝试一下您可以对任何其他属性进行淡入淡出平移或动画处理然而它是从新鲜从空白开始的 DrawRight 是不可见的它发生在
Haste 模块命名冲突：使用 AWS 服务响应本机应用程序（Amplify 项目）

我已经开始使用 React Native 项目之前是使用本机代码我想添加 Amazon Lex 因此请按照链接中的以下步骤操作 https aws amplify github io docs js interactions https
检查 pthread 互斥体是否被锁定或解锁（线程锁定自身之后）

我需要查看 if 语句中互斥体是否被锁定或解锁所以我像这样检查 if mutex id 2 do stuff 但是当我检查 gcc 时出现以下错误 error invalid operands to binary have pthera
如何正确设置树视图行前景色和背景色

我在设置 ttk Treeview 的前景色和背景色时遇到问题我尝试过使用 tag configure 但这似乎也不起作用我有一些模型代码如下我用它来解决这个问题可以更改标题颜色但不能更改行不确定我做错了什么 from tki
Objective c “你忘记嵌套 alloc 和 init 了吗？”

我刚刚开始攀爬 Objective C 学习曲线使用 Nerd Ranch iOS 编程书根据我从其他语言中了解到的有关在一行中嵌套多个执行的信息我认为我可以更改 NSString descriptionString NSStri
返回很大范围内的非重复随机值

我想要一个函数它可以从一组 n 个整数 0 到 n 1 中生成 k 个伪随机值而不重复任何先前的结果 k小于或等于n O n 内存不可接受由于尺寸较大n以及我需要重新洗牌的频率这些是我到目前为止考虑过的方法 Array 通常如果我想

返回很大范围内的非重复随机值

返回很大范围内的非重复随机值 的相关文章

随机推荐

热门标签

返回很大范围内的非重复随机值的相关文章