如何创建 n 个非零随机小数的 L 个列表，其中每个列表的总和为 1.0？

2024-03-24

寻找一种快速方法来创建 L 数量的 n 个小数列表，其总和为 1。每个数字应该 >= 0.01

期望的输出：

其中 L = 200，n = 6

[0.20, 0.22, 0.10, 0.06, 0.04, 0.38]
[0.32, 0.23, 0.18, 0.07, 0.05, 0.15]
...
# There are 200 of these

其中 L = 200，n = 3

[0.90, 0.10, 0.10]
[0.35, 0.25, 0.30]
...
# There are also 200 of these

我想不出实际解决方案的棘手部分是确保每个列表中没有零。当n达到大量。如何相应地分配值1的片段？

这应该非常快，因为它使用 numpy。

如果它得到任何 0.0，它会自动重复随机化，但这不太可能。 while循环是在OP将非零要求调整到0.01以上之前编写的。要解决此问题，您可以修改 while 块以包含整个后续代码，并以类似于检测零所示的方式计算最后违反任何所需约束的次数。但当 L 与违反约束的概率相比较大时，速度可能会变慢。从某种意义上说，最容易遵守最初的要求>0.0.

经过 while 循环后，L x n 矩阵的每个元素均匀分布在 (0.0,1.0) 上，没有任何 0 或 1。每行相加并用于形成尺度矩阵，然后将矩阵乘以随机矩阵以获得自动总和为 1.0 的行

 import numpy as np
 def random_proportions(L,n):
      zeros = 1
      while zeros>0:
          x = np.random.random(size=(L,n))
          zeros = np.sum(x==0.0)
      sums = x.sum(axis=1)
      scale = np.diag(1.0/sums)
      return np.dot(scale, x)

编辑：上面生成了一个用于缩放的 LxL 矩阵，这是内存效率低下的。 L=10**6之前就会OOM。我们可以通过使用建议的广播标准化程序来解决这个问题这个答案 https://stackoverflow.com/a/8904762/103081

import numpy as np
def random_proportions(L,n):
      zeros = 1
      while zeros>0:
          x = np.random.random(size=(L,n))
          zeros = np.sum(x==0.0)
      sums = x.sum(axis=1).reshape(L,1) # reshape for "broadcasting" effect
      return x/sums

第二个版本将在具有 16GB RAM 的 AMD FX-8150 上在大约 1/3 秒内计算 100 万个大小为 10 的列表：

%timeit l = random_proportions(1000000,10)
1 loops, best of 3: 347 ms per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

如何创建 n 个非零随机小数的 L 个列表，其中每个列表的总和为 1.0？的相关文章

如何在Python的SciPy中更改稀疏矩阵中的元素？

我构建了一个小代码我想用它来解决涉及大型稀疏矩阵的特征值问题它工作正常我现在要做的就是将稀疏矩阵中的一些元素设置为零即最顶行中的元素对应于实现边界条件我可以调整下面的列向量 C0 C1 和 C2 来实现这一点不过我想知道是否有
Mac OS 上的诗歌安装失败，显示“should_use_symlinks”

我正在尝试使用以下命令安装诗歌 curl sSL https install python poetry org python3 但它失败了但有以下例外例外此版本的 python 无法在不使用符号链接的情况下创建 venvs 下面是详
Python 3 os.urandom

在哪里可以找到完整的教程或文档os urandom 我需要获得一个随机 int 来从 80 个字符的字符串中选择一个字符如果你只需要一个随机整数你可以使用random randint a b 来自随机模块 http docs pytho
用缺失的日期填充其他列 Nan Pandas DataFrame

我实际上是从几个 Excel 文件中提取数据来监控我的每日卡路里摄入量我设法使用列表理解来生成日期我尝试使用合并或连接但它不起作用 ValueError 您正在尝试合并对象和 float64 列 date list 2021 05 2
删除 Django 1.7 中的应用程序（和关联的数据库表）

是否可以使用 Django 1 7 迁移来完全删除卸载应用程序及其所有跟踪主要是其所有数据库表如果没有在 Django 1 7 中执行此操作的适当方法是什么 python manage py migrate
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确？

在 OS X 和 Python 中处理 Unicode 文件名有点困难我试图在代码中稍后使用文件名作为正则表达式的输入但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同采取以下代码 usr b
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
如果未引发异常，则通过 Python 单元测试

在Python中unittest框架是否有一种方法可以在未引发异常的情况下通过单元测试否则会因 AssertRaise 而失败如果我正确理解你的问题你could做这样的事情 def test does not raise on va
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
在 matplotlib 中的极坐标图上移动径向刻度标签

From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
Django 的 request.FILES 出现 UnicodeDecodeError

我在视图调用中有以下代码 def view request body u for filename f in request FILES items body body Filename filename n f read n 在某些情况下
使用 python 绘制正值小提琴图

我发现小提琴图信息丰富且有用我使用 python 库 seaborn 然而当应用于正值时它们几乎总是在低端显示负值我发现这确实具有误导性尤其是在处理现实数据集时在seaborn的官方文档中https seaborn pydata
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
Python：IndexError：修改代码后列表索引超出范围

我的代码应该提供以下格式的输出我尝试修改代码但我破坏了它 import pandas as pd from bs4 import BeautifulSoup as bs from selenium import webdriver im
将seaborn.palplot轴添加到现有图形中以可视化不同调色板

将seaborn人物添加到子图中是usually https seaborn pydata org examples cubehelix palette html创建图形时通过传递 ax 来完成例如 sns kdeplot x y cma
当数据库不是 Django 模型时，是否可以使用数据库中的表？

是否可以从应用程序数据库中的表获取查询集该表不是应用程序中的模型如果我有一个不是名为 cartable 的模型的表从概念上讲我想这样做 myqueryset cartable objects all 有没有相对简单的方法来做到这一点
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408

随机推荐

删除 javascript 字符串中的元音变音或特殊字符

以前从未在 javascript 字符串中使用变音符号或特殊字符我的问题是如何删除它们例如我在 javascript 中有这个 var oldstr Bayern M nchen var str oldstr split join 结果
PurgeCSS 不会从 NextJS 项目中删除未使用的 CSS

我正在尝试使用 PurgeCSS 从我的 NextJS 项目中删除未使用的 css 然而我很难将 PurgeCSS 最基本的集成到我的项目中来工作我正在使用这个文档 https www purgecss com guides next
以编程方式清除 win 7 中的图标缓存 - 使用 C# 或 Visual Basic 执行 ie4uinit.exe-ClearIconCache

我们更改了 WPF 应用程序的徽标图标然后更改了主可执行文件的图标在我的 Win 7 电脑上刷新图标缓存时出现问题主可执行文件的桌面快捷方式以及可执行文件图标的预览在 Windows 资源管理器中仍然显示旧图标即使重新启动系统问
Scala：将数组放入集合或映射中的轻量级方法

Since 不适用于数组我无法有效地创建一组数组或带有数组键的映射我宁愿不承受将数组转换为向量或列表或其他东西的性能损失是否有一种轻量级的方法来定义数组上的自然比较和哈希码以便我可以将它们放在集合中 Use WrappedArra
异步 CMIS 客户端：与 OpenCMIS 并行下载或上传多个文件

The OpenCMIS 0 14 的变更日志 https www mail archive com announce apache org msg03240 html says 客户端添加了对异步操作的支持图书馆作为 CMIS 客户端
L2 逐出时从 L1 缓存逐出缓存

我有一个关于内存系统遵循的策略的基本问题考虑具有私有 L1 和 L2 缓存的核心在二级缓存之后我们有一个总线一致性流量在该总线上运行现在如果地址 X 的缓存线从二级缓存中逐出是否有必要从一级缓存中逐出该地址驱逐的原因可能是它
从 Node.JS 调用 Haskell

我想从 Node js 对 Haskell 代码进行 RPC 调用 Node 和 Haskell 都有哪些库我只能找到 XML RPC 和 Zeromq 但它们似乎不稳定对于 Haskell 端的 xml rpc haxr 库已经存在很
MySQL/Python -- 提交的更改未出现在循环中

使用 MySQL Connector Python 我有一个循环每 2 秒检查一次值是否发生变化没有所有的内容这是循环打印是为了测试目的 try while True request database get row table s
将文件从请求移动或复制到多个位置

我正在使用 Laravel 并接受输入和文件上传此页面接受用户想要对订单进行的更改最终目标是获取此输入并将其应用于多个订单我可以重复使用每个订单的输入但是对于我来说将该请求中的文件复制到多个目录的好方法是什么例如如文档中所示
SQL Server 中的条件条件

我有一个包含 3 个值的组合框 All Failed Completed ALL 加载所有行无条件 Failed and Completed 在状态列上加载条件 ALL SELECT FROM tbl Location 失败和完成 S
如何在不使用 conda 的情况下从源代码安装 Bob

Bob https www idiap ch software bob 推荐其用户install https www idiap ch software bob install它的包使用conda 但我不想用conda 我如何从源代码安装它
如何使用基于单选按钮输入的jquery跳过隐藏输入字段的验证（删除必需属性）

使用 bootstrap 有一个简单的形式为了进行验证我使用了必需的引导程序效果很好但在我的表单中我根据单选按钮隐藏带有查询的输入字段我的问题是提交表单需要隐藏的输入字段我怎样才能跳过这个我不想验证隐藏的输入 Error
GCC 编译器选项 -wno-four-char-constants 和 -wno-multichar

找不到任何有关的文档 Wno four char constants 但是我怀疑它类似于 Wno multichar 我对么它们是相关的但不是同一件事编译与 Wall pedantic标志分配 int i abc 产生警告多字符
socket.io，“访问控制允许来源”错误

我已经设置了一个带有套接字 io 转动的节点服务器并尝试通过另一台服务器连接到它然而不同计算机上的某些浏览器给我这个错误并使其始终重新连接 XMLHttpRequest 无法加载当请求的凭据模式为 include 时响应中 Ac
jQuery .data() 与 HTML5 data-XXX 性能对比

我发现了这个测试http jsbin com ekofa 2 http jsbin com ekofa 2这表明 HTML5 data XXX 比 jQuery 更快 data 我正在启动一个项目需要将大量小数据片段放置在 HTML 元素
geom_abline 似乎不尊重facet_grid [ggplot2]中的组

只是想了解 geom abline 如何与 ggplot 中的构面一起使用我有一个学生考试成绩的数据集这些位于具有 4 列的数据表 dt 中 student unique student ID cohort grouping facto
当没有其他窗口打开时，System.Windows.Window.ShowDialog() 出现意外行为。知道为什么吗？

当我的 WPF MVVM 应用程序尝试在主窗口启动之前显示两个连续的错误对话框窗口时我发现了这一点经过一些努力确定第一个窗口后应用程序进入循环第二个错误对话框从未出现我解决了这个问题但我希望有人能启发我为什么会发生这种情况看
在 Helm Charts 中添加 Nginx-Ingress/Certmanager 作为依赖项

我有一个带有 nginx ingress certmanager 和一个应用程序的 Kubernetes 集群 Azure 我想知道是否有一种方法可以将整个系统作为一个包这样如果集群出现任何问题它会更容易旋转再上一个我的主要想法是自动
如何在 Heroku 上使用 postgres 扩展？以及如何处理他们的迁移？

我有一个包含 pg search 和queue classic gems 的Rails 应用程序这两个都使用 PostgreSQL 扩展例如 unaccent pg trgm 和 ps something something 抱歉不是
如何创建 n 个非零随机小数的 L 个列表，其中每个列表的总和为 1.0？

寻找一种快速方法来创建 L 数量的 n 个小数列表其总和为 1 每个数字应该 gt 0 01 期望的输出其中 L 200 n 6 0 20 0 22 0 10 0 06 0 04 0 38 0 32 0 23 0 18 0 07 0 0

如何创建 n 个非零随机小数的 L 个列表，其中每个列表的总和为 1.0？

如何创建 n 个非零随机小数的 L 个列表，其中每个列表的总和为 1.0？ 的相关文章

随机推荐

热门标签

如何创建 n 个非零随机小数的 L 个列表，其中每个列表的总和为 1.0？的相关文章