2D ID 数组和 1D 权重的加权 numpy bincount

2024-02-12

我使用 numpy_indexed 来应用矢量化 numpy bincount，如下所示：

import numpy as np
import numpy_indexed as npi
rowidx, colidx = np.indices(index_tri.shape)
(cols, rows), B = npi.count((index_tri.flatten(), rowidx.flatten()))

where index_tri是以下矩阵：

index_tri = np.array([[ 0,  0,  0,  7,  1,  3],
       [ 1,  2,  2,  9,  8,  9],
       [ 3,  1,  1,  4,  9,  1],
       [ 5,  6,  6, 10, 10, 10],
       [ 7,  8,  9,  4,  3,  3],
       [ 3,  8,  6,  3,  8,  6],
       [ 4,  3,  3,  7,  8,  9],
       [10, 10, 10,  5,  6,  6],
       [ 4,  9,  1,  3,  1,  1],
       [ 9,  8,  9,  1,  2,  2]])

然后我将分箱值映射到以下初始化矩阵的相应位置m:

m = np.zeros((10,11))
m 
array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]])

m[rows, cols] = B
m
array([[3., 1., 0., 1., 0., 0., 0., 1., 0., 0., 0.],
       [0., 1., 2., 0., 0., 0., 0., 0., 1., 2., 0.],
       [0., 3., 0., 1., 1., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 1., 2., 0., 0., 0., 3.],
       [0., 0., 0., 2., 1., 0., 0., 1., 1., 1., 0.],
       [0., 0., 0., 2., 0., 0., 2., 0., 2., 0., 0.],
       [0., 0., 0., 2., 1., 0., 0., 1., 1., 1., 0.],
       [0., 0., 0., 0., 0., 1., 2., 0., 0., 0., 3.],
       [0., 3., 0., 1., 1., 0., 0., 0., 0., 1., 0.],
       [0., 1., 2., 0., 0., 0., 0., 0., 1., 2., 0.]])

然而，这考虑到每个值的权重index_tri每列是 1。现在，如果我有一个权重数组，请提供每列相应的权重值index_tri而不是 1：

weights = np.array([0.7, 0.8, 1.5, 0.6, 0.5, 1.9])

如何应用加权 bincount 以便我的输出矩阵m变成如下：

array([[3., 0.5, 0., 1.9, 0., 0., 0., 0.6, 0., 0., 0.],
       [0., 0.7, 2.3, 0., 0., 0., 0., 0., 0.5, 2.5, 0.],
       [0., 4.2, 0., 0.7, 0.6, 0., 0., 0., 0., 0.5, 0.],
       [0., 0., 0., 0., 0., 0.7, 2.3, 0., 0., 0., 3.],
       [0., 0., 0., 2.4, 0.6, 0., 0., 0.7, 0.8, 1.5, 0.],
       [0., 0., 0., 2.3, 0., 0., 2.4, 0., 1.3, 0., 0.],
       [0., 0., 0., 2.3, 0.7, 0., 0., 0.6, 0.5, 1.9, 0.],
       [0., 0., 0., 0., 0., 0.6, 2.4, 0., 0., 0., 3.],
       [0., 3.9, 0., 0.6, 0.7, 0., 0., 0., 0., 0.8, 0.],
       [0., 0.6, 2.4, 0., 0., 0., 0., 0., 0.8, 2.2, 0.]])

任何想法？

通过使用for循环和 numpybincount()我可以按如下方式解决：

for i in range(m.shape[0]):
   m[i, :] = np.bincount(index_tri[i, :], weights=weights, minlength=m.shape[1])

我正在尝试调整提供的矢量化解决方案here https://stackoverflow.com/a/60046212/1476932 and here https://stackoverflow.com/a/46256361/1476932分别但我不知道是什么ix2D变量对应于第一个链接中的变量。如果可能的话，有人可以详细说明一下吗？

更新（解决方案）：

基于下面的 @Divakar 解决方案，这是一个更新版本，其中需要一个额外的输入参数，以防您的索引输入矩阵不覆盖输出初始化矩阵的整个范围：

    def bincount2D(id_ar_2D, weights_1D, sz=None):
        # Inputs : 2D id array, 1D weights array

        # Extent of bins per col
        if sz == None:
            n = id_ar_2D.max() + 1
            N = len(id_ar_2D)
        else:
            n = sz[1]
            N = sz[0]

        # add offsets to the original values to be used when we apply raveling later on
        id_ar_2D_offsetted = id_ar_2D + n * np.arange(N)[:, None]

        # Finally use bincount with those 2D bins as flattened and with
        # flattened b as weights. Reshaping is needed to add back into "a".
        ids = id_ar_2D_offsetted.ravel()
        W = np.tile(weights_1D, N)
        return np.bincount(ids, W, minlength=n * N).reshape(-1, n)

灵感来自this post https://stackoverflow.com/a/46256361/ -

def bincount2D(id_ar_2D, weights_1D):
    # Inputs : 2D id array, 1D weights array
    
    # Extent of bins per col
    n = id_ar_2D.max()+1
    
    N = len(id_ar_2D)
    id_ar_2D_offsetted = id_ar_2D + n*np.arange(N)[:,None]
    
    # Finally use bincount with those 2D bins as flattened and with
    # flattened b as weights. Reshaping is needed to add back into "a".
    ids = id_ar_2D_offsetted.ravel()
    W = np.tile(weights_1D,N)
    return np.bincount(ids, W, minlength=n*N).reshape(-1,n)

out = bincount2D(index_tri, weights)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

binning

weighted

numpyindexed

2D ID 数组和 1D 权重的加权 numpy bincount 的相关文章

如何有效地从连续字符串中提取文字单词？ [复制]

这个问题在这里已经有答案了可能的重复如何将没有空格的文本拆分为单词列表 https stackoverflow com questions 8870261 how to split text without spaces into li
CVXPY 二次规划； ArpackNoConvergence 错误

我尝试使用 Python 包 CVXPY 来解决第一种形式的凸二次规划问题 https www cvxpy org examples basic quadratic program html https www cvxpy org exam
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何忽略传递给函数的意外关键字参数？

假设我有一些功能 f def f a None print a 现在如果我有一本字典比如dct a Foo 我可以打电话f dct 并得到结果Foo打印但是假设我有一本字典dct2 a Foo b Bar 如果我打电话f dct2
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
重新索引错误没有意义

I have DataFrames大小在 100k 到 2m 之间我正在处理这个问题的框架是如此之大但请注意我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的所以它
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
部署 Flask 应用程序时如何检测额外文件的更改并重新加载应用程序？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 Flask 中构建了一个小型 Web 应用程序并尝试将其部署在 Pythonanywhere 上在开发过程中

随机推荐

如何在 SQL Server 2005 表的 NTEXT 字段中查找 Unicode/非 ASCII 字符？

我有一张有几千行的表描述和摘要字段是 NTEXT 有时其中包含非 ASCII 字符如何找到所有包含非 ASCII 字符的行我有时会使用这个 cast 语句来查找奇怪的字符 select from table where table
Azure 负载均衡器 v2 中的“入站 NAT 规则”与“负载均衡规则”有何不同

有人可以向我解释一下负载均衡器 v2 后端在这两种情况下实际发生的情况吗应用入站 NAT 规则应用负载平衡规则当您有 1 台后端服务器或您知道要访问哪台后端服务器时您将使用 NAT 规则当您想要将负载均衡器分配到多个后端服务器时
在 Erlang 中，record_info 和 tuple_to_list 返回相同的键顺序吗？

即如果我有记录 record one frag left Is record info fields one 即将always return frag left Is tl tuple to list one frag Frag left
C# 创建渐变图像

如何使用 C 创建渐变图像具有给定的高度和宽度起始颜色和结束颜色有人有一个简单的示例片段吗谢谢你您可以使用线性渐变画笔 http msdn microsoft com en us library system drawing dr
QListWidget 上的 QTest::mouseClick 问题

我正在尝试使用 QTest 进行一些测试我有一个 QListWidget 我想单击它来进行选择但点击后没有选择任何内容有人有什么想法吗这是我的测试课 void TestGui List TestDialog dlg dlg sho
div 中的垂直对齐图像[重复]

这个问题在这里已经有答案了我对 div 中的图像垂直对齐有问题 img thumb float left height 120px margin bottom 5px margin left 9px position relative w
0xDEADBEEF 相当于 64 位开发？

对于32位系统无论是Linux Mac OS http en wikipedia org wiki Mac OS或者视窗 PowerPC http en wikipedia org wiki PowerPC或 x86 我已经初始化了指针
如何使用 JAXB 将丢失的元素解组到空对象中

我在 Intellij IDEA org codehaus mojo jaxb2 maven plugin 1 6 中使用 JAXB Maven 插件来生成给定的 xsd 文件到对象 xsd 相当大包含很多类型其中大部分是可选的现在
如何将 TextMate 中的一行发送到在终端窗口中运行的 irb 进程？

我经常在打开 TextMate 窗口并在其旁边的终端窗口中运行 irb 进程的情况下进行编码我希望能够在 TextMate 中按下一个按键序列该序列执行以下操作复制当前选择如果没有则复制当前行将其粘贴到运行 irb 的最上面的终
PDO 识别缺失的绑定变量

使用 PDO 的最繁琐的事情之一是它说缺少一些变量 PDOStatement execute SQLSTATE HY093 参数数量无效绑定变量的数量与标记数量不匹配但没有说明是哪些有什么解决办法可以识别它们吗例如 sql SELE
Git 和日志顺序

我试图从 git log 输出创建线性顺序但我所有的尝试都失败了我需要做的是将提交映射到包含该提交的下一个版本我跑不了 git tag contains
防止 Swift 函数指针中的保留循环

在 Swift 中将函数作为对象传递时如何防止保留循环想象一下你有一个像这样的数据源对象 import UIKit class MagicDataSource NSObject UITableViewDatasource deinit p
R 按行填充数组

我想做一些矩阵运算最好使用 3 维或更高维数组如果我想填matrices按行有一个参数拜罗 TRUE 但是没有这样的选项来创建填充多维array 我能够实现它的唯一方法是使用aperm转置由列填充的数组例如 arr 1 lt
VS2012 和 Wix 3.6 - 使用我的应用程序安装 .Net 4.5

我对安装程序世界非常陌生我已成功为我的应用程序制作了 msi 它正在使用快捷方式构建并且也可以正确卸载我的下一个目标是将 Net 4 5 与安装程序打包在一起并在安装我的应用程序之前安装它我还有一个需要安装的第三方应用程序它被打
将 Visual Studio 2010 RC 升级到 RTM/零售版/最终版

我的计算机上安装了 VS2010 的 RC 版本现在 RTM 版本已经发布我想升级除了主要的 Visual Studio 包和 NET Framework 4 之外在安装 RTM 版本之前我还应该删除哪些内容以尽量减少潜在的损坏
Vue 3 CLI - 如何为 Object.entries 添加 babel polyfill

我有一个依赖项 vue2 google maps 它导致我的 Vue 应用程序在旧版浏览器中出现问题引发错误Object entries 正在阅读有关 polyfill 的 Vue CLI 文档 https cli vuejs org g
如何使用最新的apache poi设置粗体字体？

我用的是最新的apache poi
使用带有 AVR 微控制器的旋转编码器

我无法让旋转编码器与 AVR 微控制器正常工作编码器是机械式的ALPS编码器 http no farnell com 1520815 passives product us0 sku alps ec12d1524401 我正在使用亚特米加
如何在 ASP.Net Core 1.1MVC 中确认电话号码

我不知道如何在 asp net core 1 1 中进行电话号码确认身份服务配置包含需要确认电子邮件和或电话号码的显式选项可以通过以下方式完成 services AddIdentity
2D ID 数组和 1D 权重的加权 numpy bincount

我使用 numpy indexed 来应用矢量化 numpy bincount 如下所示 import numpy as np import numpy indexed as npi rowidx colidx np indices ind

2D ID 数组和 1D 权重的加权 numpy bincount

2D ID 数组和 1D 权重的加权 numpy bincount 的相关文章

随机推荐

热门标签