在 scipy 中创建稀疏矩阵时，覆盖而不是添加重复的三元组

2023-12-25

在 scipy 中，要从三重格式数据（行、列和数据数组）创建稀疏矩阵，默认行为是对所有重复项的数据值求和。我可以更改此行为以覆盖（或不执行任何操作）吗？

例如：

import scipy.sparse as sparse

rows = [0, 0]
cols = [0, 0]
data = [1, 1]
S = sparse.coo_matrix((data, (rows, cols)))

Here, S.todense()等于matrix([[2]])但我希望它是matrix([[1]]).

In the 稀疏.coo_matrix的文档 https://docs.scipy.org/doc/scipy-0.18.1/reference/generated/scipy.sparse.coo_matrix.html，它写着

默认情况下，转换为 CSR 或 CSC 格式时，重复 (i,j) 条目将被汇总在一起。这有利于高效有限元矩阵的构造等。

从该表述看来，除了默认值之外，可能还有其他选项。

我在 scipy github 上看到过关于对这个求和给予更多控制的讨论，但我不知道有任何生产变化。正如文档所示，对重复项求和有一个长期存在的传统。

创建时，coo矩阵不求和；它只是将您的参数分配给它的属性：

In [697]: S = sparse.coo_matrix((data, (rows, cols)))
In [698]: S.data
Out[698]: array([1, 1])
In [699]: S.row
Out[699]: array([0, 0], dtype=int32)
In [700]: S.col
Out[700]: array([0, 0], dtype=int32)

转换为密集（或 csr/csc）确实求和 - 但不会改变S itself:

In [701]: S.A
Out[701]: array([[2]])
In [702]: S.data
Out[702]: array([1, 1])

您可以使用以下命令就地执行求和：

In [703]: S.sum_duplicates()
In [704]: S.data
Out[704]: array([2], dtype=int32)

我不知道有什么方法可以删除重复项或绕过该操作。我可以查一下相关问题。

=================

S.todok()进行就地求和（即改变S）。查看该代码我发现它调用self.sum_duplicates。以下复制了没有总和的情况：

In [727]: dok=sparse.dok_matrix((S.shape),dtype=S.dtype)
In [728]: dok.update(zip(zip(S.row,S.col),S.data))
In [729]: dok
Out[729]: 
<1x1 sparse matrix of type '<class 'numpy.int32'>'
    with 1 stored elements in Dictionary Of Keys format>
In [730]: print(dok)
  (0, 0)    1
In [731]: S
Out[731]: 
<1x1 sparse matrix of type '<class 'numpy.int32'>'
    with 2 stored elements in COOrdinate format>
In [732]: dok.A
Out[732]: array([[1]])

这是字典更新，因此最终值是最后一个重复项。我在其他地方发现dok.update是一种向稀疏矩阵添加值的快速方法。

tocsr本质上就是求和；tolil uses tocsr;所以这todok方法可能是最简单的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scipy

sparsematrix

在 scipy 中创建稀疏矩阵时，覆盖而不是添加重复的三元组的相关文章

Pytorch - 推断线性层 in_features

我正在构建一个玩具模型来获取一些图像并进行分类我的模型看起来像 conv2d gt pool gt conv2d gt linear gt linear 我的问题是当我们创建模型时我们必须计算第一个线性层的大小in features基
当语料库有100亿个独特的DNA序列时，如何使用BK树实现快速模糊搜索引擎？

我正在尝试使用BK tree https news ycombinator com item id 14022424python 中的数据结构用于存储约 100 亿个条目的语料库 1e10 以实现快速模糊搜索引擎一旦我添加超过 1000
TCP打孔问题

我尝试使用 Python 3 中概述的原则为防火墙编写一个基本的 TCP 打孔器本文 http www bford info pub net p2pnat index html 不过我无法连接任何东西这是代码 usr bin pytho
使用 Matplotlib 的范围绘制图像的 3D 轮廓

正如我所介绍的here https stackoverflow com questions 18792624 fits image input to a range in plot python 在二维中我想知道如何缩放要绘制到绘图中
Django“模型”对象不可迭代

我有一张表其中显示了已注册的员工我想根据他们的数据库生成一个简单的 HTML 页面其中包括他们的姓名 id 职称等为此我将一个 id 传递给视图以便它可以获取相应用户的详细信息并向我显示一切正常直到出现错误对象不可迭代下面
使用 argparse 指定默认文件名，但不使用 --help 打开它们？

假设我有一个对文件执行一些操作的脚本它在命令行上获取此文件的名称但如果未提供则默认为已知文件名 content txt 说与蟒蛇的argparse 我使用以下内容 parser argparse ArgumentParser des
自适应支付 API 错误 580001

我正在 python 中向 paypal 自适应支付 API 发出 PAY 请求并收到通用错误 id 580001 没有其他信息 headers API credentials for the API caller business ac
在 python 中使用 subprocess.call 时如何将 stdout 重定向到文件？

我正在从另一个 python 脚本 A 调用一个 python 脚本 B 使用 subprocess call 如何将 B 的标准输出重定向到指定的文件我正在使用 python 2 6 1 传递一个文件作为stdout参数为subproc
使用 matplotlib 设置或固定二元分布值

I ve animated a bivariate gaussian distribution using matplotlib 我已经计算过这个distribution通过调整COV matrix来考虑特定的变量我可以提供有关此过程的更
模拟类：Mock() 还是 patch()？

我在用mock http www voidspace org uk python mock index html使用Python 想知道这两种方法中哪一种更好阅读更Pythonic 方法一只需创建一个模拟对象并使用它代码如下 def
如何打印和显示子进程 stdout 和 stderr 输出而不失真？

也许有人可以帮助我解决这个问题我在 SO 上看到了许多与此类似的问题但没有一个问题同时处理标准输出和标准错误也没有处理像我这样的情况因此出现了这个新问题我有一个 python 函数它打开一个子进程等待它完成然后输出返回代码以
Tkinter 如何根据此组合框自动更新第二个组合框

我在 Tkinter Python 中遇到了组合框更新的问题我有两个组合框组合框A with values A B C and 组合框B 我想要的是当值A在组合框中选择A然后在组合框中B显示值 1 2 3 当值B在组合框中选择A然后在
尝试将 cuda 与 pytorch 一起使用时出现运行时错误 999

我为我的 Geforce 2080 ti 安装了 Cuda 10 1 和最新的 Nvidia 驱动程序我尝试运行一个基本脚本来测试 pytorch 是否正常工作但出现以下错误 RuntimeError cuda runtime erro
Python itertools groupby 中令人不安的奇怪行为/错误？

我在用itertools groupby解析一个短的制表符分隔的文本文件文本文件有几列我想做的就是对具有特定值的所有条目进行分组x在特定的列中下面的代码对名为的列执行此操作name2 寻找变量中的值x 我尝试使用以下方法来做到这一点c
如何连接多个字符串？ [复制]

这个问题在这里已经有答案了如何将 stringList 中的所有字符串合并为一个而不打印它例如 s joinStrings very hot day returns string print s Veryhotday 感觉有点倒退但是
如何使用资源模块来衡量函数的运行时间？

我想使用Python代码测量函数的CPU运行时间和挂钟运行时间此处建议资源模块如何以 Python 代码不是从终端的形式分别测量函数的 CPU 运行时间和挂钟运行时间 https stackoverflow com q 192046
Python 中的颜色处理

对于我的聚类 GUI 我目前对聚类使用随机颜色因为我事先不知道最终会得到多少个聚类在 Python 中这看起来像 import random def randomColor return random random random ra
Python 对列表中的值求和（如果它存在于另一个列表中）

我有一个列表和一组 a list 1 2 2 1 1 1 b list 1 2 我正在寻找对应 b list 中的项目并将它们从 a list 中的值相加以便输出为 1 3 2 1 我尝试过的 sum 0 for i in a list
python 相当于 sed

有没有一种方法无需双循环即可完成以下 sed 命令的操作 Input Time Banana spinach turkey sed i Banana s Toothpaste file Output Time BananaToothpas
混合两个列表的Pythonic方法[重复]

这个问题在这里已经有答案了我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表其中包含两个中的替代元素即 b 1 a 1 b n a n b n 1 以下方法有

随机推荐

如何使用 Selenium RC 检索表列中的文本？

我有一个如下所示的表 table class theClass tr td class anotherClass strong Label1 strong td td Value1a br Value1b br Value1c td tr
如何在列表上进行多次悬停

好吧所以我想知道如何在悬停时选择多个项目例如当我将鼠标悬停在列表上时a强调a并在名单上b 给该列表框添加阴影我尝试对其进行编码但由于某种原因我无法实现多重悬停效果 CSS代码 a hover b background ccc HTM
将button_press_event与matplotlib中的拖动和缩放点击区分开来

我有一个简单的代码显示两个子图并让用户在记录时左键单击第二个子图x y这些点击的坐标问题是单击选择要缩放的区域并拖动子图也被识别为左键单击有没有办法区分并过滤掉这些左键点击 import numpy as np import ma
如果同一个表单上有多个提交按钮，如何使用 onsubmit() 显示确认？
CSS 渗透与 cfinput type="datefield"

我有一个使用多个的表单
如何在 Struts 2 中测试 bean 属性？

我有一堂这样的课 public class Foo public boolean isValid return false 在我的 JSP 文件中我想使用isValid测试条件下的方法
用于安全支付的最佳支付网关和 Rails gems？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在 Ruby on Rails 中开发一个网站来销售有价值的商品我们需要一个非常安全的支付系统
Java - 按行总和对二维数组进行排序

尝试编写一种按行总和递增的顺序交换二维数组的行的方法例如如果我有以下二维数组 int array 4 5 6 3 4 5 2 3 4 我希望它输出一个数组如下所示 2 3 4 3 4 5 4 5 6 方法 a 计算每行的总和并生成总和
单节点集群（minikube）上的 rook ceph 中的 1 pg 规模过小运行状况警告

我正在将 rook ceph 部署到 minikube 集群中一切似乎都正常我向虚拟机添加了 3 个未格式化的磁盘并已连接我遇到的问题是当我运行 ceph status 时我收到一条健康温暖消息告诉我 1 pg 尺寸不足我到底
如何将 vb.net 中日期的空值传递给 sql 存储过程？

我的应用程序是asp net 和vb 在我的页面中我有一个用于传递日期的文本框如果我没有输入日期并单击提交则必须将空值传递给存储过程我尝试了以下代码例如DBNull Value and DateTime MinValue 在这种情
Cocoa 中的同级 NSView z 排序

z 排序如何与 Cocoa 中的兄弟 NSView 一起工作我很困惑因为我在 Apple 的文档和 API 中发现了相互冲突的信息来源注意子视图显然是在其父视图之上呈现的我在这里明确谈论同级视图假设A 是的你可以定义同级的 z
Intellij spring集成流程图

在 Intellij 中我们是否有一个功能可以为各种 Spring 集成通道中的消息事件处理生成流程图给定一个复杂的 spring 集成 XML 配置文件其中包含各种转换器入站出站通道和服务激活器是否有办法以图形方式查看所有这
wrk2 和 Apache Benchmark（即 ab）工具之间有什么区别？

wrk2 和 Apache 的 Benchmark 之间是否有显着差异即ab 用于测试多线程请求如果有的话它们是什么我问这个基于this https stackoverflow com a 56373673 6805866答案因为
如何根据条件相互比较行并仅保留一行

我有如下要求如果存在多于 1 个注释姓名姓氏和门的组并且其中之一包含 NULL 则仅保留具有 Null 注释的记录并丢弃其他记录 IF Null 不是其中之一并且注释包括 NOT AVAILABLE 和 REQUIRES 保留不可
如何使用 Slick 对过滤器的结果进行计数？

我面临一个我想简化的问题很确定事实上我做错了 Wanted 我想计算 id 1 的用户数量在 SQL 语言中我们假设它是这样的 SELECT COUNT FROM users WHERE id 1 Code 我使用的是提升形式的
如何拥有棒棒糖开关按钮

我想为我的应用程序提供棒棒糖样式的切换按钮我怎样才能实现这个按钮使它在旧版本的android上也看起来像这样要在旧版本的 Android 上使用 Lollipop 样式切换按钮您应该在布局 xml 文件中使用 SwitchCompa
将 gcloud 与 Jenkins 结合使用

我一直在尝试编写一个定期轮询 Google Cloud Storage 的脚本当我正常运行它时这工作得很好但是如果我将它作为构建步骤包含在 Jenkins 中它会给出一个403 Forbidden错误这是因为没有gcloud au
如何防止选择后关闭菜单？

我正在使用jQuery 自动完成 http api jqueryui com autocomplete小部件灵感来自这个问题 https stackoverflow com questions 6043506 jquery ui auto
在 Angular 8 中使用 cli 命令添加 Web Worker 后出现错误

Angular 8 为网络工作者添加了更好的支持我没有运气让它发挥作用有人知道我做错了什么吗这是官方指南 https angular io guide web worker我跟着使用此 cli 命令我生成了 Web Worker n
在 scipy 中创建稀疏矩阵时，覆盖而不是添加重复的三元组

在 scipy 中要从三重格式数据行列和数据数组创建稀疏矩阵默认行为是对所有重复项的数据值求和我可以更改此行为以覆盖或不执行任何操作吗例如 import scipy sparse as sparse rows 0 0 co

在 scipy 中创建稀疏矩阵时，覆盖而不是添加重复的三元组

在 scipy 中创建稀疏矩阵时，覆盖而不是添加重复的三元组 的相关文章

随机推荐

热门标签

在 scipy 中创建稀疏矩阵时，覆盖而不是添加重复的三元组的相关文章