在 numpy 数组求和中将 nan 视为零，除了所有数组中的 nan

2023-11-27

我有两个 numpy 数组 NS、EW 来总结。他们每个人在不同的位置都有缺失值，比如

NS = array([[  1.,   2.,  nan],
       [  4.,   5.,  nan],
       [  6.,  nan,  nan]])
EW = array([[  1.,   2.,  nan],
       [  4.,  nan,  nan],
       [  6.,  nan,   9.]]

如何以 numpy 方式执行求和运算，如果一个数组在某个位置有 nan，则将 nan 视为零，如果两个数组在同一位置都有 nan，则保留 nan。

我期望看到的结果是

SUM = array([[  2.,   4.,  nan],
           [  8.,  5.,  nan],
           [  12.,  nan,   9.]])

当我尝试时

SUM=np.add(NS,EW)

它给了我

SUM=array([[  2.,   4.,  nan],
       [  8.,  nan,  nan],
       [ 12.,  nan,  nan]])

当我尝试时

SUM = np.nansum(np.dstack((NS,EW)),2)

它给了我

SUM=array([[  2.,   4.,   0.],
       [  8.,   5.,   0.],
       [ 12.,   0.,   9.]])

当然，我可以通过进行元素级操作来实现我的目标，

for i in range(np.size(NS,0)):
    for j in range(np.size(NS,1)):
        if np.isnan(NS[i,j]) and np.isnan(EW[i,j]):
            SUM[i,j] = np.nan
        elif np.isnan(NS[i,j]):
            SUM[i,j] = EW[i,j]
        elif np.isnan(EW[i,j]):
            SUM[i,j] = NS[i,j]
        else:
            SUM[i,j] = NS[i,j]+EW[i,j]

但它很慢。所以我正在寻找一个更numpy的解决方案来解决这个问题。

提前感谢您的帮助！

方法#1：一种方法是np.where -

def sum_nan_arrays(a,b):
    ma = np.isnan(a)
    mb = np.isnan(b)
    return np.where(ma&mb, np.nan, np.where(ma,0,a) + np.where(mb,0,b))

样本运行 -

In [43]: NS
Out[43]: 
array([[  1.,   2.,  nan],
       [  4.,   5.,  nan],
       [  6.,  nan,  nan]])

In [44]: EW
Out[44]: 
array([[  1.,   2.,  nan],
       [  4.,  nan,  nan],
       [  6.,  nan,   9.]])

In [45]: sum_nan_arrays(NS, EW)
Out[45]: 
array([[  2.,   4.,  nan],
       [  8.,   5.,  nan],
       [ 12.,  nan,   9.]])

方法#2：可能是更快的一个混合boolean-indexing -

def sum_nan_arrays_v2(a,b):
    ma = np.isnan(a)
    mb = np.isnan(b)
    m_keep_a = ~ma & mb
    m_keep_b = ma & ~mb
    out = a + b
    out[m_keep_a] = a[m_keep_a]
    out[m_keep_b] = b[m_keep_b]
    return out

运行时测试 -

In [140]: # Setup input arrays with 4/9 ratio of NaNs (same as in the question)
     ...: a = np.random.rand(3000,3000)
     ...: b = np.random.rand(3000,3000)
     ...: a.ravel()[np.random.choice(range(a.size), size=4000000, replace=0)] = np.nan
     ...: b.ravel()[np.random.choice(range(b.size), size=4000000, replace=0)] = np.nan
     ...: 

In [141]: np.nanmax(np.abs(sum_nan_arrays(a, b) - sum_nan_arrays_v2(a, b))) # Verify
Out[141]: 0.0

In [142]: %timeit sum_nan_arrays(a, b)
10 loops, best of 3: 141 ms per loop

In [143]: %timeit sum_nan_arrays_v2(a, b)
10 loops, best of 3: 177 ms per loop

In [144]: # Setup input arrays with lesser NaNs
     ...: a = np.random.rand(3000,3000)
     ...: b = np.random.rand(3000,3000)
     ...: a.ravel()[np.random.choice(range(a.size), size=4000, replace=0)] = np.nan
     ...: b.ravel()[np.random.choice(range(b.size), size=4000, replace=0)] = np.nan
     ...: 

In [145]: np.nanmax(np.abs(sum_nan_arrays(a, b) - sum_nan_arrays_v2(a, b))) # Verify
Out[145]: 0.0

In [146]: %timeit sum_nan_arrays(a, b)
10 loops, best of 3: 69.6 ms per loop

In [147]: %timeit sum_nan_arrays_v2(a, b)
10 loops, best of 3: 38 ms per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

NaN

missingdata

在 numpy 数组求和中将 nan 视为零，除了所有数组中的 nan 的相关文章

python 可以检测它运行在哪个操作系统下吗？

python 可以检测操作系统然后为文件系统构建 if else 语句吗我需要将 Fn 字符串中的 C CobaltRCX 替换为 FileSys 字符串 import os path csv from time import strf
Matplotlib 标准化颜色条 (Python)

我正在尝试使用 matplotlib 当然还有 numpy 绘制轮廓图它有效它绘制了它应该绘制的内容但不幸的是我无法设置颜色条范围问题是我有很多图并且需要所有图都具有相同的颜色条相同的最小值和最大值相同的颜色我复制并粘贴了在
在 Python 中使用 XPath 和 LXML

我有一个 python 脚本用于解析 XML 并将某些感兴趣的元素导出到 csv 文件中我现在尝试更改脚本以允许根据条件过滤 XML 文件等效的 XPath 查询将是 DC Events Confirmation contains T
如何更改充当按钮的范围的文本

我正在为自定义 Web 应用程序编写自动化测试我遇到了无法更改跨度文本的问题我尝试过使用 driver execute script 但没有运气如果我更好地了解 javascript 这确实会有帮助据我所知您无法单击跨度并且列表
用 Python 编写一个无操作或虚拟类

假设我有这样的代码 foo fooFactory create 由于种种原因 fooFactory create 可能无法创建实例Foo 如果可以的话我想要fooFactory create 返回一个虚拟无操作对象这个对象应该是完全惰性
如何用 python 和 sympy 解决多元不等式？

我对使用 python 和 Sympy 还很陌生并且遇到了使用 sympy 解决多元不等式的问题假设我的文件中有很多函数如下所示 cst sqrt x 2 cst exp sqrt cst x 1 4 log log sqrt cst
NLTK、搭配问题：需要解包的值太多（预期为 2）

我尝试使用 NLTK 检索搭配但出现错误我使用内置的古腾堡语料库 I wrote alice nltk corpus gutenberg fileids 7 al nltk corpus gutenberg words alice al
在 python-docx 中搜索和替换

我有一个包含以下字符串的文档模板你好我的名字是鲍勃鲍勃是一个很好的名字我想使用 python docx 打开此文档并使用查找和替换方法如果存在来更改每个字符串 Bob gt Mark 最后我想生成一个新文档其中包含字符
无法包含外部 pandas 文档 Pycharm v--2018.1.2

我无法包含外部 pandas 文档Pycharm v 2018 1 2 例如 numpy gt http docs scipy org doc numpy reference generated module name element na
python ttk treeview：如何选择并设置焦点在一行上？

我有一个 ttk Treeview 小部件其中包含一些数据行如何设置焦点并选择突出显示指定项目 tree focus set 什么也没做 tree selection set 0 抱怨尽管小部件明显填充了超过零个项目但未找到项目
VSCode pytest 测试发现失败

Pytest 测试发现失败用户界面指出 Test discovery error please check the configuration settings for the tests 输出窗口显示 Test Discovery fa
行为：如何从另一个文件导入步骤？

我刚刚开始使用behave http pythonhosted org behave 一个Pythonic BDD框架使用小黄瓜语法 http docs behat org guides 1 gherkin html 行为需要一个特征例
反加入熊猫

我有两个表我想附加它们以便仅保留表 A 中的所有数据并且仅在其键唯一时添加表 B 中的数据键值在表 A 和 B 中是唯一的但在某些情况下键将出现在表 A 和 B 中我认为执行此操作的方法将涉及某种过滤联接反联接以获取表 B
字典的嵌套列表

我正在尝试创建dict通过嵌套list groups Group1 A B Group2 C D L y x 0 for y in x if y x 0 for x in groups d k v for d in L for k v in
使用循环将对象添加到列表（python）

我正在尝试使用 while 循环将对象添加到列表中基本上这就是我想做的 class x pass choice raw input pick what you want to do while choice 0 if choice 1 E
Python Flask 是否定义了路由顺序？

在我看来我的设置类似于以下内容 app route test def test app route
WindowsError：[错误 5] 访问被拒绝

我一直在尝试终止一个进程但我的所有选项都给出了 Windows 访问被拒绝错误我通过以下方式打开进程一个python脚本 test subprocess Popen sys executable testsc py 我想杀死那个进程
Plotly：如何避免巨大的 html 文件大小

我有一个 3D 装箱模型它使用绘图来绘制输出图我注意到绘制了 600 个项目生成 html 文件需要很长时间文件大小为 89M 这太疯狂了我怀疑可能存在一些巨大的重复或者是由单个项目的 add trace 方法引起的阴谋为
Google App Engine 中的自定义身份验证

有谁知道或知道我可以在哪里学习如何使用 Python 和 Google App Engine 创建自定义身份验证流程我不想使用 Google 帐户进行身份验证并且希望能够创建自己的用户如果不是专门针对 Google App Engin
将此 MATLAB 代码转换为 Python 时我做错了什么？

我正在努力将生成波形的 MATLAB 代码转换为 Python 就上下文而言这是原子力显微镜带激发响应的模拟与代码错误无关在 MATLAB 中从 r vec 生成的图形与我在 Python 中生成的图形不同我是否正确地将 MATLA

随机推荐

在折叠选项卡中加载时，Slick 轮播的宽度为 0px

当在折叠内容中加载光滑滑块时在本例中为 Angular bootstrap 折叠插件 slick track div 的宽度为 0px 导致滑块尝试将所有幻灯片叠放在一起当按箭头查看下一张幻灯片时幻灯片将恢复正常如果我选择滑块并想要
为什么带有约束的通用扩展方法不被识别为扩展方法？ [复制]

这个问题在这里已经有答案了可能的重复通用扩展方法没有类型推断考虑两种方法 public static IEnumerable
AngularJS ng-click 和 href 锚点

如果锚点上同时存在 ng click 和 href 则 ng click 不起作用如果可能的话我希望两者都能工作转到一条路线然后运行一个函数我的用例是我打开了一个带有链接面板的抽屉当转到链接时我想关闭抽屉有什么简单的方法可以让
F# - 公共文字

有没有办法在类型上定义公共文字 C 中的 public const 显然类型中的 let 绑定必须是私有的并且 Literal 属性不能应用于成员使用属性这会实现您正在寻找的魔力此外将文字属性放在诸如字符串之类的值上使其可以在
注册插件和/或工作流程时出错。插件程序集不包含所需的类型或程序集内容无法更新

我使用 CRM 2011 开发人员工具包在 Visual Studio 2010 中实现了一个自定义工作流程它与系统生成的命名空间一起正常工作但是当我更改项目的名称空间时它会抛出错误注册插件和或工作流程时出错插件程序集不包含所
如何在 Java 中实际解析 YAML 中的值？ [复制]

这个问题在这里已经有答案了我有一个 YAML 文件我将其用作配置文件看起来是这样的 tests category some category test name hello key1 value1 key2 value2 name h
Docker 上的多模块 Maven 项目

我有一个多模块 Maven 项目其中单个模块都是包含自己的 Dockerfile 的可运行微服务应用程序因此在生产中每个模块都将是一个容器化应用程序包含子模块的父项目仅包含父 pom xml 和 docker compose yml
如何按属性值（日期）对包含 NSManagedObject 子类实例的 swift 数组进行排序

我正在尝试对数组进行排序如下所示这个问题的公认答案但我遇到了 Isuru 在该答案的评论中提到的问题也就是说应按实体的日期属性对数组进行排序的代码会导致编译器抱怨找不到成员日期这是描述实体的 NSManagedObject
在控制面板 -> 声音中添加我自己的应用程序事件

我刚刚读过这个问题我真的很喜欢这个答案到这个问题自然地一个有趣的问题出现在我的脑海中如何在控制面板 gt 声音和音频设备 gt 声音 gt 程序事件中添加我自己的事件我自己的应用程序我认为也应该在这里回答的另一个相关问题是当我的
如何定义模板类的 static const 变量

我正在尝试创建一个具有预定义的向上向右和向前静态常量的向量类因为这些常量在所有情况下都应该相同这应该如何定义这是否可能我正在尝试做这样的事情 template
为什么我们将命令名称作为路径和参数列表两次传递给 execve？

我有一个由我的教授编写的程序可以打印工作目录 pwd 通过使用execve 但我不明白这些参数 pid t pid fork if pid lt 0 perror NULL else if pid 0 char argv pwd NULL
是否需要分别关闭每个嵌套的OutputStream和Writer？

我正在写一段代码 OutputStream outputStream new FileOutputStream createdFile GZIPOutputStream gzipOutputStream new GZIPOutputStre
当你在 Clojure REPL 中输入“hello, world”时，为什么它显示“nil”？

我将其输入 Clojure REPL 使用 enclojure Netbeans 插件 user gt hello world hello world nil 零是什么意思 Clojure 中的每个函数或宏调用都会返回一个值甚至是if语句
Rcpparmadillo：无法调用 Fortran 例程“dgebal”？

我需要使用一个名为的 Fortran 例程dgebal 文档here 在我的 Rcpparmadillo 代码中我已包含以下标题 include
MySQL 中两个日期时间之间的减号运算符的行为是什么？

到日期时间之间的差异是它们之间的秒数这似乎仅在日期时间发生在同一小时内时才有效为什么是这样 mysql gt update events set created at 2011 04 13 15 59 59 fulfilled at
C++11 和 C++03 之间的库兼容性

我正在使用 g 4 7 和 std c 0x 在 C 11 中开发应用程序我的应用程序链接到一些使用 g 4 7 编译的共享库但没有 std c 0x 指令不幸的是没有任何作用这意味着我在使用外部库类和方法时有一些奇怪的行为当然
如何获得触发器来根据 DataContext 属性更改 TextBlock 的颜色？

为什么以下代码会出现运行时错误 Triggers 集合的成员必须是 EventTrigger 类型但 EventTrigger 元素没有 Binding 属性那么如何根据 DataContext 属性更改 TextBlock 的颜色呢
在javascript中获取div的高度

我有一个 div css div width 200px height auto markup div Text is editable div 现在我应该做什么来访问height numeric value 上面的div在javascri
RESTful HTTP 响应代码

我正在开发一个简单的 RESTful API 并且非常喜欢它的简约风格但我不确定各种情况下正确的 HTTP 响应代码查询格式不正确正确形成的查询引用了不存在的资源资源已成功删除资源编辑成功我目前认为 1 会是403 Forbid
在 numpy 数组求和中将 nan 视为零，除了所有数组中的 nan

我有两个 numpy 数组 NS EW 来总结他们每个人在不同的位置都有缺失值比如 NS array 1 2 nan 4 5 nan 6 nan nan EW array 1 2 nan 4 nan nan 6 nan 9 如何以 nu

在 numpy 数组求和中将 nan 视为零，除了所有数组中的 nan

在 numpy 数组求和中将 nan 视为零，除了所有数组中的 nan 的相关文章

随机推荐

热门标签