使用xarray，如何在多维数据集上并行化一维操作？

2024-04-01

我有一个 4D xarray 数据集。我想在特定维度（此处为时间）上的两个变量之间进行线性回归，并将回归参数保留在 3D 数组中（其余维度）。我设法通过使用此串行代码获得了我想要的结果，但速度相当慢：

# add empty arrays to store results of the regression
res_shape = tuple(v for k,v in ds[x].sizes.items() if k != 'year')
res_dims = tuple(k for k,v in ds[x].sizes.items() if k != 'year')
ds[sl] = (res_dims, np.empty(res_shape, dtype='float32'))
ds[inter] = (res_dims, np.empty(res_shape, dtype='float32'))
# Iterate in kept dimensions
for lat in ds.coords['latitude']:
    for lon in ds.coords['longitude']:
        for duration in ds.coords['duration']:
            locator = {'longitude':lon, 'latitude':lat, 'duration':duration}
            sel = ds.loc[locator]
            res = scipy.stats.linregress(sel[x], sel[y])
            ds[sl].loc[locator] = res.slope
            ds[inter].loc[locator] = res.intercept

我怎样才能加速和并行化这个操作？

我明白那个apply_ufunc可能是一个选项（并且可以与 dask 并行），但我没有设法获得正确的参数。

以下问题相关但没有答案：

将 numpy.polyfit 应用于 xarray 数据集 https://stackoverflow.com/questions/38960903/applying-numpy-polyfit-to-xarray-dataset
计算 xarray 中的互相关函数 https://stackoverflow.com/questions/45566703/calculating-cross-correlation-function-in-xarray

编辑 2：将之前的编辑移至答案

之前的回答由LCT https://stackoverflow.com/users/9974926/lct涵盖了这里应该说的大部分内容，however我认为可以合并dask='parallelized'具有多个输出，就像您从中获得的那样scipy.stats.linregress.

这里的技巧是将多个输出堆叠到一个数组中，然后输出它，您还必须使用output_core_dimskwarg 指定 DataArray 输出apply_ufunc()调用现在将有一个额外的维度：

def new_linregress(x, y):
    # Wrapper around scipy linregress to use in apply_ufunc
    slope, intercept, r_value, p_value, std_err = stats.linregress(x, y)
    return np.array([slope, intercept, r_value, p_value, std_err])

# return a new DataArray
stats = xr.apply_ufunc(new_linregress, ds[x], ds[y],
                       input_core_dims=[['year'], ['year']],
                       output_core_dims=[["parameter"]],
                       vectorize=True,
                       dask="parallelized",
                       output_dtypes=['float64'],
                       output_sizes={"parameter": 5},
                      )

N.B.该方法目前仅适用于dask='parallelized'如果你有dask<2.0，但如果你有其他类似的东西，它似乎适用于多个输出dask='allowed'。看看这个Github问题 https://github.com/pydata/xarray/issues/3574了解更多详情。

希望能帮助到你！

Edit:我已获悉dask<2.0只要您有，问题就已得到纠正xarray>=0.15.0！所以可以使用dask='parallelized'现在要加快速度。 :)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用xarray，如何在多维数据集上并行化一维操作？的相关文章

是否有解决方法可以通过 CoinGecko API 安全检查？

我在工作中运行我的代码一切都很顺利但在不同的网络家庭 WiFi 上我不断收到403访问时出错CoinGecko V3 API https www coingecko com api documentations v3 可以观察到在
中断 Select 以添加另一个要在 Python 中监视的套接字

我正在 Windows XP 应用程序中使用 TCP 实现点对点 IPC 我正在使用select and socketPython 2 6 6 中的模块我有三个 TCP 线程一个读取线程通常会阻塞select 一个通常等待事件的写入线程
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street

随机推荐

HTML5 视频的多个音轨

我正在使用 HTML5 为我的网站制作视频理想情况下我只有一个无声视频文件以及与视频同步的不同语言的五个不同音轨然后我会有一个按钮允许用户在音轨之间切换甚至在视频播放时也是如此正确的音轨就会出现视频不会暂停或重新开始或任何其
使用 Passport.js 进行动态失败重定向

这是我的atm登录功能 app post login passport authenticate local failureRedirect login error 1 function req res res redirect req b
Firebase 聊天应用程序 setValue 公共数据库失败错误？

我有一个使用 Firebase 的聊天应用程序它一直有 x 处的 setValue 失败数据库错误权限被拒绝每次我输入消息时都会出错我已经将数据库设置为公开 service cloud firestore match databa
Python：查找列表元素之间的差异

给定一个数字列表如何找到每个 i 个元素及其 i 1 th 最好使用lambda表达式或者列表理解例如给定一个列表t 1 3 6 目标是找到一个列表v 2 3 因为3 1 2 6 3 3 etc gt gt gt t 1 3 6 gt
Pandas groupby 与 sklearn 预处理相结合

我想按特定列对 DataFrame 进行分组然后应用 sklearn 预处理 MinMaxScaler 并存储缩放器对象我目前的出发点 import pandas as pd from sklearn import preprocess
OSX：安装 python 包时出错

目前由于 gcc 4 0 错误我无法安装任何 Python 包我将复制我收到的错误的两个示例其中一个带有pip 另一个使用手动 setup py 构建安装方法 sgarza62 pip install PIL Downloadin
如何在 Cocoa AppKit 应用程序中实现缩放/缩放

如何在 Cocoa AppKit 应用程序中实现缩放缩放即不最大化窗口而是缩放窗口及其所有子视图我认为它在 iOS 中称为 zoomScale 可以使用 Core Animations 或 Quartz 2D 来完成吗例如CGCo
在 Eclipse ide 中找不到 Scala 主类

我为 eclipse 安装了 scala 和 scala IDE 每次我尝试编译一个简单的 HelloWorld 时我都会收到此消息 package asd object testobject def main args Array St
如何在角度2中使用自定义http刷新访问令牌？

我在我的应用程序中使用基于令牌的身份验证我的后端是使用restful服务 spring 开发的后端代码很好地生成了所需的访问令牌和带有时间线的刷新令牌所以我用以下内容覆盖了http类 export class customHttp e
球拍、包含、要求和提供不起作用

我有一个名为 functions rkt 的文件其中有一些函数我正在另一个文件中工作我们将其命名为 working rkt 我在 working rkt 中尝试了以下操作一一来使用 functions rkt 中定义的函数 req
如何使用 System.IO.Stream 和 LINQ 读取 XML 文件

我将像这样传递 xml 文件 File1 PostedFile InputStream reading xml file public static void readXMLOutput Stream stream System Xml L
TypeScript ：具有原始类型约束的通用类型

我在 TypeScript 中有以下通用类 type UserId number type Primitive string number boolean class ColumnValue
如何在角度单元测试中模拟 location.path

http blog artlogic com 2013 05 06 angularjs best practices ive been doing it wrong part 2 of 3 http blog artlogic com 20
Windows 上的 Qt QMYSQL“驱动程序未加载”

当尝试连接到 mysql 数据库时我收到以下错误驱动程序未加载我已经创建了一个安装程序其中包含所有需要的 DLL 文件 libmysql dll plugins qsqlmysql dll QT5Sql 等在新安装的 Window
如何从 1 更新 id 集？

我有一个id即主键和自增是否有任何疑问可以更新我现有的id并让我的id从 1 开始下一个 id 2 等等例如 id name 3 ABC 5 XYZ 9 PQR NOTE id已经是主要的并且自动增量我不想截断我的 id 如果可能的
Python multiprocessing.Pool map()“TypeError：字符串索引必须是整数，而不是 str”

我正在尝试使用 multiprocessing Pool 对字典列表进行并行处理下面是一个例子请注意这是一个玩具示例我的实际示例将对实际字典中的值进行 CPU 密集型处理 import multiprocessing my list
可以在 VS2008 中的预处理器指令块（例如 #ifndef ... #endif）中启用智能感知吗？

在 C 库中工作时我注意到在 ifndef CLIENT DLL endif 等指令块内我没有被授予任何智能感知这显然是由于 CLIENT DLL 已被定义的事实我意识到我可以通过简单地注释掉指令来解决这个问题无论指令评估如何是否
Netbeans：将 Java 应用程序部署到远程 Tomcat

有没有简单的方法可以自动将Web服务 Java Web应用程序等部署到远程tomcat服务器目前我必须手动复制 war 文件就我个人而言我在 build xml 中添加了一个 deploy 目标其中包含一个标签来传输 war 文件
WPF DataTrigger 值中的绑定

嗯这可能是一个简单的问题但我无法找到解决方案我有一个DataTrigger as
使用xarray，如何在多维数据集上并行化一维操作？

我有一个 4D xarray 数据集我想在特定维度此处为时间上的两个变量之间进行线性回归并将回归参数保留在 3D 数组中其余维度我设法通过使用此串行代码获得了我想要的结果但速度相当慢 add empty arrays to s

使用xarray，如何在多维数据集上并行化一维操作？

使用xarray，如何在多维数据集上并行化一维操作？ 的相关文章

随机推荐

热门标签

使用xarray，如何在多维数据集上并行化一维操作？的相关文章