使用并行 NetCDF 保存分布式 3D 复杂数组

2024-01-07

我有一个用 Fortran 编写的基于 MPI 的程序，它在每个节点（2D 时间序列的部分）生成复杂数据的 3D 数组。我想使用并行 I/O 将这些数组写入单个文件，该文件可以相对轻松地在 python 中打开以进行进一步分析/可视化。理想情况下，我希望解决方案具有内存效率（即避免创建中间临时数组）。

使用 NetCDF，我成功地适应了子程序 https://www.archer.ac.uk/documentation/white-papers/fortanIO_netCDF/fortranIO_netCDF.pdf它针对 3D 实数数组实现了这一点。然而，当涉及到复杂数组时，我遇到了障碍。

在下面的代码中，我尝试通过创建由两个实数组成的复合数据类型，并假设 Fortran 复数数据类型的实部和虚部连续存储在 3D 数组的第一维中，将子例程从实数扩展到复数。

 module IO

    use NetCDF
    use, intrinsic :: iso_fortran_env, only: dp => real64

    implicit none

    contains

        subroutine output_3D(dataname, starts, ends, global_data_dims, &
            local_data, MPI_communicator)

        character(len=*), intent(in) :: dataname
        integer, dimension(3), intent(in) :: starts
        integer, dimension(3), intent(in) :: ends
        integer, dimension(3), intent(in) :: global_data_dims

        complex(dp), intent(in) :: local_data(   1:(ends(1) - starts(1)+ 1), &
                                                1:(ends(2) - starts(2) + 1), &
                                                1:(ends(3) - starts(3) + 1))

        integer, dimension(3) :: expanded_starts

        integer, intent(in) :: MPI_communicator

        integer :: ncid, varid, dimid(3)
        integer :: counts(3)

        integer :: typeid

        expanded_starts(1) = (starts(1))* 2 + 1
        expanded_starts = starts(2) 
        expanded_starts(3) = starts(3)

        call check(nf90_create( trim(dataname)//'.cdf', &
                                IOR(NF90_NETCDF4, NF90_MPIIO), &
                                ncid, &
                                comm = MPI_communicator, &
                                info = MPI_INFO_NULL))

        call check(nf90_def_dim(ncid, "x", global_data_dims(1), dimid(1)))
        call check(nf90_def_dim(ncid, "y", global_data_dims(2) * 2, dimid(2)))
        call check(nf90_def_dim(ncid, "z", global_data_dims(3), dimid(3)))

        ! define a complex data type consisting of two real(8)
        call check(nf90_def_compound(ncid, 16, "COMPLEX", typeid))
        call check(nf90_insert_compound(ncid, typeid, "REAL", 0, NF90_DOUBLE))
        call check(nf90_insert_compound(ncid, typeid, "IMAG", 8, NF90_DOUBLE))

        ! define a 3D variable of type "complex"
        call check(nf90_def_var(ncid, dataname, typeid, dimid, varid))

        ! exit define mode
        call check(nf90_enddef(ncid))

        ! Now in NETCDF data mode

        ! set to use MPI/PnetCDF collective I/O
        call check(nf90_var_par_access(ncid, varid, NF90_COLLECTIVE))

        counts(1) = (ends(1) - starts(1) + 1) * 2
        counts(2) = (ends(2) - starts(2) + 1)
        counts(3) = (ends(3) - starts(3) + 1)

        call check(nf90_put_var(ncid, &
                                varid, &
                                local_data, &
                                start = expanded_starts,&
                                count = counts))

        ! close the file
        call check(nf90_close(ncid))

        return

    end subroutine output_3D

    subroutine check(status)

        integer, intent ( in) :: status

        if(status /= nf90_noerr) then
            print *, trim(nf90_strerror(status))
            stop 2
        end if

    end subroutine check

end module IO

program test_write

    use IO
    use MPI

    complex(dp) :: data(2,2,3)

    integer :: flock
    integer :: rank
    integer :: ierr

    integer :: i, j, k

    call MPI_init(ierr)
    call MPI_comm_size(MPI_comm_world, flock, ierr)
    call MPI_comm_rank(MPI_comm_world, rank, ierr)

    do k = 1, 3
        do j = 1, 2
            do i = 1, 2
                data(i,j,k) = cmplx(i, j, 8)
            enddo
        enddo
    enddo

    if (rank == 0) then

        call output_3D_hdf5('out', [1,1,1], [2,2,3], [2,2,6], &
                data, MPI_comm_world)

    else

        call output_3D_hdf5('out', [1,1,4], [2,2,6], [2,2,6],  &
                data, MPI_comm_world)

    endif

    call MPI_finalize(ierr)

end program test_write

上述代码会导致编译时出现“There is no certain function for nf90_put_var”错误。这表明该函数对输入数组的数据类型不满意，因此显然我在复合数据类型的使用方面缺少一些东西。

编辑：一种简单的解决方法是将复杂数组分配给真实指针，如中所述this https://stackoverflow.com/questions/54817724/how-to-assign-pointers-to-a-complex-3d-array-in-fortran邮政。然后可以使用 numpy 对该数组进行重塑/重新转换，以得到 python 中的复杂数组。它有点笨重，而且有些令人不满意——但对于我现在的目的来说可能已经足够了。

这只是部分答案，原因您将在下面看到 - 但对于评论来说太长了。希望我能够找到丢失的信息并“升级”它，但这就是我到目前为止所拥有的。

如果您查看“复合类型介绍”下的 NetCDF4 文档，网址为https://www.unidata.ucar.edu/software/netcdf/fortran/docs/f90-user-define-data-types.html#f90-compound-types-introduction https://www.unidata.ucar.edu/software/netcdf/fortran/docs/f90-user-defined-data-types.html#f90-compound-types-introduction你会看见：

要以复合类型写入数据，首先使用nf90_def_compound要创建类型，请多次调用nf90_insert_compound添加到复合类型，然后用适当的方式写入数据nf90_put_var1, nf90_put_vara, nf90_put_vars, or nf90_put_varm call.

注意它没有提到nf90_put_var根本没有，但是有4个不同的功能。这有一定的道理，nf90_put_var大概可以很好地重载来处理 NetCDF 支持的所有内在类型（而且它完全是废话，它不支持复杂），因此对于非内在类型，大概有一些类似 C 的接口，类似于void *，我猜上面提到的四个函数就是这个实现的。

到目前为止一切顺利，您应该致电其中之一nf90_put_var1, nf90_put_vara, nf90_put_vars, or nf90_put_varm而不是nf90_put_var。现在是坏消息 - 我找不到这 4 个函数的任何文档。等效的 C 函数位于https://www.unidata.ucar.edu/software/netcdf/docs/group__variables.html https://www.unidata.ucar.edu/software/netcdf/docs/group__variables.html所以你也许能够从那里找出需要什么，但这不是很好 - 我至少会向 Unidata 提交一份错误报告，但这对我来说缺乏对复杂性的内在支持足以使我在别处寻找我的 I/O 解决方案...

当我在这里时，您确实不应该使用显式数字来表示变量的类型，我可以向您展示编译器在哪里complex(8)将无法编译。而是使用Selected_real_kind或类似的，或者使用内部模块 iso_fortran_env 中的常量，或者可能使用 iso_c_binding 中的常量，并且复数的类型与组成它的实数的类型相同。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用并行 NetCDF 保存分布式 3D 复杂数组的相关文章

Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块？

我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时也是由 CDK 创建的这是我的 CDK 堆栈代码 fr
如何在序列化器创建方法中获取 URL Id？

我有以下网址 url r member P
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
使用 MacLaurin 展开的 Fortran Sine 函数的微小差异

我正在用 Fortran 创建一个程序它接受以弧度表示的 sin x 的 x 然后是要计算的项数这是我的程序 Sine value using MacLaurin series program SineApprox implicit n
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

numpy 中两个浮点数之间以对数间隔的数字

我正在尝试使用 python 获取两个浮点数之间对数间隔的 1000 个数字例如 0 674 到 100 0 之间这样做的目的是获得更多接近 0 674 的数字而不仅仅是接近 100 的几个大数字我尝试使用 numpy logspa
Python3'无法导入名称'cached_property'

我无法让它发挥作用我不断添加模块但每次都找不到新模块为什么这段代码在Python3 6中不起作用 Code from robobrowser import robobrowser from bs4 import BeautifulSo
区分 Javascript 中的触摸和交换事件

我有一个用于交换图像的图片库在画廊中我使用了 touchstart touchmove touchend 和 touchcancel 事件但现在我还需要处理触摸事件那么我应该在移动设备上分别区分触摸和交换事件吗我正在使用这个技巧
python `str()` 函数是否调用类的 `__str__()` 函数？

如果我定义一个有自己的类 str 函数是str a 相当于a str where a是我班级的一个实例吗我检查了蟒蛇文档 https docs python org 2 library functions html str 它没有明确说
在 Groovy 中使用字符串访问地图的地图元素

鉴于我有一张这样的地图 def myMap b c X 还有一根绳子 def key b c 我想查看使用密钥获取值 X 的选项我自己想出了两种方法来实现这一目标但我对这些解决方案不太满意 1 Eval me theMap myMap
加密：在javascript和python中模拟SSL

由于中国防火墙阻止了 google appengine 的 https 端口所以我想通过javascript和python模拟一个安全套接字层来保护我的用户信息不会被那些ISP和GFW捕获我的计划握手浏览器请求服务器服务器生成加密
jaxb 当 xsi:nil=true 如果任何子元素存在它仍然显示

我有以下 xml 输出当父元素具有属性 xsi nil true 即使子元素为 nillable true 时我们如何隐藏子元素 endDate XML输出
REST API 中错误 HTTP 方法的返回代码？

我们的API用户可以获得root发送文件收集清单 GET请求根 API 地址如果他发送POST 我们应该返回一些东西同样的问题也适用于其他资源路径例如发送PATCH在查询路径等上并非所有方法在某些路径上都有意义正如我从 HTTP
使用插值在模板中渲染 html 字符串？

使用角度 4 3 0 假设我有一个像这样的字符串它是组件的属性 p test 2 bla bla p p test1234 56 p p test test p 所以我按照文档进行操作 https angular io guide te
有没有办法知道哪个编译器生成了静态库？

第三方为我提供了一个静态库 a 用于在 Solaris 站上链接我尝试使用 sunpro 进行编译但在链接步骤失败我想这个问题来自我使用的编译器而不是 gcc 或者只是它的版本因为编译器提供的 std lib 可能会从库预期的版本
opencv多通道元素访问

我正在尝试学习如何使用 OpenCV 的新 C 界面如何访问多通道矩阵的元素例如 Mat myMat size 3 3 CV 32FC2 for int i 0 i lt 3 i for int j 0 j lt 3 j myMat a
如何计算两个日期之间的年龄/年数[重复]

这个问题在这里已经有答案了可能的重复如何在 T SQL 中用年月日计算年龄 https stackoverflow com questions 57599 how to calculate age in t sql with yea
如何在传单地图上添加搜索框

我想使用传单地图作为页面的背景并且这个页面有搜索功能但是这个搜索框并不是用来搜索这张地图的所以我的问题是如何在传单地图上添加搜索框您还有其他解决方案使用地图作为背景吗喜欢这个页面 http directory spatineo c
使用 doLast 的 Gradle 执行任务失败

仅当文件自上次构建以来已更新时我才尝试运行执行任务我最初的尝试是这样的 task generateLocalizedStrings type Exec ext srcFile file localization language fil
MVC 查看可为空的日期字段格式

我试图在视图中显示以下内容但出现问题 td item CreatedByDt ToString MM dd yyyy td 关于如何处理视图中可为空的日期字段的任何想法顺便说一句我正在使用 Razor 我收到以下错误方法 ToStr
减少 solr 结果输出中类似的顶部结果

我在 solr 中进行了一次搜索返回了大约 1500 个文档这些文档基本上都是产品例如我的数据集中有一堆女鞋我的数据集有各种各样的女鞋但也有一些非常相似的结果例如 11 号女式耐克运动鞋 10 号女式耐克运动鞋等现在当我搜
PDFBOX - 使用 easytable 的所有页面中的页眉

我正在使用 pdfbox 和 easytablehttps github com vandeseer easytable https github com vandeseer easytable用于创建效果很好的动态页面但我确实希望在所有
Matplotlib 多条动画多行

我一直在研究如何为飞行路径制作多条线的动画我读取多个 GPS 文件的对象是时间同步它们它们相对于时间为每条路径设置动画我找到了如何在动画函数中使用附加来为一行添加动画现在我需要添加第二个和第三个以便导入尽可能多的文件我知道问题出
无法在有关 iron lib 的 fn 项目中捕获动态环境

我使用c c 驱动的cassandra来查询然后返回数据因此 cass LinkedList 和cass it Vec 都可以显示查询的结果但是我想使用json格式将结果显示到web上所以我选择使用vec重新组装数据然而有一个
使用并行 NetCDF 保存分布式 3D 复杂数组

我有一个用 Fortran 编写的基于 MPI 的程序它在每个节点 2D 时间序列的部分生成复杂数据的 3D 数组我想使用并行 I O 将这些数组写入单个文件该文件可以相对轻松地在 python 中打开以进行进一步分析可视化理想

使用并行 NetCDF 保存分布式 3D 复杂数组

使用并行 NetCDF 保存分布式 3D 复杂数组 的相关文章

随机推荐

热门标签

使用并行 NetCDF 保存分布式 3D 复杂数组的相关文章