将多个 NetCDF 文件合并为时间序列多维数组 python

2024-04-02

我正在使用多个 netcdf 文件（在我的计算机上的文件夹中）中的数据。每个文件保存整个美国 5 年的数据。根据 x 和 y 坐标的索引引用位置。我正在尝试为多个位置（网格单元）创建一个时间序列，将 5 年周期编译为 20 年周期（这将合并 4 个文件）。现在，我可以从一个位置的所有文件中提取数据，并使用 numpy 追加将其编译为数组。但是，我想提取多个位置的数据，将其放入矩阵中，其中行是位置，列包含时间序列降水数据。我想我必须创建一个列表或字典，但我不太确定如何在循环内将数据分配到列表/字典。

我是 python 和 netCDF 的新手，所以如果这是一个简单的解决方案，请原谅我。我一直使用这段代码作为指导，但还没有弄清楚如何格式化它以实现我想要做的事情：Python 读取多个可变大小的 NetCDF Rainfall 文件 https://stackoverflow.com/questions/18939210/python-reading-multiple-netcdf-rainfall-files-of-variable-size?newreg=63b025fb70454ce99c76846c5091694f

这是我的代码：

import glob
from netCDF4 import Dataset
import numpy as np

# Define x & y index for grid cell of interest 
    # Pittsburgh is 37,89
yindex = 37  #first number
xindex = 89  #second number

# Path
path = '/Users/LMC/Research Data/NARCCAP/'  
folder = 'MM5I_ccsm/'

## load data file names    
all_files = glob.glob(path + folder+'*.nc')
all_files.sort()

## initialize np arrays of timeperiods and locations
yindexlist = [yindex,'38','39'] # y indices for all grid cells of interest
xindexlist = [xindex,xindex,xindex] # x indices for all grid cells of interest
ngridcell = len(yindexlist)
ntimestep = 58400  # This is for 4 files of 14600 timesteps

## Initialize np array
timeseries_per_gridcell = np.empty(0)

## START LOOP FOR FILE IMPORT
for timestep, datafile in enumerate(all_files):    
    fh = Dataset(datafile,mode='r')  
    days = fh.variables['time'][:]
    lons = fh.variables['lon'][:]
    lats = fh.variables['lat'][:]
    precip = fh.variables['pr'][:]

    for i in range(1):
        timeseries_per_gridcell = np.append(timeseries_per_gridcell,precip[:,yindexlist[i],xindexlist[i]]*10800)

    fh.close()

print timeseries_per_gridcell

我将 3 个文件放在 Dropbox 上，以便您可以访问它们，但我只允许发布 2 个链接。它们是：

https://www.dropbox.com/s/rso0hce8bq7yi2h/pr_MM5I_ccsm_2041010103.nc?dl=0 https://www.dropbox.com/s/rso0hce8bq7yi2h/pr_MM5I_ccsm_2041010103.nc?dl=0 https://www.dropbox.com/s/j56undjvv7iph0f/pr_MM5I_ccsm_2046010103.nc?dl=0 https://www.dropbox.com/s/j56undjvv7iph0f/pr_MM5I_ccsm_2046010103.nc?dl=0

很好的开始，我会推荐以下内容来帮助解决您的问题。

首先，检查一下ncrcat http://nco.sourceforge.net/nco.html#ncrcat-netCDF-Record-Concatenator快速将各个 netCDF 文件连接成一个文件。我强烈建议下载 NCO 来进行 netCDF 操作，特别是在这种情况下，它将简化您以后的 Python 编码。

假设这些文件的名称是precip_1.nc, precip_2.nc, precip_3.nc, and precip_4.nc。您可以沿着记录维度将它们连接起来形成一个新的precip_all.nc记录尺寸为长度 58400

ncrcat precip_1.nc precip_2.nc precip_3.nc precip_4.nc -O precip_all.nc

在 Python 中，我们现在只需要读入新的单个文件，然后提取并存储所需网格单元的时间序列。像这样的事情：

import netCDF4
import numpy as np

yindexlist = [1,2,3]
xindexlist = [4,5,6]
ngridcell = len(xidx)
ntimestep = 58400

# Define an empty 2D array to store time series of precip for a set of grid cells
timeseries_per_grid_cell = np.zeros([ngridcell, ntimestep])

ncfile = netCDF4.Dataset('path/to/file/precip_all.nc', 'r')

# Note that precip is 3D, so need to read in all dimensions
precip = ncfile.variables['precip'][:,:,:]

for i in range(ngridcell):
     timeseries_per_grid_cell[i,:] = precip[:, yindexlist[i], xindexlist[i]]

ncfile.close()

如果您必须仅使用 Python，则需要跟踪各个文件形成的时间索引块以生成完整的时间序列。 58400/4 = 每个文件 14600 个时间步。因此，您将有另一个循环来读取每个单独的文件并存储相应的时间片段，即第一个文件将填充 0-14599，第二个文件将填充 14600-29199，等等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将多个 NetCDF 文件合并为时间序列多维数组 python 的相关文章

嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
ctypes 错误：libdc1394 错误：无法初始化 libdc1394

我正在尝试将程序编译为共享库我可以使用 ctypes 在 Python 代码中使用该库使用以下命令该库可以正常编译 g shared Wl soname mylib O3 o mylib so fPIC files pkg config
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
为什么我应该使用 WSGI？

使用 mod python 一段时间了我读了越来越多关于 WSGI 有多好的文章但没有真正理解为什么那么我为什么要切换到它呢有什么好处这很难吗学习曲线值得吗为了用 Python 开发复杂的 Web 应用程序您可能会使用更全面
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r

随机推荐

如何获取UIBarButtonItem中心位置

我正在做一些自定义视图控制器转换我希望我的转换从按下的按钮的中心开始 For UIButton我可以 myCustomTransition startingPoint buttonPressed center 但如果我想使用UIBarBu
性别表标准化是否太过分了？

我不是数据库专家但我正在尝试清理另一个数据库所以我的问题是性别表正常化会不会太过分了 User table userid int pk genderid char 1 fk etc gender table genderid char
在jframe中创建java的正方形，矩形，三角形[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个 Java 问题据我了解无法在 Java 中绘制几何图形代码和以下内容您可以帮助我吗这是代码 public class
Primefaces 在 onComplete/onClick 上运行 java 脚本

我有一个 p command 按钮如下所示
在 Javascript 中通过 JSON 获取单个视频（而非 feed）的 Youtube 信息

所以我试图通过 JSON 格式从单个 YouTube 视频中获取信息比如标题描述类别等等除了评论之外我能得到的任何东西我正在尝试用 JavaScript 来做到这一点我注意到下面的链接但他们的所有示例都是如何从提要中获取视频信息
Android 8 通知设置声音不起作用

我有以下代码但每次我只听到默认的 android 声音 create channel NotificationChannel channel new NotificationChannel ANDROID CHANNEL ID ANDRO
如何异步加载场景以便获得加载屏幕？

我的场景加载可能需要一段时间并且我希望能够显示加载动画但是一切都锁定了有没有办法异步加载下一个场景并在准备好时获取回调您可以使用以下命令安排并发执行块异步调度 https developer apple com library m
文本（字体）在旧版 api 上看起来褪色

我正在使用自定义字体它在较新的 Android 版本上完美显示在 API 17 Asus 选项卡 18 Dell 选项卡 19 Nex4 设备上测试然而相同的字体在旧版本 API 8 SE X10i 10 LG P500H 上看起来
如何检查 UI 事件（例如单击按钮）后是否发生刷新页面事件

得到以下代码 driver findElement By id input search click driver findElement By id input search clear if lower3 true read a lin
networkx 边到节点节点到边表示

有一个图 G e v 有 N 个节点和 M 个边它的距离矩阵D是一个NxN矩阵现在让我们想象一下该图的另一种表示形式G e v v e 即 G 中的节点 v 实际上是图 G 中的边保持连通性相同现在它的距离矩阵 D 是 MxM Ne
Azure Ad 作为 keycloak 中的 OIDC 身份提供程序，但随机 UUId 被添加为 IDP“userid”，并且无法与现有用户同步

我已使用 azure ad 配置 keycloak 作为 OIDC 身份提供商当我从我的网络应用程序登录时我会重定向到微软登录页面登录后我看到我被自动添加为 keycloak 中的用户我看到 keycloak 使用特定的身份提供者
如何在 ruby/rails 中合并两个列表并删除重复项？

我有一个源对象其中 class Source def other return false if self url nil other nil self url other url end 我有以下内容 def self merge in
x86 TEST 指令不起作用？

我一直在用头撞墙来解决这个问题但这对我来说毫无意义为什么这个程序会进入死循环我以为你可以用test比较两个值是否相等如图所示here https stackoverflow com questions 6002079 为什么不起作用
MySQL 因表中的文本字段较大而运行缓慢

我们在 MySQL 以及 MariaDB 方面遇到了一个奇怪的问题一个简单的数据库有 2 个表 InnoDB 引擎两个表都包含以及其他一些 3 或 4 个文本列其中 XML 数据大约为 10 个大小1 5kB 每个表大约有 40
谷歌登录auth2自定义范围没有openid

我想自定义范围以仅允许电子邮件和个人资料没有 openid 因为我想让它只要求访问电子邮件和基本个人资料信息我尝试使用元来做到这一点或js gapi auth2 init client id xxxxxxxxx apps goo
在 x86-64 中使用 32 位寄存器/指令的优点

有时 gcc 使用 32 位寄存器而我希望它使用 64 位寄存器例如以下 C 代码 unsigned long long div unsigned long long a unsigned long long b return a b
从 .NET 3.0 升级到 3.5：在 Web Garden 中设置为 StateServer 的站点恢复为 InProc

设想假设一台运行 NET 3 0 的服务器和一个在启用了 Web 花园的应用程序池中运行的 ASP NET 网站进程数 3 web config配置如下
将日期时间从 Android 发布到 WCF RESTful JSON 服务

我正在尝试发送DateTime作为通过使用 JSON 编码的 WCF RESTful 服务公开的方法的参数该请求如下所示 POST http IP PORT LogService json GetLogEntriesByModule HT
Linux 内核中的 DMA 映射和 DMA 引擎是什么？

Linux 内核中的 DMA 映射和 DMA 引擎是什么 DMA映射API和DMA引擎API何时可以在Linux设备驱动程序中使用任何真正的 Linux 设备驱动程序示例作为参考都会很棒 Linux 内核中的 DMA 映射和 DMA 引擎
将多个 NetCDF 文件合并为时间序列多维数组 python

我正在使用多个 netcdf 文件在我的计算机上的文件夹中中的数据每个文件保存整个美国 5 年的数据根据 x 和 y 坐标的索引引用位置我正在尝试为多个位置网格单元创建一个时间序列将 5 年周期编译为 20 年周期这将合并

将多个 NetCDF 文件合并为时间序列多维数组 python

将多个 NetCDF 文件合并为时间序列多维数组 python 的相关文章

随机推荐

热门标签