在 R 中使用变量字符串引用对象

2023-12-22

编辑:感谢迄今为止做出回应的人;我是 R 的初学者,刚刚为我的硕士学位论文承担了一个大型项目,所以对初始处理有点不知所措。我使用的数据如下(来自WMO公开的降雨数据):


120 6272100 KHARTOUM 15.60 32.55 382 1899 1989 0.0
1899 0.03 0.03 0.03 0.03 0.03 1.03 13.03 12.03 9999 6.03 0.03 0.03
1900 0.03 0.03 0.03 0.03 0.03 23.03 80.03 47.03 23.03 8.03 0.03 0.03
1901 0.03 0.03 0.03 0.03 0.03 17.03 23.03 17.03 0.03 8.03 0.03 0.03
(...)
120 6272101 JEBEL AULIA 15.20 32.50 380 1920 1988 0.0
1920 0.03 0.03 0.03 0.00 0.03 6.90 20.00 108.80 47.30 1.00 0.01 0.03
1921 0.03 0.03 0.03 0.00 0.03 0.00 88.00 57.00 35.00 18.50 0.01 0.03
1922 0.03 0.03 0.03 0.00 0.03 0.00 87.50 102.30 10.40 15.20 0.01 0.03
(...)

我感兴趣的观测站大约有 100 个,每个观测站的降雨量测量都有不同的开始和结束日期。它们的格式如上在单个数据文件中,各站以“120(站号)(站名称)”分隔。

我需要首先按站点分离该文件,然后提取每年的三月、四月、五月和六月,然后对每年的这些月份进行总计。到目前为止,我正在摆弄循环(如下所示),但我知道这不是正确的方法,而是宁愿学习一些更好的技术。 再次感谢您的帮助!

(原来的问题:) 我有一个大型数据集,其中包含 100 多个地点按季节划分的降雨量。我正在尝试将这些数据分成更易于管理的数组,特别是我想检索每年每个站点的三月、四月、五月和六月的降雨量总和。 以下是迄今为止我的代码的简化版本:

a <- array(1,dim=c(10,12))
for (i in 1:5) {

  all data:
  assign(paste("station_",i,sep=""), a)

  #march - june data:
  assign(paste("station_",i,"_mamj",sep=""), a[,4:7])
}

所以这给了我station_(i)__mamj_其中包含我感兴趣的每个电台的月份数据。现在我想对该数组的每一行求和并将其输入到一个名为的新数组中station_(i)_mamj_tot。理论上很简单,但我不知道如何引用 station_(i)_mamj


这完全是在乞求一个数据框,那么这只是带有诸如ddply(惊人的强大):

tot_mamj <- ddply(rain[rain$month %in% 3:6,-2], 'year', colwise(sum))

按年份给出 M/A/M/J 的总计:

   year station_1 station_2 station_3 station_4 station_5 ...
1  1972  8.618960  5.697739 10.083192  9.264512 11.152378 ...
2  1973 18.571748 18.903280 11.832462 18.262272 10.509621 ...
3  1974 22.415201 22.670821 32.850745 31.634717 20.523778 ...
4  1975 16.773286 17.683704 18.259066 14.996550 19.007762 ...
...

下面是完美运行的代码。我们创建一个数据框,其列名是“station_n”;还有年份和月份的额外列(因子,或者整数,如果你很懒,请参阅脚注)。现在您可以按月或年进行任意分析(使用 plyr 的 split-apply-combine 范例):

require(plyr) # for d*ply, summarise
#require(reshape) # for melt

# Parameterize everything here, it's crucial for testing/debugging
all_years <- c(1970:2011)
nYears <- length(all_years)  
nStations <- 101
# We want station names as vector of chr (as opposed to simple indices)
station_names <- paste ('station_', 1:nStations, sep='')

rain <- data.frame(cbind(
  year=rep(c(1970:2011),12),
  month=1:12
))
# Fill in NAs for all data
rain[,station_names] <- as.numeric(NA)
# Make 'month' a factor, to prevent any numerical funny stuff e.g accidentally 'aggregating' it
rain$month <- factor(rain$month)

# For convenience, store the row indices for all years, M/A/M/J
I.mamj <- which(rain$month %in% 3:6)

# Insert made-up seasonal data for M/A/M/J for testing... leave everything else NA intentionally
rain[I.mamj,station_names] <- c(3,5,9,6) * runif(4*nYears*nStations)

# Get our aggregate of MAMJ totals, by year
# The '-2' column index means: "exclude month, to prevent it also getting 'aggregated'"
excludeMonthCol = -2
tot_mamj <- ddply(rain[rain$month %in% 3:6, excludeMonthCol], 'year', colwise(sum))

# voila!!
#    year station_1 station_2 station_3 station_4 station_5
# 1  1972  8.618960  5.697739 10.083192  9.264512 11.152378
# 2  1973 18.571748 18.903280 11.832462 18.262272 10.509621
# 3  1974 22.415201 22.670821 32.850745 31.634717 20.523778
# 4  1975 16.773286 17.683704 18.259066 14.996550 19.007762

作为脚注,在我将月份从数字转换为因子之前,它会默默地“聚合”(直到我输入“-2”:排除列引用)。 然而,更好的是当你把它作为一个因素时,它会直接拒绝聚合,并抛出一个错误(这对于调试来说是理想的):

 ddply(rain[rain$month %in% 3:6, ], 'year', colwise(sum))
Error in Summary.factor(c(3L, 3L, 3L, 3L, 3L, 3L), na.rm = FALSE) : 
  sum not meaningful for factors
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 R 中使用变量字符串引用对象 的相关文章

随机推荐

  • drawRect 和 CGGraphicsContext 如何工作?

    我正在处理 Core Graphic 中的一些内容 并且正在寻找有关几个主题的一些额外说明 绘制矩形 我对此有所了解 并且知道这是 UIView 的所有绘图方面的所在 但我只是不清楚幕后发生的事情 当我创建一个 UIView 并填写 dra
  • 现在有什么好的 Eclipse 持续测试插件吗?

    我用过麻省理工学院持续测试 http groups csail mit edu pag continuoustesting 插件在过去 但它早已过时 并且不再与任何接近现代版本的 Eclipse 兼容 有人有好的替代品吗 免费自然是首选 我
  • 通过 gradle FileTree.include 删除目录

    我想说 clean delete fileTree a include subdir include aFile 删除目录 subdir 和文件 aFile 但 subdir 并没有被删除 我可以明确地列出它 clean delete a
  • ASP.NET Web Api 依赖注入 - 单例与否

    我正在使用 asp net 构建一个 Web api 并使用 UnityContainer 来处理依赖项 例如 我的身份验证控制器可以依赖于身份验证服务 class AuthController ApiController private
  • MVCDonutCaching - 当父项未缓存甜甜圈时,子项操作出现问题

    我正在使用很棒的MVCDonut缓存 http mvcdonutcaching codeplex com 从 Nuget 打包 以便缓存整个页面 同时保留某些部分不缓存 该过程很简单 一切都按预期进行 我缓存如下 DonutOutputCa
  • JDK8 与 -source 1.7 [默认方法]

    我有以下课程 public class ZonedDateTimeToInstant public static void main final String args throws NoSuchMethodException assert
  • 不使用分号的计算表达式

    给定像 68 32 这样的输入表达式 我们必须在程序中不使用分号进行计算 如果它是 if 或 for 循环内的东西 参考 https www spoj pl problems EXPR2 https www spoj pl problems
  • 如何在postgresql的pg_hba.conf文件中指定主机名?

    我们想要创建一条像这样的线 托管所有所有 vs1 nsdp ir md5 在 pg hba conf 文件中 但它不理解这个主机名 它的IP是192 168 1 60 当我们使用IP地址时就可以了 但它不适用于主机名 我们在我们的 dns
  • Django-rest-auth (dj-rest-auth) 自定义用户注册

    我正在使用 dj rest auth https dj rest auth readthedocs io en latest https dj rest auth readthedocs io en latest 并尝试实现自定义注册表单
  • docker反向代理DNS/网络问题

    我会尝试解释并把它画出来 我想要实现的目标 对不起 糟糕的油漆图 现在 如果我从 10 10 10 0 网络访问它 它就可以完美运行 问题是 DNS 将 jenkins network com 解析为 10 10 10 0 网络 我想通过代
  • 为什么我在没有释放按键的情况下收到 Pygame KEYUP 事件?

    首先 我是一个完全的初学者 所以我没有任何经验 但是我在过去两天搜索了所有可能的地方来解决问题 但找不到它 我在带有 Raspbian 的 Raspberry PI 3 上使用它 我正在尝试在 Python 3 6 中构建一个简单的代码 它
  • Firebase 消息,onMessage 未被调用

    这就是我调用发送消息的方式 sendMessage var key VERY LONG KEY dffdADFDFD vdfDafd var to VERY LONG KEY ADEWerew vdfDafd var notificatio
  • axios - 如何不在多个参数中添加[]?

    Axios 添加方括号如果有多个具有相同名称的参数 则传递给该参数 问题是我不需要包含那些括号 因为我使用Django Rest Framework and Django Filters 如果我使用这个符号 我该如何做到这一点 axios
  • java中如何捕获嵌套异常

    我正在使用 Apache Xalan v 2 7 1 在 Apache Tomcat v6 0 32 中将 XML 转换为 XHTML 有时加载会被客户端取消并引发以下异常 javax xml transform TransformerEx
  • WPF 中的高效实时日志查看器

    我希望 WPF 中有一个高效的日志查看器控件 它可以在添加消息时简单地显示实时日志 连接来自日志系统的通知是没有问题的 但我担心一旦日志行数量变大 日志窗口将随着每个附加日志行而变得缓慢 日志通知事件将仅提供一个日志字符串 以及一些元数据
  • (为什么)我应该“始终”在任何 vue.js 应用程序中使用组件,无论多么简单?

    我刚刚开始使用 vue js 并且已经从文档的第一个入门章节创建了我需要的大部分非常小的功能 现在我想添加一些测试 以确保我的功能在更改后始终有效 通常我会进行 TDD 但这次我必须先学习 vue 然后决定是否继续使用它 所以在寻找文档时我
  • 如何在 Spring 中使用 JDBC 为 ClientDetailsS​​erviceConfigurer 添加客户端?

    我的内存工作如下 Override public void configure ClientDetailsServiceConfigurer clients throws Exception clients inMemory withCli
  • Zend 框架路径问题

    All 我只是想查看除 欢迎使用 Zend Framework 屏幕之外的任何页面 我已经从本教程下载了该项目 http framework zend com docs quickstart create a form http frame
  • 如何使用 C# 创建 ODBC DSN 条目?

    我正在开发一个具有 C 扩展存储过程的遗留应用程序 该xsproc使用ODBC连接到数据库 这意味着它需要配置DSN 我正在更新安装程序 使用 Visual Studio 2008 安装项目创建 并希望有一个可以创建 ODBC DSN 条目
  • 在 R 中使用变量字符串引用对象

    编辑 感谢迄今为止做出回应的人 我是 R 的初学者 刚刚为我的硕士学位论文承担了一个大型项目 所以对初始处理有点不知所措 我使用的数据如下 来自WMO公开的降雨数据 120 6272100 KHARTOUM 15 60 32 55 382