R中基于移动时间窗口连接数据

2024-03-03

我有每小时记录一次的天气数据，以及每 4 小时记录一次的位置数据 (X,Y)。我想知道 X、Y 位置的温度是多少。天气数据并不完全相同。因此，我为每个位置编写了这个循环，以扫描天气数据，查找日期/时间中的“最接近”并提取该时间的数据。问题是我编写的方式，对于位置#2，它扫描天气数据，但不允许分配为位置#1 分配的最接近的时间信息。假设位置 #1 和 2 是在下午 6 点和下午 6:10 的 10 分钟内拍摄的，最接近的天气时间是下午 6 点。我无法选择允许下午 6 点的天气数据。我是这样设置的，因为我的位置数据集中有 200 个位置（比如 3 个月），我不希望它从天气数据的时间 0 开始，当我知道最近的天气数据刚刚计算时最后一个位置，也恰好是该数据集的 3 个月内。下面是一些示例数据和我的代码。我不知道这是否有意义。

<h6>####Location data</h6>

<p>X   Y   DateTime <br />
1   2   4/2/2003    18:01:01
3   2   4/4/2003    17:01:33
2   3   4/6/2003    16:03:07
5   6   4/8/2003    15:03:08
3   7   4/10/2003   14:03:06
4   5   4/2/2003    13:02:00
4   5   4/4/2003    12:14:43
4   3   4/6/2003    11:00:56
3   5   4/8/2003    10:02:06</p>

<h2>2   4   4/10/2003   9:02:19</h2>

<p>Weather Data
DateTime        WndSp   WndDir  Hgt
4/2/2003 17:41:00   8.17    102.86  3462.43
4/2/2003 20:00:00   6.70    106.00  17661.00
4/2/2003 10:41:00   6.18    106.00  22000.00
4/2/2003 11:41:00   5.78    106.00  22000.00
4/2/2003 12:41:00   5.48    104.00  22000.00
4/4/2003 17:53:00   7.96    104.29  6541.00
4/4/2003 20:53:00   6.60    106.00  22000.00
4/4/2003 19:41:00   7.82    105.00  7555.00
4/4/2003 7:41:00    6.62    105.00  14767.50
4/4/2003 8:41:00    6.70    106.00  17661.00
4/4/2003 9:41:00    6.60    106.00  22000.00
4/5/2003 20:41:00   7.38    106.67  11156.67
4/6/2003 18:07:00   7.82    105.00  7555.00
4/6/2003 21:53:00   6.18    106.00  22000.00
4/6/2003 21:41:00   6.62    105.00  14767.50
4/6/2003 4:41:00    7.96    104.29  6541.00
4/6/2003 5:41:00    7.82    105.00  7555.00
4/6/2003 6:41:00    7.38    106.67  11156.67
4/8/2003 18:53:00   7.38    106.67  11156.67
4/8/2003 22:53:00   5.78    106.00  22000.00
4/8/2003 1:41:00    5.78    106.00  22000.00
4/8/2003 2:41:00    5.48    104.00  22000.00
4/8/2003 3:41:00    8.17    102.86  3462.43
4/10/2003 19:53:00  6.62    105.00  14767.50
4/10/2003 23:53:00  5.48    104.00  22000.00
4/10/2003 22:41:00  6.70    106.00  17661.00
4/10/2003 23:41:00  6.60    106.00  22000.00
4/10/2003 0:41:00   6.18    106.00  22000.00
4/11/2003 17:41:00  8.17    102.86  3462.43</p>

<h2>4/12/2003 18:41:00  7.96    104.29  6541.0</h2>

weathrow = 1
for (i in 1:nrow(SortLoc)) {
    t = 0
    while (t < 1) {
        timedif1 = difftime(SortLoc$DateTime[i], SortWeath$DateTime[weathrow], units="auto")
        timedif2 =  difftime(SortLoc$DateTime[i], SortWeath$DateTime[weathrow+1], units="auto") 
        if (timedif2 < 0) {
            if (abs(timedif1) < abs(timedif2)) {
                SortLoc$WndSp[i]=SortWeath$WndSp[weathrow]
                SortLoc$WndDir[i]=SortWeath$WndDir[weathrow]
                SortLoc$Hgt[i]=SortWeath$Hgt[weathrow]
            } else {
                SortLoc$WndSp[i]=SortWeath$WndSp[weathrow+1]
                SortLoc$WndDir[i]=SortWeath$WndDir[weathrow+1]
                SortLoc$Hgt[i]=SortWeath$Hgt[weathrow+1]
            }
            t = 1
        }
        if (abs(SortLoc$DateTime[i] - SortLoc$DateTime[i+1] < 50)) {
            weathrow=weathrow
        } else {
            weathrow = weathrow+1
            #if(weathrow = nrow(SortWeath)){t=1}
        }
    } #end while
}

你可以使用findInterval查找最接近值的函数：

# example data:
x <- rnorm(120000)
y <- rnorm(71000)
y <- sort(y) # second vector must be sorted
id <- findInterval(x, y, all.inside=TRUE) # finds position of last y smaller then x
id_min <- ifelse(abs(x-y[id])<abs(x-y[id+1]), id, id+1) # to find nearest

在你的情况下一些as.numeric可能需要。

# assumed that SortWeath is sorted, if not then SortWeath <- SortWeath[order(SortWeath$DateTime),]
x <- as.numeric(SortLoc$DateTime)
y <- as.numeric(SortWeath$DateTime)
id <- findInterval(x, y, all.inside=TRUE)
id_min <- ifelse(abs(x-y[id])<abs(x-y[id+1]), id, id+1)
SortLoc$WndSp  <- SortWeath$WndSp[id_min]
SortLoc$WndDir <- SortWeath$WndDir[id_min]
SortLoc$Hgt    <- SortWeath$Hgt[id_min]

一些补充：你应该从来没有，绝对更新添加值到data.frame在for循环中。检查这个比较：

N=1000
x <- numeric(N)
X <- data.frame(x=x)
require(rbenchmark)
benchmark(
    vector = {for (i in 1:N) x[i]<-1},
    data.frame = {for (i in 1:N) X$x[i]<-1}
)
#         test replications elapsed relative
# 2 data.frame          100    4.32    22.74
# 1     vector          100    0.19     1.00

data.frame版本慢 20 倍以上，并且如果包含的行数越多，差异就越大。

因此，如果您更改脚本并首先初始化结果向量：

tmp_WndSp <- tmp_WndDir <- tmp_Hg <- rep(NA, nrow(SortLoc))

然后更新循环中的值

tmp_WndSp[i] <- SortWeath$WndSp[weathrow+1]
# and so on...

并在最后（循环外）更新适当的列：

SortLoc$WndSp <- tmp_WndSp
SortLoc$WndDir <- tmp_WndDir
SortLoc$Hgt <- tmp_Hgt

它应该运行得更快。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R中基于移动时间窗口连接数据的相关文章

如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
回归时如何设置系数值；右

我正在寻找一种指定预测变量值的方法当我使用当前数据运行 glm 时其中一个变量的系数接近 1 我想将其设置为 0 8 我知道这会给我一个较低的 R 2 值但我先验地知道模型的预测能力会更大 glm 的权重组件看起来很有希望但我还没有
在 Shiny 中叠加两个 ggplot

我有一个非常大的数据集我正在使用 ggplot 在 Shiny 上绘制它我有一个与 x 轴上的值相关联的滑块我想用它对选定的数据子集重新着色并让其余数据保持原样最简单的选择是重新创建整个绘图但由于它是一个大型数据集因此这是一个
聚合日期时间以总结在特定条件下花费的时间

我很困惑我应该如何继续我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
将日期时间字符串转换为 Date 类

我有一个带有日期时间字符列的数据框当我使用as Date 除了少数实例之外我的大多数字符串都被正确解析下面的示例有望向您展示发生了什么 my attempt to parse the string to Date uses the s
将人类日期（当地时间 GMT）转换为日期

我正在服务器上工作服务器正在向我发送 GMT 本地日期的日期例如Fri Jun 22 09 29 29 NPT 2018在字符串格式上我将其转换为日期如下所示 SimpleDateFormat simpleDateFormat ne
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
将所有分号替换为空格 pt2

我尝试对 2000 多行关键字的列表运行文本分析但它们的列出方式如下战略管理风格组织所以当我使用 tm 删除标点符号时它就变成了组织的战略管理风格我认为这在某种程度上破坏了我常用术语的分析我尝试过使用 vector lt
为每个因素级别添加日期时间序列

我有一个带有因子列的数据框 s lt data frame id 901 910 s id lt as factor s id 我有一个日期时间序列 library lubridate start lt now as difftime 2
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
如何在python中转换1970年之前的日期

我写了一个方法来处理 mongodb 结果其中日期为datetime datetime i used dumps方法该方法将日期转换为不是毫秒这里如果日期在 1970 年之前则日期将转换为负值我无法处理此问题以更改回 1970 年
根据 R 数据框中的名称对列进行平均

我想知道是否有一种有效的方法来获取每组的平均值类似命名的列谁的名字结尾为 1S and 2S ex ex1S ex2S at time 1并取每组的平均值类似命名的列谁的名字结尾为 1C or 2C ex ex1C ex2C at time
如何使用 Chrono 板条箱获取 Rust 中当前的工作日？

我正在尝试使用 Chrono 板条箱获取 Rust 中当前的工作日 JavaScript 的等价物是这样的 new Date toLocaleDateString en US weekday long 我使用以下代码获取当前时间戳 let
循环遍历数组并删除项目，而不中断 for 循环

我有以下 for 循环当我使用splice 要删除一个项目我发现秒未定义我可以检查它是否未定义但我觉得可能有一种更优雅的方法来做到这一点我们的愿望是简单地删除一个项目并继续 for i 0 len Auction auctio
如何使用额外标记输出 wp_list_categories

我目前正在使用下面的脚本在无序列表中输出我的所有 WordPress 类别如何获得带有额外标记的输出 ul ul 例如 ul li Category 1 rsaquo li li Category 2 rsaquo li ul 代替 ul
空间数据xyz到矩阵

我有一个大数据框 100 000 行其中包含 LON LAT VALUE 我想将其转换为矩阵 EPSG 中的坐标 3035 我使用以下命令尝试了 reshape2 包 acast df lon lat value var value 效果
zsh：未找到命令：使用 Big Sur Mac 的终端上的 R

我从官方 cran 网站安装了 R 我可以从 Rstudio 运行 R 但是当我尝试从终端使用 R 时我得到以下结果 base ege Eges MBP R zsh command not found R base ege Eges MB
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the
R Leaflet Legend：colorBin-删除中断之间的小数

我正在使用 Leaflet 库在 R 中创建交互式 HTML 地图传说中采用的是colorBin用于创建将数据分为 6 个类别的方法使用min values and max values 我已经定义了美国社区调查收入数据的特定范围可能落
R data.table fwrite 到 fread 空间分隔符并清空

我在使用 fread 以作为分隔符和散布的空白值时遇到问题例如这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd

随机推荐

' 中声明的私有成员' aria-label='Stringstream 错误：无法访问类 'std::basic_ios<_Elem,_Traits>' 中声明的私有成员'> Stringstream 错误：无法访问类 'std::basic_ios<_Elem,_Traits>' 中声明的私有成员

在创建一个简单的异常类扩展我可以更轻松地构造错误消息时我将错误隔离为以下简单代码 include
自动递增宏扩展

使用普通C预处理器宏是否可以创建类似以下内容 INIT BASE 0x100 init starting number define BASE A GET NEXT BASE equivalent to define BASE A 0x1
jQuery 查找浮动 li 中每行的项目数

有没有办法找到项目的数量 li标签内ul其中有它的float set to left 假设我有大量文件夹这些文件夹在视觉上表示为li标签由于浮动行为一旦li不适合单行它们将被向下推给出行和列的外观我的问题是使用 jQuery
JAVAFX：可以通过代码设置css吗？

我有以下代码 progress bar gt bar fx background color linear gradient from 0em 0 75em to 0 75em 0px repeat fx accent 0 fx accen
我如何向 Activemq 发送消息

我从来不工作JMS 最近我下载了Activemq并更改端口号61616 to 61617 in all conf activemq xml文件我从命令提示符运行以下命令并在浏览器上打开控制台页面 C Users Infratab Bang
如何自动缩放一组控件的字体大小？

我在 WPF 网格中有一些 TextBlock 我想根据它们的可用宽度高度进行缩放当我搜索自动缩放字体大小时典型的建议是将 TextBlock 放入 ViewBox 中所以我这样做了
Android MediaRecorder API 不断裁剪视频比特率

我使用 MediaRecorder API 一段时间了我以为所有问题都已经过去了但我想我错了我正在使用 MediaRecorder API 将视频录制到文件中当我使用高质量的 setProfile 时我得到了良好的质量但是当我尝
如何在 React Native 中拉伸静态图像作为背景？

我想在我的 React Native 应用程序中使用背景图像图像比屏幕小所以我必须拉伸它但如果图像是这样它就不起作用从资源包加载 var styles StyleSheet create bgImage flex 1 flexDir
使用 MediaWiki 从 Wikia 页面提取文本，但返回结果一片混乱，是否有更好的方法可以从每个部分提取文本？

我正在开发一个 Android 应用程序它从 Wikia 页面提取信息并将其显示在应用程序中我目前正在拉动所有类别进行导航并将我的应用程序设置为在 WebView 中显示页面但我只想拉动信息并自行格式化而不是通过传递到 WebVi
android：如何在字符串中添加下划线
按组计算值之间的差异并匹配时间

对于每只鸟我想计算不同日期的平均每小时体温 Tb 测量值 Tb Periods 之间的差异我的目标是能够比较 BirdX 从 0900 PreI 到 09 00 DayI 10 00 PreI 到 10 00 PostI 等的 Tb 变
如何在 POST 期间获取不同资源的 JAX-RS @Path？

我有两个用于涉及用户资源的简单 Web 服务 Jersey 和 GlassFish 的 REST 类一个对所有用户进行操作例如 POSTing 的工厂另一个对单个用户进行操作例如 GET PUT 删除他们位于 Stateless
在sql server中使用case语句更新多列

我想使用 case 语句更新表查询是这样的 select case columnname when name1 then begin update table set pay1 pay1 100 pay2 pay2 20 pay3 pa
.Net Core 无法使用位图

我正在使用 Net Core 2 1 开发 Web 服务我有一个字节数组其中包含所有像素值灰度宽度高度我想从这些参数创建一个位图这是我的代码来自一个正在运行的 Net Framework 4 项目 public FileRe
CollapsingToolbarLayout 未正确调用 requestLayout()

我有一个折叠的工具栏布局其中包含图像折叠时显示工具栏标题我需要更改工具栏标题字体因此我在工具栏布局中添加了一个文本视图现在每当我折叠工具栏时都会重复生成以下错误 08 12 13 14 19 604 2263 2263 com
什么时候应该从类方法返回对对象的引用

从类方法返回引用的最佳实践是什么是否希望在没有引用的情况下返回基本类型而希望通过引用返回类对象您推荐的任何文章最佳实践文章我假设你所说的类方法是指成员函数通过引用返回的意思是返回对成员数据的引用这主要与返回对 local
Coq 中的“错误：宇宙不一致”是什么意思？

我正在努力通过软件基础 http www cis upenn edu bcpierce sf current 目前正在做教堂数字的练习这是自然数的类型签名 Definition nat forall X Type X gt X gt X
Google Finance，如何获取 JSON 数据流？

我之前试图解释这一点但显然失败了因此如果您打开了谷歌金融图表例如 http www google com finance q INDEXNASDAQ IXIC http www google com finance q INDEXN
将 HTTP 响应正文解析为 XML

我使用此代码执行 HTTP 请求并解析 XML 响应 using HttpWebResponse resp req GetResponse as HttpWebResponse if resp StatusCode HttpStatusCo
R中基于移动时间窗口连接数据

我有每小时记录一次的天气数据以及每 4 小时记录一次的位置数据 X Y 我想知道 X Y 位置的温度是多少天气数据并不完全相同因此我为每个位置编写了这个循环以扫描天气数据查找日期时间中的最接近并提取该时间的数据问题是我编

R中基于移动时间窗口连接数据

R中基于移动时间窗口连接数据 的相关文章

随机推荐

热门标签

R中基于移动时间窗口连接数据的相关文章