R 中是否有具有超过 3 个参数预测变量的 loess 实现或达到类似效果的技巧?

2024-07-03

召集所有专家局部回归 and/or R!

我遇到了标准的限制loess函数于R并希望您有一些建议。目前的实施情况仅支持 1-4 个预测器。让我列出我们的应用场景来说明为什么一旦我们要使用这很容易成为问题全局拟合参数协变量.

本质上,我们有一个空间扭曲s(x,y)叠加在多个测量值上z:

z_i = s(x_i,y_i) + v_{g_i}

这些测量z可以按相同的基础未失真测量值进行分组v对于每组g。每个测量的组成员资格 g_i 是已知的,但组的基础未失真测量值 v_g 未知,应由(global,不是局部的)回归。

我们需要估计二维空间趋势s(x,y),然后我们要删除它。在我们的应用程序中,假设在最简单的情况下有 20 组,每组至少 35 个测量值。测量值是随机放置的。以第一组为参考,因此有 19 个未知偏移。

下面的玩具数据代码(具有一维空间趋势x) 适用于两个或三个偏移组。

不幸的是,loess四个或更多偏移组的调用失败并显示错误消息

Error in simpleLoess(y, x, w, span, degree, parametric, drop.square,
normalize,  :
  only 1-4 predictors are allowed"

我尝试超越限制并得到

k>d2MAX in ehg136.  Need to recompile with increased dimensions.

这谈何容易?我找不到的定义d2MAX任何地方,似乎这可能是硬编码的——该错误显然是由 #1359 行触发的loessf.f

if(k .gt. 15)   call ehg182(105)

或者,有谁知道可以在此处应用的具有全局(参数)偏移组的局部回归的实现?

或者有更好的方法来处理这个问题吗?我试过lme具有相关结构,但这似乎要慢得多。

任何意见将不胜感激!

非常感谢,
David

###
#
# loess with parametric offsets - toy data demo
#

x<-seq(0,9,.1);
x.N<-length(x);

o<-c(0.4,-0.8,1.2#,-0.2  # works for three but not four
     );  # these are the (unknown) offsets
o.N<-length(o);
f<-sapply(seq(o.N),
          function(n){
            ifelse((seq(x.N)<= n   *x.N/(o.N+1) &
                    seq(x.N)> (n-1)*x.N/(o.N+1)),
                    1,0);
          });
f<-f[sample(NROW(f)),];

y<-sin(x)+rnorm(length(x),0,.1)+f%*%o;
s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')});
s<-paste(c('y~x',s.fs),collapse='+');
d<-data.frame(x,y,f)
names(d)<-c('x','y',s.fs);

l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d,
         span=0.4);
yp<-predict(l,newdata=d);
plot(x,y,pch='+',ylim=c(-3,3),col='red');  # input data
points(x,yp,pch='o',col='blue');           # fit of that

d0<-d; d0$f1<-d0$f2<-d0$f3<-0;
yp0<-predict(l,newdata=d0);
points(x,y-f%*%o);     # spatial distortion
lines(x,yp0,pch='+');  # estimate of that

op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]});

cat("Demo offsets:",o,"\n");
cat("Estimated offsets:",format(op,digits=1),"\n");

为什么不使用附加模型呢?包裹mgcv会处理这种模型,如果我理解你的问题,那就很好。我可能有这个错误,但是您显示的代码与 x ~ y 相关,但您的问题提到了 z ~ s(x, y) + g。我在下面展示的目的是gam()是为了回应z通过空间平滑建模x and y with g进行参数估计,其中g作为一个因素存储在数据框中:

require(mgcv)
m <- gam(z ~ s(x,y) + g, data = foo)

还是我误解了你想要的?如果您想发布一小段数据,我可以使用以下方式给出一个正确的示例mgcv...?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 中是否有具有超过 3 个参数预测变量的 loess 实现或达到类似效果的技巧? 的相关文章

  • 使用 Dplyr 查找组的最大值并改变同一表中另一列的结果[重复]

    这个问题在这里已经有答案了 我正在处理具有数千行和多列的巨大数据集 我想使用 Dplyr 查找列中组的最大值 并在同一表的另一列中改变结果 这是我的数据的示例 df lt tibble a rep letters 1 3 each 3 b
  • r tidyverse spread() 使用多个键值对不折叠行

    我正在尝试 spread 几个键 值对 但公共值列不会折叠 我认为这可能与之前的一些处理有关 或者更可能的是我不知道传播两个或更多键 值对以获得我期望的结果的正确方法 我从这个数据集开始 library tidyverse df lt ti
  • 创建“缺失的对象”(又名:“空符号”、“空对象”)/形式操作所需的/

    如何在R中创建一个 空对象 编辑 我不知道如何正确地调用这个 东西 所以我称之为 空对象 其他 空符号 零长度符号 缺失对象 也可能被使用 编辑2 最后 我倾向于将 缺失的符号对象 定为 事物 的名称 J Chambers 似乎也在他 20
  • 可以在点阵图和 ggplot2 图中使用 Polygon() 或等效函数吗?

    是否可以注释lattice or ggplot2 包含使用以下命令创建的元素的图形polygon 或使用类似功能创建的元素 graphics图书馆 除了网上发布的和 Deepayan Sarkar 书中印刷的简单图表示例之外 我对这两个库都
  • 如何在 R 中将 mutate_at() 与两组变量一起使用

    使用 dplyr 我想将一列除以另一列 其中两列具有相似的模式 我有以下数据框 My data data frame var a 101 110 var b 201 210 number a 1 10 number b 21 30 我想创建
  • 旋转和调整符号ggplot

    我正在尝试在 ggplot geom point 中绘制一个图 并且我能够绘制它 但我想根据某些变量来操纵特定符号的外观 我想按 data frame 定义的角度旋转符号 pch 22 Pch 22 看起来像一个矩形 另外 我想根据数据框中
  • R Markdown 水平规则也适用于 LaTeX pdf?

    我知道 是 Pandoc 的 Markdown 水平线 这条水平线在 HTML 上看起来不错 但如果我将 Markdown 编织成 pdf 则水平线仅占 pdf 宽度的一半 并且居中 这种组合只会让水平尺看起来很丑 如何在 R Markdo
  • R nlminb 假收敛实际上意味着什么?

    我使用函数 nlminb 来最大化函数并通过消息 false convergence 获得收敛 收敛 0 我尝试了文档但没有答案 我试图得到港口文件 http www netlib org port 在函数上并且可以找到该函数nlminb
  • R nlminb 假收敛实际上意味着什么?

    我使用函数 nlminb 来最大化函数并通过消息 false convergence 获得收敛 收敛 0 我尝试了文档但没有答案 我试图得到港口文件 http www netlib org port 在函数上并且可以找到该函数nlminb
  • R ggplot2 图例内的图例

    因此 我有以下 data frame 并且我想在一张图中为每个 zval 和类型 tp 生成 yval 与 xval 的两个图 左边 gt df xval yval se zval cond 1 1 0 1 831564e 02 1 831
  • RMarkdown。如何减少标题栏和正文开头之间的间距

    我已经在 Mac 上通过 RStudio 成功使用了 RMarkdown 最近升级到 RStudio 1 2 5019 和tinytex 0 18 现在我的 标题块 和 第一个正文文本 标题 之间的垂直间距增加了 简单的例子 故意排除aut
  • 字符串向量的按元素串联[重复]

    这个问题在这里已经有答案了 假设我有两个字符向量 a lt c a b c b lt c 1 2 3 我如何合并它们以便我得到 ab lt c a1 b2 c3 您可以使用paste or paste0 gt a lt c a b c gt
  • 使用超过 30 个预测变量时 MuMin pdredge() 出错

    我遇到了以下错误 仅当我将具有超过 30 个预测变量的模型传递给 pdredge 时才会发生 sprintf gettext fmt 域 域 中的错误 格式 d 无效 对数字对象使用格式 f e g 或 a 我在一台通过 RStudio 运
  • 光栅到矢量:terra 包中的 WriteVector 导致致命错误

    我最近几天在 RStudio 上尝试过以下示例代码 library terra binar lt rast C Users BIC Desktop 21 binarisation SWIR tif poly rast lt as polyg
  • 按组在数据帧上运行自定义函数

    用于循环数据框中的组的自定义函数 这是一些示例数据 set seed 42 tm lt as numeric c 1 2 3 3 2 1 2 3 1 1 d lt as numeric sample 0 2 size 10 replace
  • 有pmin和pmax各取na.rm,为什么没有psum?

    看来 R 可能缺少一个明显的简单函数 psum 它是否以不同的名称存在 或者位于某个包中 x c 1 3 NA 5 y c 2 NA 4 1 min x y na rm TRUE ok 1 1 max x y na rm TRUE ok 1
  • 正则表达式在日期中添加连字符

    在 R 中 我有一个如下所示的字符串 x lt c 20130603 00 00 03 102 20130703 00 01 03 103 20130804 00 03 03 104 我想通过使用一个单一的看起来像下面gsub命令 而不是使
  • 使用单独的线型绘制 ggplot2 中的缺失值

    我正在使用 ggplot2 创建线图 但缺少用 NaN 表示的数据 我的线图当前没有在缺失值之间添加任何线 但是 我想用虚线连接缺失的数据 而所有已知的数据用实线连接 这是我当前绘图的代码 其中包含我的数据框的一小部分和下面的绘图图像 ma
  • R中逻辑回归的分类表

    我有一个由二分因变量组成的数据集 Y 和 12 个自变量 X1 to X12 存储在 csv 文件中 这是数据的前 5 行 Y X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 0 9 3 86 111 126
  • 使用深度名称向量作为索引替换嵌套列表

    采取一个简单的嵌套列表L L lt list lev1 list lev2 c bit1 bit2 other list yep 1 L lev1 lev1 lev2 1 bit1 bit2 other other yep 1 1 一个向量

随机推荐