召集所有专家局部回归 and/or R!
我遇到了标准的限制loess函数于R并希望您有一些建议。目前的实施情况仅支持 1-4 个预测器。让我列出我们的应用场景来说明为什么一旦我们要使用这很容易成为问题全局拟合参数协变量.
本质上,我们有一个空间扭曲s(x,y)叠加在多个测量值上z:
z_i = s(x_i,y_i) + v_{g_i}
这些测量z可以按相同的基础未失真测量值进行分组v对于每组g。每个测量的组成员资格 g_i 是已知的,但组的基础未失真测量值 v_g 未知,应由(global,不是局部的)回归。
我们需要估计二维空间趋势s(x,y),然后我们要删除它。在我们的应用程序中,假设在最简单的情况下有 20 组,每组至少 35 个测量值。测量值是随机放置的。以第一组为参考,因此有 19 个未知偏移。
下面的玩具数据代码(具有一维空间趋势x) 适用于两个或三个偏移组。
不幸的是,loess四个或更多偏移组的调用失败并显示错误消息
Error in simpleLoess(y, x, w, span, degree, parametric, drop.square,
normalize, :
only 1-4 predictors are allowed"
我尝试超越限制并得到
k>d2MAX in ehg136. Need to recompile with increased dimensions.
这谈何容易?我找不到的定义d2MAX任何地方,似乎这可能是硬编码的——该错误显然是由 #1359 行触发的loessf.f
if(k .gt. 15) call ehg182(105)
或者,有谁知道可以在此处应用的具有全局(参数)偏移组的局部回归的实现?
或者有更好的方法来处理这个问题吗?我试过lme具有相关结构,但这似乎要慢得多。
任何意见将不胜感激!
非常感谢,
David
###
#
# loess with parametric offsets - toy data demo
#
x<-seq(0,9,.1);
x.N<-length(x);
o<-c(0.4,-0.8,1.2#,-0.2 # works for three but not four
); # these are the (unknown) offsets
o.N<-length(o);
f<-sapply(seq(o.N),
function(n){
ifelse((seq(x.N)<= n *x.N/(o.N+1) &
seq(x.N)> (n-1)*x.N/(o.N+1)),
1,0);
});
f<-f[sample(NROW(f)),];
y<-sin(x)+rnorm(length(x),0,.1)+f%*%o;
s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')});
s<-paste(c('y~x',s.fs),collapse='+');
d<-data.frame(x,y,f)
names(d)<-c('x','y',s.fs);
l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d,
span=0.4);
yp<-predict(l,newdata=d);
plot(x,y,pch='+',ylim=c(-3,3),col='red'); # input data
points(x,yp,pch='o',col='blue'); # fit of that
d0<-d; d0$f1<-d0$f2<-d0$f3<-0;
yp0<-predict(l,newdata=d0);
points(x,y-f%*%o); # spatial distortion
lines(x,yp0,pch='+'); # estimate of that
op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]});
cat("Demo offsets:",o,"\n");
cat("Estimated offsets:",format(op,digits=1),"\n");