“poly()”如何生成正交多项式？如何理解返回的“coefs”？

2024-04-12

我对正交多项式的理解是它们采用以下形式

y(x) = a1 + a2(x - c1) + a3(x - c2)(x - c3) + a4(x - c4)(x - c5)(x - c6)...最多达到所需的术语数

where a1, a2 etc是每个正交项的系数（拟合之间有所不同），并且c1, c2 etc是正交项内的系数，确定这些系数以使项保持正交性（使用相同的拟合之间一致x values)

我明白poly()用于拟合正交多项式。一个例子

x = c(1.160, 1.143, 1.126, 1.109, 1.079, 1.053, 1.040, 1.027, 1.015, 1.004, 0.994, 0.985, 0.977) # abscissae not equally spaced

y = c(1.217395, 1.604360, 2.834947, 4.585687, 8.770932, 9.996260, 9.264800, 9.155079, 7.949278, 7.317690, 6.377519, 6.409620, 6.643426)

# construct the orthogonal polynomial
orth_poly <- poly(x, degree = 5)

# fit y to orthogonal polynomial
model <- lm(y ~ orth_poly)

我想提取两个系数a1, a2 etc，以及正交系数c1, c2 etc。我不知道该怎么做。我的猜测是

model$coefficients

返回第一组系数，但我正在努力解决如何提取其他系数的问题。也许之内

attributes(orth_poly)$coefs

非常感谢。

我刚刚意识到有一个密切相关的问题从R的poly()函数中提取正交多项式系数？ https://stackoverflow.com/q/26728289/48917382年前。答案只是解释什么predict.poly确实如此，但我的回答给出了完整的画面。

第 1 部分：如何poly表示正交多项式

我对正交多项式的理解是它们采用以下形式

y(x) = a1 + a2(x - c1) + a3(x - c2)(x - c3) + a4(x - c4)(x - c5)(x - c6)...最多达到所需的术语数

不不，没有这么干净的形式。poly()生成可以用以下递归算法表示的单调正交多项式。就是这样predict.poly生成线性预测矩阵。出奇，poly它本身并没有使用这样的递归，而是使用了一种残酷的力量：正交跨度的普通多项式模型矩阵的 QR 分解。然而，这相当于递归。

第 2 部分：输出说明poly()

让我们考虑一个例子。采取x在你的帖子中，

X <- poly(x, degree = 5)

#                 1           2           3            4           5
# [1,]  0.484259711  0.48436462  0.48074040  0.351250507  0.25411350
# [2,]  0.406027697  0.20038942 -0.06236564 -0.303377083 -0.46801416
# [3,]  0.327795682 -0.02660187 -0.34049024 -0.338222850 -0.11788140
# ...           ...          ...        ...          ...         ...
#[12,] -0.321069852  0.28705108 -0.15397819 -0.006975615  0.16978124
#[13,] -0.357884918  0.42236400 -0.40180712  0.398738364 -0.34115435
#attr(,"coefs")
#attr(,"coefs")$alpha
#[1] 1.054769 1.078794 1.063917 1.075700 1.063079
# 
#attr(,"coefs")$norm2
#[1] 1.000000e+00 1.300000e+01 4.722031e-02 1.028848e-04 2.550358e-07
#[6] 5.567156e-10 1.156628e-12

这些属性如下：

alpha[1]给出x_bar = mean(x)，即中心；
alpha - alpha[1] gives alpha0, alpha1, ..., alpha4 (alpha5已计算但之前被丢弃poly回报X，因为它不会用于predict.poly);
第一个值是norm2始终为 1。倒数第二个是l0, l1, ..., l5，给出平方柱范数X; l0是丢弃的列平方范数P0(x - x_bar)，这始终是n (i.e., length(x)）；而第一个1只是为了让递归在内部进行而被填充predict.poly.
beta0, beta1, beta2, ..., beta_5不返回，但可以通过以下方式计算norm2[-1] / norm2[-length(norm2)].

第 3 节：实施poly同时使用 QR 分解和递归算法

如前面提到的，poly不使用递归，而predict.poly做。就我个人而言，我不明白这种不一致设计背后的逻辑/原因。在这里我会提供一个功能my_poly我自己写的，使用递归来生成矩阵，如果QR = FALSE. When QR = TRUE，这是一个类似但不完全相同的实现poly。代码注释得很好，有助于您理解这两种方法。

## return a model matrix for data `x`
my_poly <- function (x, degree = 1, QR = TRUE) {
  ## check feasibility
  if (length(unique(x)) < degree)
    stop("insufficient unique data points for specified degree!")
  ## centring covariates (so that `x` is orthogonal to intercept)
  centre <- mean(x)
  x <- x - centre
  if (QR) {
    ## QR factorization of design matrix of ordinary polynomial
    QR <- qr(outer(x, 0:degree, "^"))
    ## X <- qr.Q(QR) * rep(diag(QR$qr), each = length(x))
    ## i.e., column rescaling of Q factor by `diag(R)`
    ## also drop the intercept
    X <- qr.qy(QR, diag(diag(QR$qr), length(x), degree + 1))[, -1, drop = FALSE]
    ## now columns of `X` are orthorgonal to each other
    ## i.e., `crossprod(X)` is diagonal
    X2 <- X * X
    norm2 <- colSums(X * X)    ## squared L2 norm
    alpha <- drop(crossprod(X2, x)) / norm2
    beta <- norm2 / (c(length(x), norm2[-degree]))
    colnames(X) <- 1:degree
    } 
  else {
    beta <- alpha <- norm2 <- numeric(degree)
    ## repeat first polynomial `x` on all columns to initialize design matrix X
    X <- matrix(x, nrow = length(x), ncol = degree, dimnames = list(NULL, 1:degree))
    ## compute alpha[1] and beta[1]
    norm2[1] <- new_norm <- drop(crossprod(x))
    alpha[1] <- sum(x ^ 3) / new_norm
    beta[1] <- new_norm / length(x)
    if (degree > 1L) {
      old_norm <- new_norm
      ## second polynomial
      X[, 2] <- Xi <- (x - alpha[1]) * X[, 1] - beta[1]
      norm2[2] <- new_norm <- drop(crossprod(Xi))
      alpha[2] <- drop(crossprod(Xi * Xi, x)) / new_norm
      beta[2] <- new_norm / old_norm
      old_norm <- new_norm
      ## further polynomials obtained from recursion
      i <- 3
      while (i <= degree) {
        X[, i] <- Xi <- (x - alpha[i - 1]) * X[, i - 1] - beta[i - 1] * X[, i - 2]
        norm2[i] <- new_norm <- drop(crossprod(Xi))
        alpha[i] <- drop(crossprod(Xi * Xi, x)) / new_norm
        beta[i] <- new_norm / old_norm
        old_norm <- new_norm
        i <- i + 1
        }
      }
    }
  ## column rescaling so that `crossprod(X)` is an identity matrix
  scale <- sqrt(norm2)
  X <- X * rep(1 / scale, each = length(x))
  ## add attributes and return
  attr(X, "coefs") <- list(centre = centre, scale = scale, alpha = alpha[-degree], beta = beta[-degree])
  X
  }

第 4 节：输出说明my_poly

X <- my_poly(x, 5, FALSE)

结果矩阵与生成的矩阵相同poly因此被排除在外。属性不太一样。

#attr(,"coefs")
#attr(,"coefs")$centre
#[1] 1.054769

#attr(,"coefs")$scale
#[1] 2.173023e-01 1.014321e-02 5.050106e-04 2.359482e-05 1.075466e-06

#attr(,"coefs")$alpha
#[1] 0.024025005 0.009147498 0.020930616 0.008309835

#attr(,"coefs")$beta
#[1] 0.003632331 0.002178825 0.002478848 0.002182892

my_poly更明显地返回构造信息：

centre gives x_bar = mean(x);
scale给出列范数（的平方根norm2由返回poly);
alpha gives alpha1, alpha2, alpha3, alpha4;
beta gives beta1, beta2, beta3, beta4.

第 5 节：预测例程my_poly

Since my_poly返回不同的属性，stats:::predict.poly不兼容my_poly。这是适当的例程my_predict_poly:

## return a linear predictor matrix, given a model matrix `X` and new data `x`
my_predict_poly <- function (X, x) {
  ## extract construction info
  coefs <- attr(X, "coefs")
  centre <- coefs$centre
  alpha <- coefs$alpha
  beta <- coefs$beta
  degree <- ncol(X)
  ## centring `x`
  x <- x - coefs$centre
  ## repeat first polynomial `x` on all columns to initialize design matrix X
  X <- matrix(x, length(x), degree, dimnames = list(NULL, 1:degree))
  if (degree > 1L) {
    ## second polynomial
    X[, 2] <- (x - alpha[1]) * X[, 1] - beta[1]
    ## further polynomials obtained from recursion
    i <- 3
    while (i <= degree) {
      X[, i] <- (x - alpha[i - 1]) * X[, i - 1] - beta[i - 1] * X[, i - 2]
      i <- i + 1
      }
    }
  ## column rescaling so that `crossprod(X)` is an identity matrix
  X * rep(1 / coefs$scale, each = length(x))
  }

考虑一个例子：

set.seed(0); x1 <- runif(5, min(x), max(x))

and

stats:::predict.poly(poly(x, 5), x1)
my_predict_poly(my_poly(x, 5, FALSE), x1)

给出完全相同的结果预测矩阵：

#               1          2           3          4          5
#[1,]  0.39726381  0.1721267 -0.10562568 -0.3312680 -0.4587345
#[2,] -0.13428822 -0.2050351  0.28374304 -0.0858400 -0.2202396
#[3,] -0.04450277 -0.3259792  0.16493099  0.2393501 -0.2634766
#[4,]  0.12454047 -0.3499992 -0.24270235  0.3411163  0.3891214
#[5,]  0.40695739  0.2034296 -0.05758283 -0.2999763 -0.4682834

请注意，预测例程仅采用现有的构造信息，而不是重建多项式。

第 6 节：只管治疗poly and predict.poly作为一个黑匣子

很少需要了解内部的一切。对于统计建模来说，知道这一点就足够了poly构造模型拟合的多项式基，其系数可以在lmObject$coefficients。在进行预测时，predict.poly永远不需要被用户调用，因为predict.lm会为你做的。这样一来，只要治疗就完全可以了poly and predict.poly作为一个黑匣子。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

“poly()”如何生成正交多项式？如何理解返回的“coefs”？的相关文章

r caret 包中的 train 函数的模型输出尺寸巨大

我正在使用 bagFDA 模型进行训练train r caret 包中的函数并将模型输出保存为 Rdata 文件输入文件大约有 300k 条记录有 26 个变量但输出 Rdata 大小为 3G 我只是运行以下命令 modelout
如何安装和管理多个版本的 R 包

我正在开发一个使用 R 进行可重现计算的框架我正在努力解决的一个问题是某些 R 代码可能在包的 X Y Z 版本中完美运行但是为什么你在 3 年后尝试重现它这些包已经更新了一些功能发生了变化代码不再运行此问题还会影响使用包的
使用 gtable 排列 ggplot 绘图（具有相同宽度的 grobs）以创建 2x2 布局

我正在尝试使用 grobs 和 gtable 将 4 个 ggplot2 图排列成 2x2 网格我不知道如何设置宽度也不知道如何设置非 1xn 或 nx1 排列使用此代码 data iris a lt ggplot iris aes
如何在R中使用OpenNLP获取POS标签？

这是 R 代码 library NLP library openNLP tagPOS lt function x s lt as String x word token annotator lt Maxent Word Token Anno
向图像添加坐标，以用作 R 中的 Leaflet、Shiny 和 Shinydashboard 包中的地图

我计划使用 Leaflet Shiny 和 Shinydashboard 沿着以下很棒的路线创建一个带有医院 OHS 事件标记的交互式地图交互式地图和直方图模板 http shiny rstudio com gallery superzip
如何管理和处理 R 包中的补充数据

我想在我的 R 包中添加补充数据我知道关于LazyData true in DESCRIPTION 但不想使用它因为示例数据相当大所以我创建了一个目录 data 其中包含两个 RData文件和一个datalist 我添加使用tools
根据另一个向量替换向量中的值

我想替换向量中的值 x 与另一个向量 y 陷阱 22 方法需要是动态的以适应向量中不同数量的级别 x 例如考虑向量x x lt sample c 1 2 3 4 5 100 replace TRUE gt x 1 2 4 1 1 3
如何加速 R for 循环？

我正在为 R 中 GWmodel 包中的 gwr basic 函数运行以下 for 循环我需要做的是收集任何给定带宽的估计参数的平均值代码如下 library GWmodel data DubVoter Dub voter LARent
将四元数旋转转换为旋转矩阵？

基本上给定一个四元数 qx qy qz qw 我如何将其转换为OpenGL旋转矩阵我也对哪个矩阵行是向上向右向前等感兴趣我有一个四元数的相机旋转我需要在向量中以下代码基于四元数 qw qx qy qz 其中顺序基于 Boo
了解用于处理色边距的scale_fill_continuous_divergingx参数输入

这个问题是我上一个问题的延续here https stackoverflow com questions 58718527 setting midpoint for continuous diverging color scale on a
grid.arrange 中的错误 -rangeGrob() 函数

我有两个图 p1 和 p2 我试图使用 grid arrage 绘制它们我的代码如下所示 grid arrange p1 p2 ncol 2 top textGrob Distribution across each day of the
删除 R 中具有重复属性的行

我有一个大数据框其中包含以下列 ID time OS IP 该数据帧的每一行对应一个条目在该数据框中对于某些IDs存在多个条目行我想删除这些多行显然同一 ID 的其他属性会有所不同或者换句话说我只想要每个 ID 一个条目行
read.table 和 read.delim 函数之间的区别

两者有什么区别read table and read delim R语言中的函数当您不确定函数的作用时除了阅读帮助页面之外您还可以检查函数的实际代码例如输入read delim显示该函数包含以下代码 gt read delim f
R：如何根据规范更改数据框中的列名称

我有一个数据框它的开头如下 SM H1455 SM V1456 SM K1457 SM X1461 SM K1462 ENSG00000000419 8 290 270 314 364 240 ENSG00000000457 8 252
当测试集中不存在响应变量时，h2o 预测有时会失败

当在不存在响应变量的测试集上进行预测时如果在训练中对因子变量使用一种热编码则 h2o 会以各种不同的方式失败无论是在训练 GLM 时隐式指定还是在其他方法中显式指定时 R 3 4 0 和 h2o 3 12 0 1 中存在此错误我们还
使用 R 从字符串中提取函数参数

最好使用stringr包我想创建一个函数extract 以字符串向量作为参数 vec lt c div span icon hospital user i18n t Enrolments or i18n t Paper a string
使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
在 R Shiny 中，如何使用可排序 js 将其在列表中出现的顺序次数附加到每个列表元素？

下面的可重现代码适用于将元素从一个面板拖动到另一个面板并在拖动到面板中自动使用 HTML CSS 对拖入的每个元素进行排名顺序编号但是我现在尝试附加到每个拖动到列表元素的末尾使用某种形式的paste0 我假设该元素在拖至
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
将天气 iframe 嵌入到 Shiny Dashboard 中

我正在尝试将 Forecast io 的天气预报嵌入到闪亮的仪表板中我最初在使用符号时遇到了麻烦但看到一篇文章提供了如何使用特殊字符格式化 HTML 代码的示例但是当我运行该应用程序时我看到一个简单的未找到即使我知道该链接有

随机推荐

监控Windows共享

我正在尝试使用 C 监视与 Windows 共享的连接我非常确定这是可能的因为您可以从 Windows 控制台管理器看到连接到您的人员虽然我不介意使用 WMI 的解决方案但我更喜欢一些替代方法我所说的连接是指有人在受监控的电脑上打
如何使用纯 javascript 获取 DIV 内的所有 id

我想立即获取 Div 内每个元素的每个 ID 并更改它们的所有类名喜欢 div div div div div div div div div div 我见过使用库的解决方案但这可以用纯 Javascript 实现吗
在ASP.NET中的子控件中创建ASP.NET ReportViewer；文档结构图按钮中断

我们在使用 Visual Studio 2008 ReportViewer 控件时遇到了一个奇怪的问题具体来说当我们在页面上有一个子控件并且子控件本身承载一个报表查看器并且该报表具有文档结构图时显示隐藏文档结构图按钮上的回发似乎
如何使用 jQuery 将 div css 的可见性更改为可见

我的屏幕上有下一个和上一个按钮当页面最初加载时我希望隐藏上一个按钮并且一旦用户单击下一个按钮我希望上一个按钮 div 标签可见我有一个用于上一个按钮的 CSS 属性我将其可见性值设置为 False 还有一
.htaccess mod 重写规则和与号

我已经为此苦苦挣扎了两天目前我有以下重写规则 RewriteRule index php u 1 NC L 它将 example com 后面的所有内容作为 GET 变量 u 移植到 index php 它正在index php中进行处理
XOR 加密有什么问题？

我编写了一个简短的 C 程序来对文件进行 XOR 加密我可以将其用于一些个人文件如果它被破解那没什么大不了的我只是防止临时查看者基本上我采用 ASCII 密码并重复将密码与文件中的数据进行异或但现在我很好奇如果有人想破解这个
Spring Boot - 无法启动嵌入式 tomcat 错误

pom xml
类似于 std::integral_constant 但在 std C++20 库中具有自动模板参数？

从C 20开始可以使用auto实现积分常量的模板参数在线尝试一下 https godbolt org z 3dfq7bbP1 template
使用 StackLayout 进行标签换行

我正在使用 Xamarin 并使用 XAML 创建视图但我一生都无法让这个标签按照我想要的方式包装如果标签到达屏幕边缘我希望它像这样换行现在它看起来像这样这是我的代码
使用 Python 导出 Tensorflow 网络并在不使用 Bazel 的情况下使用 C++ 导入

使用 TensorFlow 我尝试在 C 文件中加载我在 Python 中训练的网络我正在保存带有输入张量的网络x和输出张量y在 Python 上 with tf Session graph tf Graph as sess tf sav
facebook opengraph 中的推断属性是什么意思 [重复]

这个问题在这里已经有答案了可能的重复在对象调试器中得到错误的 ogtype https stackoverflow com questions 9953779 get wrong ogtype in object debugger 我有
从角度服务通过管道传输时，rxjs catchError 不起作用

使用 redux 和 Angular 我有以下效果 Effect public authenticate Observable
如何分割字节数组

我在内存中有一个字节数组从文件中读取我想在某个点索引分割字节数组而不必只创建一个新的字节数组并一次复制每个字节从而增加操作的内存占用我想要的是这样的 byte largeBytes 1 2 3 4 5 6 7 8 9 byte
如何使用DialogFragment和FragmentManager制作DatePicker？

所以我已经在这个问题上有一段时间了但我似乎无法弄清楚我对 Android 开发还很陌生所以请耐心等待我对创建日期选择器不太熟悉我学会了以不推荐使用的方式来完成它只是为了掌握它的窍门使用本教程来帮助我加快速度 http deve
使用 CLI 时如何将 Java 类添加到 Worklight 适配器

我正在尝试将 Java 类添加到我的适配器如教程中所述在适配器中使用 Java http public dhe ibm com software mobile solutions worklight docs v620 04 12 Usi
当鼠标悬停在放置目标上时如何更改拖放光标

我有一个应用程序其中包含一个取消归档文件属性文件的放置目标我想将表单的 DragEnter 事件中的鼠标光标更改为我作为嵌入资源的自定义光标 cur 放置目标是带有目标图像的透明形式整个表格是放置目标我知道当我控制拖动源时可以使
通过 AJAX 将动态字段添加到嵌套表单

我一直在我的应用程序上观看和重现这些轨道广播 196 嵌套模型表单第 1 部分 http railscasts com episodes 196 nested model form part 1 and 197 嵌套模型形式第 2 部分
如何在 R 中堆叠数据框[重复]

这个问题在这里已经有答案了我有一个数据框我想将其堆叠在 R 中这样我最终会得到三列下面是当前格式的一些示例数据 gt dput df structure list Day c d1 d2 d3 d4 d5 d6 d7 d8 d9 d
使用 Java 代理将类添加到类路径

我正在使用 Java Agent 和 Javassist 向某些 JDK 类添加一些日志记录本质上当系统加载一些 TLS 类时 Javassist 会向它们添加一些额外的字节码以帮助我调试一些连接问题考虑到此类包含在代理 jar 中
“poly()”如何生成正交多项式？如何理解返回的“coefs”？

我对正交多项式的理解是它们采用以下形式 y x a1 a2 x c1 a3 x c2 x c3 a4 x c4 x c5 x c6 最多达到所需的术语数 where a1 a2 etc是每个正交项的系数拟合之间有所不同并且c1 c2 e

“poly()”如何生成正交多项式？如何理解返回的“coefs”？

“poly()”如何生成正交多项式？如何理解返回的“coefs”？ 的相关文章

随机推荐

热门标签

“poly()”如何生成正交多项式？如何理解返回的“coefs”？的相关文章