在循环中预测.lm()。警告：排名不足的拟合预测可能会产生误导

2024-04-29

此 R 代码引发警告

# Fit regression model to each cluster
y <- list() 
length(y) <- k
vars <- list() 
length(vars) <- k
f <- list()
length(f) <- k

for (i in 1:k) {
  vars[[i]] <- names(corc[[i]][corc[[i]]!= "1"])
  f[[i]]  <- as.formula(paste("Death ~", paste(vars[[i]], collapse= "+")))
  y[[i]]  <- lm(f[[i]], data=C1[[i]]) #training set
  C1[[i]] <- cbind(C1[[i]], fitted(y[[i]]))
  C2[[i]] <- cbind(C2[[i]], predict(y[[i]], C2[[i]])) #test set
}

我有一个训练数据集（C1）和一个测试数据集（C2）。每一项有 129 个变量。我对 C1 进行了 k 表示聚类分析，然后根据聚类成员资格分割我的数据集并创建了不同聚类的列表 (C1[[1]], C1[[2]], ..., C1[[k] ]）。我还为 C2 中的每个案例分配了一个集群成员资格，并创建了 C2[[1]],..., C2[[k]]。然后我对 C1 中的每个簇进行线性回归。我的因变量是“死亡”。我的预测变量在每个集群中都不同，vars[[i]] (i=1,...,k) 显示预测变量名称列表。我想预测测试数据集中每个案例的死亡 (C2[[1]],..., C2[[k])。当我针对某些集群运行以下代码时。

我收到这个警告：

In predict.lm(y[[i]], C2[[i]]) :
prediction from a rank-deficient fit may be misleading

我读了很多有关此警告的内容，但我无法弄清楚问题是什么。

您可以使用以下命令检查预测函数body(predict.lm)。在那里你会看到这一行：

if (p < ncol(X) && !(missing(newdata) || is.null(newdata))) 
    warning("prediction from a rank-deficient fit may be misleading")

此警告检查数据矩阵的排名是否至少等于您想要拟合的参数数量。调用它的一种方法是具有一些共线协变量：

data <- data.frame(y=c(1,2,3,4), x1=c(1,1,2,3), x2=c(3,4,5,2), x3=c(4,2,6,0), x4=c(2,1,3,0))
data2 <- data.frame(x1=c(3,2,1,3), x2=c(3,2,1,4), x3=c(3,4,5,1), x4=c(0,0,2,3))
fit <- lm(y ~ ., data=data)

predict(fit, data2)
       1        2        3        4 
4.076087 2.826087 1.576087 4.065217 
Warning message:
In predict.lm(fit, data2) :
  prediction from a rank-deficient fit may be misleading

请注意，x3 和 x4 的方向相同data。一个是另一个的倍数。这可以通过检查length(fit$coefficients) > fit$rank

另一种方法是使用比可用变量更多的参数：

fit2 <- lm(y ~ x1*x2*x3*x4, data=data)
predict(fit2, data2)
Warning message:
In predict.lm(fit2, data2) :
  prediction from a rank-deficient fit may be misleading

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在循环中预测.lm()。警告：排名不足的拟合预测可能会产生误导的相关文章

从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
要在子集中显示的非数字条目的维恩图

我有以下数据框 SET1 SET2 SET3 par1 par2 par1 par2 par3 par2 par3 par4 par5 我想制作一个维恩图其中所有这些 parX 元素都显示在各自的子集中即作为标签而不仅仅是重叠元素的数
当设置 coord_fixed 时，ggplot/shiny 中的鼠标悬停坐标是错误的

我正在使用问题中的答案当您将鼠标悬停在闪亮的 ggplot 上时出现工具提示 https stackoverflow com questions 27965931 tooltip when you mouseover a ggplot o
ggplot：如何限制条形图中的输出，以便仅显示最频繁出现的情况？

我几个小时以来一直在寻找这个简单的东西但没有结果我有一个数据框其中一列为变量国家地区我想要两件事以下绘制最常见的国家地区最常见的位于顶部找到部分解决方案EDIT找到完整的解决方案 gt gt 重点问题是根据频率限制条形图
使用点阵个性化 R 上显示的 X 轴值

我收集了大量包含日期客户端及其 NFS 使用情况的数据我正在使用lattice R包进行绘图正如对超级用户的建议 https superuser com questions 523195 plot custom log data on
将维基百科中的表格加载到 R 中

我正在尝试从以下 URL 将最高法院法官表加载到 R 中 https en wikipedia org wiki List of Justices of the Supreme Court of the United States http
R 中 SVG 图形的最佳设备？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想从 R 导出 SVG 图形似乎有两种选择 RSvgDevice 和 Cairo 有人可以对这些包发表评论吗是默认的还是明显比另一个
我如何查看 quantmod 包中所有可用的数据系列？

如何显示可用的所有报价数据系列的列表例如使用雅虎的 getSymbols 我不知道有什么办法 TTR包有一个功能 stockSymbols 下载 NYSE AMEX 和 NASDAQ 的所有当前代码它试图将它们采用雅虎可接受的格式但
R 中的数据框操作 - 将单元格向左移动并删除 NA

我有一个数据框其列由随机分布的值和 NA 组成如下所示 a lt c S E NA S NA b lt c A NA M G K c lt c I NA NA NA L meh lt dataframe a b c 1 2 3 4 5
更改绘图区域背景颜色

我想使用我们公司的颜色在 R 中制作一个图表这意味着所有图表的背景应为浅蓝色但绘图区域应为白色我正在寻找答案发现绘制一个矩形就可以完成这项工作几乎然而绘图区域现在是白色的并且图形不再可见这可能吗 getSymbols SP
斯皮尔曼相关性和联系

我正在一小组配对排名上计算斯皮尔曼的 rho 斯皮尔曼因处理领带不当而闻名例如取2组8个排名即使两组中有6个是平局相关性仍然很高 gt cor test c 1 2 3 4 5 6 7 8 c 0 0 0 0 0 0 7 8 met
如何使用 dplyr 管道将额外参数传递给 purrr::map

我有以下数据框和功能 param df lt data frame x 1 3 0 1 y 3 1 0 2 param df gt x y gt 1 1 1 2 8 gt 2 2 1 1 8 gt 3 3 1 0 8 my function
devtools::test() 有效，但 devtools::check() 无效。为什么？

我正在测试this https github com beanumber etlR 包以下三件事就可以正常工作 devtools test devtools test file tests testthat R Travis CI 与 R
计算字符串向量中连续数字的函数

我想创建一个函数它接受至少 1 个元素的字符串对象并包含数字 2 到 5 并确定是否存在至少 N 长度的连续数字其中 N 是实际数字值如果是则返回字符串 true 否则返回字符串 false 例如 Input 555123 Outp
ggplot 的每个方面都有不同的 `geom_hline()`

这个问题在这里已经有答案了 library tidyverse ggplot mpg aes cty hwy geom point facet grid year fl geom hline yintercept mean mpg hwy
使用非标准评估公式

我正在创建一个使用的包非标准评价 http adv r had co nz Computing on the language html跟踪列的含义该包在函数之间传递数据框这些函数执行同一组列的各种操作非标准评估对此非常有用 my s
ggplot geom_bar - 条形太宽

对于这个非信息性的标题我感到很抱歉 gt y read csv textConnection scan sep n what raw org art type length 191 gk Finish short 4 147 ik Att
聚合函数在数据框中创建不需要的向量

我在函数中创建数据帧时遇到了一个奇怪的问题但是在 data frame 之外使用相同的方法效果很好这是基本函数我用它来计算数据集的平均值标准差和标准误差 aggregateX lt function formula dataset
Linux 中的 R 有哪些可用的 IDE？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Linux 中的 R 有哪些好的 IDE 我尝试过 Rcmdr 和 Eclipse 但似乎都不具有与 Windows 中的 Tinn R
给定文档，选择相关片段

当我在这里提出问题时自动搜索返回的问题的工具提示给出了问题的前一点但其中相当一部分没有给出任何比理解问题更有用的文本标题有谁知道如何制作一个过滤器来删除问题中无用的部分我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子例如

随机推荐

Karate UI 中的 ShadowRoot dom 元素访问问题

我正在尝试访问 ShadowRoot dom 树元素但我面临的问题是我无法使用特定的 html 元素来调用 ShadowRoot 因为该元素是动态的请参见下面的 html 片段 id vaadin text field error 0
利用“写入时复制”将数据复制到 Multiprocessing.Pool() 工作进程

我有一点multiprocessingPython 代码看起来有点像这样 import time from multiprocessing import Pool import numpy as np class MyClass objec
如何使用 json 谷歌翻译 api？

我正在尝试使用来自 python 的 google 翻译和 utf 8 文本如何调用json api 他们有一个将其嵌入 html 的文档但我在任何地方都找不到合适的 API 或 wsdl 谢谢拉斐尔这是最终对我有用的代码使用没有
资源生成器和控制器生成器之间的区别

当我做 rails g model user name string rails g controller users index create new destroy show 并编辑 config routes rb 添加 resour
通过选择插入时，如何在插入表之前检查重复项

通过选择插入时如何在插入表之前检查重复项 insert into table1 select col1 col2 from table2 我需要检查 table1 是否已经有 table1 col1 value table2 col1 v
Android数据库访问设计方法

我有一个关于数据访问的一般 Android 设计问题我的应用程序中有许多活动需要访问 SQLite 数据库为了将所有数据访问逻辑包装在一个地方我创建了一个 DatbaseHandler 类来处理所有数据访问逻辑此类负责构建 wher
如何使用python将下载的音频文件扩展名重命名为mp3

目前我正在尝试根据艺术家姓名和歌曲标题将 YouTube 音乐视频下载为音频文件下载所有视频后我尝试将所有音频文件从 webm 或 mp4 扩展名重命名为 mp3 但似乎我在将文件名和扩展名更改为 mp3 时遇到了一些错误我的代码基
Play 框架：当请求超出可用线程时会发生什么

我的线程池中有一个线程服务阻塞请求 def sync Action import Contexts blockingPool Future Thread sleep 100 Ok Done 在 Contexts blockingPool 中
在 PHP 中将数组转换为字符串并将其恢复为数组

我正在使用 Serialize 函数将数组存储在我的 MYSQL 数据库中然后我在其他页面中取消序列化他数组结构如下所示 Array 0 gt Array names gt somename1 rating gt 10 1 gt Arr
Javascript无限原型链

我正在使用以下测试代码 function Test Test prototype MyMethod a function b function 为了运行它我只需这样做 var test new Test console debug tes
测量渲染时间的工具

是否有工具可以测量页面上元素的实际渲染时间我指的不是资源的下载时间而是浏览器渲染某些内容所花费的实际时间我知道这个时间会根据客户端计算机上的因素而有所不同但对于了解渲染引擎需要一段时间加载的内容仍然非常方便我想这应该是一个有用的实
当 IIS 托管时，WCF 对于 nettcp 使用什么默认端口？

我们的服务器基于 WCF 由 IIS 托管我们使用 nettcp 作为绑定该应用程序正在运行但我们仍然不清楚一件事由于我们没有在配置中指定端口号 WCF IIS 使用的默认端口是什么在生产环境中我们是否需要在IIS中手动为WCF
需要帮助设置两个宽度相等的并排自动布局按钮

使用自动布局我尝试在底部创建两个按钮如下所示拖动两个按钮后我设置这样的约束 On Back button I set Leading Space to Container Margin and Bottom Space to Bott
如何：获取 AVD 的端口号并向其自身发送消息

我该如何执行以下操作获取我的 AVD 的端口号从我的代码而不是命令行使用步骤 1 中获得的端口号从 AVD 向自身发送消息这是可能的模拟器可以给自己发送短信吗 https stackoverflow com questions 8
FileNotFoundException（系统找不到指定的路径）

我得到这个例外 java io FileNotFoundException C filename xml The system cannot find the path specified 使用此代码 FileWriter fileWrit
如何使用成帧器运动对每个状态变化进行动画处理

我认为渲染成帧器运动可以重做我的动画因为初始设置为隐藏动画设置为显示但这种情况并非如此我怎样才能让它在每次状态变化时重新播放动画 import React useEffect useState from react import m
如何在关心 NaN 值的同时获取数据框中值的百分比变化？

我有以下数据框 Date A 2015 01 01 10 2015 01 02 14 2015 01 05 NaN 2015 01 06 NaN 2015 01 07 5 2015 01 10 1 2015 01 11 NaN 2015 0
当活动从最近的活动中删除时，优雅地清理绑定服务

我有一个绑定服务需要时会转到前台这是我所拥有的简化版本 class MyService extends Service private static final ServiceConnection serviceConnection n
如何使用带有 ListView 和自定义适配器的选择器来指示所选项目

我有一个具有 ListView 的活动并且我创建了一个自定义适配器基于BaseAdapter 自定义适配器的 GetView 方法使用自定义布局 view context LayoutInflater Inflate Resource
在循环中预测.lm()。警告：排名不足的拟合预测可能会产生误导

此 R 代码引发警告 Fit regression model to each cluster y lt list length y lt k vars lt list length vars lt k f lt list length f

在循环中预测.lm()。警告：排名不足的拟合预测可能会产生误导

在循环中预测.lm()。警告：排名不足的拟合预测可能会产生误导 的相关文章

随机推荐

热门标签

在循环中预测.lm()。警告：排名不足的拟合预测可能会产生误导的相关文章