我未使用的变量出现“因子具有新级别”错误

2024-03-01

考虑一个简单的数据集，分为训练集和测试集：

dat <- data.frame(x=1:5, y=c("a", "b", "c", "d", "e"), z=c(0, 0, 1, 0, 1))
train <- dat[1:4,]
train
#   x y z
# 1 1 a 0
# 2 2 b 0
# 3 3 c 1
# 4 4 d 0
test <- dat[5,]
test
#   x y z
# 5 5 e 1

当我训练逻辑回归模型来预测时z using x并获得测试集预测，一切都很好：

mod <- glm(z~x, data=train, family="binomial")
predict(mod, newdata=test, type="response")
#         5 
# 0.5546394

但是，这在看起来等效的逻辑回归模型上失败，并出现“因子有新级别”错误：

mod2 <- glm(z~.-y, data=train, family="binomial")
predict(mod2, newdata=test, type="response")
# Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) : 
#   factor y has new level e

自从我删除了y从我的模型方程中，我很惊讶地看到这个错误消息。在我的应用程序中，dat很宽，所以z~.-y是最方便的型号规格。我能想到的最简单的解决方法是删除y来自我的数据帧的变量，然后使用z~.语法，但我希望有一种方法可以使用原始数据集而不需要删除列。

你可以尝试更新一下mod2$xlevels[["y"]]在模型对象中

mod2 <- glm(z~.-y, data=train, family="binomial")
mod2$xlevels[["y"]] <- union(mod2$xlevels[["y"]], levels(test$y))

predict(mod2, newdata=test, type="response")
#        5 
#0.5546394

另一种选择是从训练数据中排除（但不删除）“y”

mod2 <- glm(z~., data=train[,!colnames(train) %in% c("y")], family="binomial")
predict(mod2, newdata=test, type="response")
#        5 
#0.5546394

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rfactor

rformula

我未使用的变量出现“因子具有新级别”错误的相关文章

使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
建模前减少因子水平数量

我有一个 2600 个级别的因子我想在建模之前将其减少到 10 我想我可以通过这样的操作来做到这一点如果一个因素列出的次数少于 x 次则应将其放入名为其他的存储桶中这是一些示例数据 df lt data frame colour
在 Shiny 应用程序中过滤数据时，长度为 1 的字符向量除了第一个元素之外的所有元素都将被忽略错误

我有以下闪亮的应用程序 library shiny library rhandsontable library shinydashboard library ggplot2 library dplyr setwd C Users Marc
在ggplotly散点图中添加自定义数据标签

我想显示Species对于每个数据点当光标位于该点上方而不是 x 和 y 值时我用iris数据集另外我希望能够单击数据点以使标签持久存在并且当我在图中选择新位置时标签不会消失如果可能的话最基本的是标签持久性问题是一个优点这
对于多项式，获取其所有极值并通过突出显示所有单调部分来绘制它

有人问我这个有趣的问题我认为值得将其发布在这里因为 Stack Overflow 上还没有任何相关线程假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
从 R 到 C 处理列表并访问它

我想使用从 R 获得的 C 列表我意识到这个问题与此非常相似使用 call 在 R 和 C 之间传递数据帧 https stackoverflow com questions 6658168 passing a data frame f
有没有一种简单的方法可以根据多个标准进行排名，从而保留 R 中的联系？

当单个标准排序良好时 rank 函数会返回明显的结果 rank c 2 4 1 3 5 1 2 4 1 3 5 当单个标准具有联系时排名函数默认情况下将平均排名分配给联系 rank c 2 4 1 1 5 1 3 0 4 0 1 5
将 read.csv 与符号链接文件一起使用

我正在尝试做什么我的源文件非常大我想避免将其复制到其他文件夹中我决定创建一个指向大文件的符号链接并想使用read csv读取文件文件夹结构项目1 数据源文件 csv 项目2 数据别名到源文件 csv 什么地方出了错读取源文件
ggplot2 - 添加具有不同中断和标签的辅助 y 轴

是否可以使用 ggplot2 手动向辅助 y 轴添加中断和标签 see bottom right 我希望在右侧 y 轴上有更紧凑的中断代表条形该图将作为基本情况然后我将展示如何更改辅助 y 轴上的分隔符和标签 sapply c pip
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
R：根据元素长度从向量中删除元素

如何根据字符串的字符数或长度从字符串向量中删除元素 df lt c asdf fweafewwf af aewfawefwef awefWEfawefawef gt df 1 asdf fweafewwf af aewfawefwef aw
如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
rpart是自动剪枝吗？

Is rpart自动修剪生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多否但拟合函数的默认值可能会提前停止分割对于早期的某些定义 See rpart control对于您可
使用 readHTMLTable 从 https 网页读取表格

我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
R闪亮主面板显示样式和字体

我正在学习闪亮的应用程序并且有一些关于调整布局的基本问题特别是样式和字体希望得到指点或明确的答案谢谢考虑一个基本的输入输出应用程序用户在 sidebarPanel 中输入数据然后在 mainPanel 中反应性地输出结果如何
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
zsh：未找到命令：使用 Big Sur Mac 的终端上的 R

我从官方 cran 网站安装了 R 我可以从 Rstudio 运行 R 但是当我尝试从终端使用 R 时我得到以下结果 base ege Eges MBP R zsh command not found R base ege Eges MB
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize

随机推荐

使用 Kotlin 协程进行多线程

我正在尝试Kotlin 协程 https kotlinlang org docs reference coroutines html并有以下代码 fun main args Array
将自定义函数应用于 PySpark 中数据框的选定列的单元格

假设我有一个如下所示的数据框 id address1 address2 1 address 1 1 address 1 2 2 address 2 1 address 2 2 我想将自定义函数直接应用于address1 and addres
如何有效地设计大多数类依赖于 ILogger 的应用程序？

我正在注射一个Logger组件进入all我的课程我的大部分课程都有Logger定义的属性除非存在继承链在这种情况下只有基类具有此属性并且所有派生类都使用该属性当它们通过 Windsor 容器实例化时它们将得到我的实现ILogg
ROS 问题：libQt5Core.so.5：无法打开共享对象文件：没有这样的文件或目录

当我跑步时 rosrun turtlesim turtlesim node 在 Ubuntu 上我收到以下消息 opt ros noetic lib turtlesim turtlesim node 加载共享库时出错 libQt5Core
表单身份验证 - 共享 Cookie MVC 和 Web 表单

我在同一域中有两个应用程序如下所示 http example com MvcApp http example com WebFormsApp 正如预期的那样一个是 ASP NET MVC 5 另一个是 Web Forms 两者都使用 N
多步骤数据库事务拆分为多个 HTTP 请求

我过去曾将 TransactionScope 与桌面客户端应用程序一起使用来回滚不完整的多步骤事务这种方法似乎不太可能在 Web 应用程序中起作用任何人都可以建议如何在整个过程未完成时确保回滚跨多个页面的多个步骤吗例如他们的浏览器崩
Laravel：从查询生成器获取最后一个插入 ID

我是 laravel 的新手并尝试从此查询中获取最后插入的 id DB select INSERT INTO current survey name created by description SELECT name created b
如何在C#中的非静态方法中调用静态方法

如何打电话static里面的方法non static中的方法c 面试官给了我一个场景 class class1 public static void method1 public void method2 call method1 我们怎样
将 Python 类实例传递给 C++ 函数

我有一个用 C 编写的内部库目前正在努力将其扩展到 Python 中我开始这项任务时考虑的是 Boost Python 但我对替代方案持开放态度目前我有一个 C 函数需要接受 Python 类实例然后使用该对象的方法来执行某些任务
Sourcetree 因合并冲突而无法打开 Diffmerge

最近我全新安装了 macOS 我已经安装了 Sourcetree 和 diffmerge 并将 diffmerge 设置为默认合并工具由于某种原因每次当我选择解决冲突 gt 打开外部合并工具时 sourcetree 都会打开其等待视
React Router 在生产中出现 404 错误

React Router 适用于本地计算机 Chrome 但不适用于 safari 和其他浏览器
在 Codeigniter 中从类创建对象

以下代码均来自http d hatena ne jp dix3 20081002 1222899116 http d hatena ne jp dix3 20081002 1222899116并且代码运行良好这是一个使用的示例snoopy
调用 wave-crypto 模块创建种子和地址时出现错误

我在模块中找不到 crypto js 同时尝试创建用户钱包 onclick 和种子以及公钥和私钥我收到此错误消息调用模块函数时出错错误无法找到模块 crypto js 相对于app tns modules 这是我的代码 import C
非标准可选参数默认值

我有两个功能 def f a b c g b blabla def g n blabla c是函数中的可选参数f 如果用户没有指定它的值程序应该计算 g b 这将是c 但代码无法编译它说名称 b 未定义如何解决这个问题有人建议 de
我的 Javascript 是否用完了 asyncIds ？（inspector_async_hook.js 中的 RangeError）

首先我经常使用 async 和 wait 但出现此错误 RangeError Value undefined out of range for undefined options property undefined at Set add
Android：手机处于睡眠状态时 GPS 位置会更新吗？

即使手机处于睡眠状态我也需要在后台通过 GPS 更新位置我正在考虑使用 AlarmManager 广播 Intent 然后接收器将在 LocationManager 上调用 requestLocationUpdates 但我不确定如果我
如何获取 isPersistent (AuthenticationProperties)

我正在使用 asp net MVC 5 2 和 asp net 身份版本 2 2 1 和实体框架 6 1 3 在某些时候在控制器中我需要知道当前正在使用的 AuthenticationProperties 的内容更具体地说我需要知道
如何在 RTK 查询中自动重新获取数据

当我移动下一页或移动到另一个页面或更新数据时数据不重新获取当我重新加载页面然后重新获取数据无需重新加载如何使用 RTK 查询重新获取数据这是代码 export const userService createApi reducerP
从 python 运行“查询会话”

所以我正在用 python 编写一个程序它将报告与 RGS 连接的系统上的用户让用户使用 Windows 的一种方法是query session命令我都尝试过os popen and subprocess Popen有壳和无壳 Tru
我未使用的变量出现“因子具有新级别”错误

考虑一个简单的数据集分为训练集和测试集 dat lt data frame x 1 5 y c a b c d e z c 0 0 1 0 1 train lt dat 1 4 train x y z 1 1 a 0 2 2 b 0 3

我未使用的变量出现“因子具有新级别”错误

我未使用的变量出现“因子具有新级别”错误 的相关文章

随机推荐

热门标签

我未使用的变量出现“因子具有新级别”错误的相关文章