R 错误，显示“模型并非全部适合相同大小的数据集”

2024-04-14

我创建了两个广义线性模型，如下所示：

glm1 <-glm(Y ~ X1 + X2 + X3, family=binomial(link=logit))

glm2 <-glm(Y ~ X1 + X2, family=binomial(link=logit))

然后我使用anova功能：

anova(glm2,glm1)

但收到错误消息：

“anova.glmlist(c(list(object),dotargs) 中的错误，色散 = 色散，：
模型并非都适合相同大小的数据集”

这是什么意思？我该如何解决这个问题？我有attach在我的代码开始时编辑了数据集，因此两个模型都使用相同的数据集。

该错误的主要原因是一个或多个预测变量中存在缺失值。在最新版本的 R 中，默认操作是忽略所有缺少任何值的行（之前的默认操作是产生错误）。因此，例如，如果数据框有 100 行，并且 X3 中有一个缺失值，那么您的模型 glm1 将适合 99 行数据（删除 X3 缺失的行），但 glm2 对象将适合完整数据100行数据（由于不使用X3，所以不需要删除任何行）。

那么那么anova函数会给你一个错误，因为这两个模型适合不同的数据集（以及如何计算自由度等）。

一种解决方案是创建一个新的数据框，其中仅包含将在至少一个模型中使用的列，并删除具有任何缺失值的所有行（na.omit or na.exclude函数将使这变得容易），然后将两个模型拟合到没有任何缺失值的同一数据框中。

其他选择是寻找多重插补工具或处理缺失数据的其他方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R 错误，显示“模型并非全部适合相同大小的数据集” 的相关文章

按列分组的数据帧上 R 中的行之间的差异

我希望通过 app name 获得不同版本的计数差异我的数据集如下所示 app name version id count difference 这是数据集 data structure list app name structure c
再现频率矩阵图

我想在 R 中重新创建一个情节情节如下来源 Boring E G 1941 作为动态平衡的统计频率心理学评论 48 4 279 这略高于我的工资等级能力因此在这里询问无聊的状态第一次 A 只能出现从不 0 或总是 1 在
grid.arrange 中的错误 -rangeGrob() 函数

我有两个图 p1 和 p2 我试图使用 grid arrage 绘制它们我的代码如下所示 grid arrange p1 p2 ncol 2 top textGrob Distribution across each day of the
在 R 中按组检查重叠开始和结束时间

我想检查数据的重叠这是数据 ID lt c rep 1 3 rep 3 5 rep 4 4 rep 5 5 Begin lt c 0 2 5 3 7 8 7 25 25 10 15 17 20 1 NA 10 11 13 End lt c
R 中的转换会导致文档错误

每当我运行此代码时 tm map 行都会给我警告消息警告信息在 tm map SimpleCorpus docs toSpace 中转换删除文档 texts lt read csv Data fast food Domino s Do
使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country
在ggplotly散点图中添加自定义数据标签

我想显示Species对于每个数据点当光标位于该点上方而不是 x 和 y 值时我用iris数据集另外我希望能够单击数据点以使标签持久存在并且当我在图中选择新位置时标签不会消失如果可能的话最基本的是标签持久性问题是一个优点这
对于多项式，获取其所有极值并通过突出显示所有单调部分来绘制它

有人问我这个有趣的问题我认为值得将其发布在这里因为 Stack Overflow 上还没有任何相关线程假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
有没有一种简单的方法可以根据多个标准进行排名，从而保留 R 中的联系？

当单个标准排序良好时 rank 函数会返回明显的结果 rank c 2 4 1 3 5 1 2 4 1 3 5 当单个标准具有联系时排名函数默认情况下将平均排名分配给联系 rank c 2 4 1 1 5 1 3 0 4 0 1 5
具有动态变量数的公式

假设有一些 data framefoo data frame想要找到目标列的回归Y由其他一些专栏为此目的通常使用一些公式和模型例如 linear model lt lm Y FACTOR NAME 1 FACTOR NAME 2 fo
使用管道语法处理模型列表

我经常喜欢拟合和检查与 R 数据框中的两个变量相关的多个模型我可以使用如下语法来做到这一点 require tidyverse require broom models lt list hp exp cyl hp cyl map df m
将 RDS 文件从网络（即 URL）直接加载到 R 中？

read csv 具有直接从 url 读取的出色能力 readRDS 才不是我想将 RDS 文件从 Internet 移动到我的 R 环境我看到有几种方法 Method 1 此方法会用下载的文件弄乱工作目录 myurl lt https
在 Shiny 中叠加两个 ggplot

我有一个非常大的数据集我正在使用 ggplot 在 Shiny 上绘制它我有一个与 x 轴上的值相关联的滑块我想用它对选定的数据子集重新着色并让其余数据保持原样最简单的选择是重新创建整个绘图但由于它是一个大型数据集因此这是一个
使用 readHTMLTable 从 https 网页读取表格

我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
美人鱼图：调整图表周围的空白

我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图在 HTML PDF 输出中图表上方和下方有大量空白请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
R data.table 连接不等式条件

我想使用 data table 包根据多个不等式条件对数据进行子集化 data table 手册中的示例展示了如何使用字符变量执行此操作但不显示数字不等式我还了解了如何使用子集函数来执行此操作但我真的很想利用 data table 二

随机推荐

我的 CSS 是否正确重置？ [复制]

这个问题在这里已经有答案了请注意我只对进行微小的更改感兴趣而不是应用整个 CSS 重置我想弄清楚这个特定元素的情况关于以下内容一切看起来都很好我在创建 CSS 时就认出了它唯一没有意义的是下面的样式规则Basic Style
有没有办法在 BigQuery 标准 SQL 中添加连接表名？

我想知道是否可以强制标准 SQL 在连接表名前面加上前缀以便我可以从 a 和 b 中获取带有 a 和 b 前缀的所有字段而无需手动命名每个字段 IE 我想做一个SELECT 我不想生成每个字段名我知道如果您从旧版 SQL 切换到标准
在 Travis 上构建 R 包，如何不将警告视为错误？

I m 在 Travis 上构建 R 包 https travis ci org paulrougieux tradeflows builds 109356597与包的用户共享集成状态我没有任何错误但有 8 个警告我想暂时忽略它们但
必须先释放事务，然后才能使用连接执行 sql 语句

我收到这个错误必须先处理事务然后才能使用连接执行 sql 语句我有一个包含大约 6000 行的 Excel 文件我将这些文件上传到类型化数据集中的数据表中然后我尝试将我的业务逻辑应用于 dt 中的这些行第二个循环抛出异常我必须
JQuery - 拖放文件 - 如何获取文件信息？

有兴趣使用 JQuery AJAX PHP 构建自己的拖放文件上传基本上我想要一个文件上传器我的网站的用户可以将文件从他们的计算机拖到我创建的 div 中然后它将为他们上传文件到选定的目的地我想从头开始构建它而不使用任何插件以
使用 webpack 部署到 Heroku 时预编译资产时出错

我有一个项目最近升级到了 Rails 5 2 并且我正在使用 webpacker gem 我在尝试部署到 Heroku 时收到以下错误 remote Webpacker is installed remote Using tmp build
查找输入字符串中的子字符串

我有这个汇编程序我需要在我输入的主字符串中找到子字符串我的问题是即使我输入了两个完全不同的单词它总是输出找到的单词我不知道我的循环或条件的哪一部分是错误的请帮我弄清楚另外请建议一些可用于检查子字符串的字符串指令以便我可以
Knockout 中的 TextBox 数据绑定问题（提供小提琴）关键问题之一

Step 1 在我的页面加载时我使用自定义绑定在文本框中显示日期 Step 2 问题在于当我尝试发布文本框中的内容时我在控制器上得到的最小日期是错误的即 01 01 0001 00 00 00 我的cshtml
Google Map API v3 - 缩放参数不起作用

我正在使用 Google API v3 但此参数 zoom 10 不起作用我总是调用 google api 缩放为最大我必须点击大约 5 次才能获得所需的缩放我尝试设置 Zoom 1 和 Zoom 100 但没有任何反应也许这个参
在 lucene.net 中，我们可以在不给出字段名称的情况下搜索内容吗？它会搜索所有已索引的字段吗？

在 lucene net 中我们可以在不给出字段名称的情况下搜索内容并且它将搜索所有已索引的字段如果不提供字段名称则无法搜索内容但是您可以使用 MultiFieldQueryParser 在所有可用字段中进行搜索 E g Dim
将不平衡数据扩展到月度面板

我有一个如下所示的数据集我想将其扩展为每月面板数据集 ID start date end date event type 1 01 01 97 08 01 98 1 2 02 01 97 10 01 97 1 3 01 01 96 12
.Net 3.5 中的 XMLSerialization 是否仍然存在已知的内存泄漏？

本文http blogs msdn com tess archive 2006 02 15 532804 aspx http blogs msdn com tess archive 2006 02 15 532804 aspxTess Fe
Scalaz7 中的“序列”在哪里

我正在学习 Scalaz 并且我有一个已经使用 Scalaz7 的项目下列的这个问题 https stackoverflow com questions 2569014 convert a list of options to an op
在 Java 中删除数组中重复项的最佳方法是什么？

我有一个对象数组需要删除过滤重复项我打算只重写 Object 元素上的 equals 和 hach Code 然后将它们放在 Set 中但我想我至少应该轮询 stackoverflow 以查看是否有另一种方法也许是其他 API 的
使用新的 registerForActivityResult 请求在 DialogFragment 中写入的权限

我尝试提醒用户在退出活动时将数据保存在文件中因此我显示一个对话框询问他们是否要存储数据这里我需要检查是否授予了权限如果没有请请求它一旦被授予就写入文件我无法在 DialogFragment 中捕获 onRequestPer
在 Linux 上使用 Apache Commons Compression 压缩文件时出现编码错误

我正在使用 Apache Commons API Compression 来压缩文件 Windows 7 工作正常但在 Linux ubuntu 10 10 UTF8 中文件名和文件夹名称中的字符例如会被替换压缩时或解压缩 ta
在 Rust 中将单个值分配给一行中的多个变量？

分配多个变量的常见方法通常用 C 或 Python 等编程语言表示为 a b c value Rust 中是否有与此等效的内容或者您需要将其写出来 a value b value c value 如果这是显而易见的我很抱歉但我所有的
PostgreSQL 按 24 小时时段中午到中午进行分组

正如标题所示使用 PostgreSQL 我需要能够在 24 小时内从中午到中午聚合数据在几周的时间内每 5 分钟收集一次数据我希望对从第一天中午 12 00 到第二天中午 12 00 的 24 小时内的读数进行平均直到数据结束
尝试在 Genymotion 上使用 libgdx 运行 Android 游戏

有人对 libgdx 和 genymotion 有经验吗我正在尝试让 libgdx 游戏在 genymotion Android 模拟器上运行 http www genymotion com http www genymotion com
R 错误，显示“模型并非全部适合相同大小的数据集”

我创建了两个广义线性模型如下所示 glm1 lt glm Y X1 X2 X3 family binomial link logit glm2 lt glm Y X1 X2 family binomial link logit 然后我使用

R 错误，显示“模型并非全部适合相同大小的数据集”

R 错误，显示“模型并非全部适合相同大小的数据集” 的相关文章

随机推荐

热门标签