使用相同 glm 的 glm 预测和 geom_smooth() 之间的差异

2024-01-04

我正在尝试使用概率模型重现其他人的工作。不幸的是，我没有太多关于他们的方法的信息，只有他们的起始数据和模型图。

当我在 ggplot 中绘制数据并使用拟合线时geom_smooth(method = "glm", ...)，我能够重现以前的工作。然而，当我尝试使用（我认为是）在 ggplot 之外拟合一个相同的模型时glm()，我得到不同的预测。我觉得我犯了一些愚蠢的错误，但我不能完全确定。

这是一个可重现的示例：

library(tidyverse)
set.seed(123)

df <- tibble(x = c(0.006, 0.014, 0.025, 0.05, 0.15, 0.3, 0.5),
             y = c(0.4,   0.733, 0.875, 1,    1,    1,   1))


probit_model <- glm(y ~ x, data = df, family = quasibinomial(link = "probit"))

df <- df %>%
  add_row(x = 0.001, y = NA) %>%  # To underline that these models are different
  mutate(y_pred = predict(probit_model, newdata = ., type = "response"))


df %>%
  ggplot(aes(x, y)) +
  geom_point(size = 4) +
  geom_line(aes(y = y_pred), color = "red", lwd = 1) +
  geom_smooth(formula = y ~ x, color = "blue",
              method = "glm", fullrange = TRUE,
              method.args = list(family = quasibinomial(link = "probit"))) +
  scale_x_log10(limits = c(0.001, 1))

这是它产生的情节。请注意，蓝线和红线描述了不同的拟合。我相信他们should是相同的（忽略红线的分段性质），因为它们使用相同的模型和数据。

我在故障排除过程中阅读了相当多的帖子，许多回复表明geom_smooth()不能替代建模。总的来说，我同意。也就是说，我明确地试图弄清楚什么geom_smooth()在这里做，然后在 ggplot 之外重现它。

我的问题是：

为什么这两个模型不同？怎么geom_smooth()呼叫glm()？我怎样才能打电话glm()我自己重现模型geom_smooth()正在使用？

模型实际上是相同的。如果您设置，例如，您可以看到这一点，xlim(0, 0.1)并删除scale_x_log10。然后你会看到拟合一致。

我认为你所看到的行为是因为scale_x_log10执行轴变换before任何统计摘要（例如geom_smooth）。所以，当你跑步时scale_x_log10, geom_smooth有效地拟合模型y ~ log10(x)，而不是y ~ x。如果你使用coord_trans(x="log10")代替scale_x_log10，您还会看到模型是一致的，因为coord_trans进行转变after任何统计摘要。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用相同 glm 的 glm 预测和 geom_smooth() 之间的差异的相关文章

返回带有参数的函数的函数

创建一个应返回包含原始函数参数的函数时我应该如何处理例如考虑这个函数 a lt function value function x x value 我希望它返回我在结果函数的参数中指定的值如下所示 b lt a 3 gt b gt f
从 R 主题模型中的 DocumentTermMatrix 中删除空文档？

我正在使用 R 中的 topicmodels 包进行主题建模我正在创建一个 Corpus 对象进行一些基本的预处理然后创建一个 DocumentTermMatrix corpus lt Corpus VectorSource vec
R 中大型稀疏矩阵的聚类分析

我有一个包含 250000 笔交易行和 2183 项列的交易数据集我想将其转换为稀疏矩阵然后对其进行分层聚类我尝试了包 sparcl 但它似乎不适用于稀疏矩阵关于如何解决这个问题有什么建议吗或者我可以使用任何其他包对稀疏矩
包检查时如何有效处理未压缩的保存？

在最近开发一个包的过程中我将数据集包含在data 我的包的文件夹在我的具体情况下我有 5 个数据集所有这些数据集都位于data table格式尽管我在下面描述的问题仍然存在如果我将它们保留为data frame 我已将每个人单独
正则表达式挑选括号之间的一些文本[重复]

这个问题在这里已经有答案了可能的重复提取 R 中所有括号内的信息正则表达式 https stackoverflow com questions 8613237 extract info inside all parenthesis i
glm() 模型的交叉验证

我正在尝试对我之前在 R 中构建的一些 glm 模型进行 10 倍交叉验证我对cv glm 函数在boot包尽管我已经阅读了很多帮助文件当我提供以下公式时 library boot cv glm data glmfit K 10 这里
Dplyr 多重滞后整齐评估？

我试图在 dplyr 中使用尽可能少的代码来实现多个滞后同时坚持整洁的评估以下标准评估 SE 代码有效 if require dplyr install packages dplyr library dplyr a as tibble
将文本添加到 ggplot 中的轴标签

我从下表中绘制了一个图表 BoatPhs fit se lower upper 1 Before 3 685875 0 3287521 3 038621 4 333130 2 After0 20NTA 3 317189 0 6254079
r Shiny 中的 fileInput 函数没有响应

我是 R 和 R闪亮的新手一直致力于构建一个统计应用程序该应用程序将允许用户导入文件然后对数据运行不同的统计程序直到最近 fileData 函数一直对我来说运行良好现在每当我尝试上传文件时都不会打开任何内容我已尝试了所有我能想
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
按绝对值排序

有谁知道如何按绝对值对 R 中的向量进行排序所以 2 3 1 gt 1 2 3 etc 如果我在 python 中这样做我会创建一对每个值及其符号按绝对值对对列表进行排序然后重新应用符号但我对 R 很陌生所以不知道如何执行此操作
在ggplot2中创建部分虚线

我正在 R 中创建一个图并且需要创建一条线其中某些值是投影投影用虚线表示这是代码 df data frame date c rep 2008 2013 by 1 value c 303 407 538 696 881 1094 gg
为什么我在 ddply 中看到“错误：length(rows) == 1 is not TRUE”？

我有一个数据框比如工资单例如 payroll lt read table text AgencyName Rate PayBasis Status NumRate HousingAuthority 26 843 00 Annual Fu
使用 R 中的 tidyverse 重新调整因子和重新排序因子

我想使用这些功能重新调平 and 重新排序在我的数据框中我了解重新调整级别的工作原理但我不明白为什么我在 data frame 中看不到级别的变化例如假设我有鸢尾花数据集 library tidyverse head iris g
如何优化 R 中的 sapply 来计算数据帧上的运行总计

我在 R 中编写了一个函数来按月份计算累积总数但随着数据集变大我的方法的执行时间呈指数增长我是一名 R 程序员新手你能帮我提高效率吗该函数以及我调用该函数的方式 accumulate lt function recordnum d
如何在 R 中查找平衡面板数据（又名，如何查找面板中的哪些条目在给定窗口内完整）

我有来自 Compustat 的大量数据我向其中添加了一些手工收集的数据认真地从一堆旧书中手工收集但我不想手工收集整个面板只想随机选择一个子集为了找到更大的集合我从中随机选择我想从 Compustat 的平衡面板开始我看到p
无法在 Powershell 中运行 R.exe

我经常发现在命令行 Windows 上运行 R 更有用然而当我在 Powershell 中尝试时我往往会遇到问题但这可以通过第一次运行轻松克服cmd然后就可以了这是我执行此操作时遇到的错误R CMD BATCH Invoke Hi
通过 RCpp 返回 NA

新手 RCpp 问题在这里 How can I make a NumericVector returnNA到R 例如假设我有一个 RCpp 代码它分配NA到向量的第一个元素 RCpp export NumericVector myFun
当在另一行中找到元素逗号分隔时合并行

您好我有一个数据框例如 species family Events groups 1 SP1 A 10 22 G1 2 SP1 B 7 G2 3 SP1 C D 4 5 6 1 3 G3 G4 G5 G6 4 SP2 A 22 10 G
R 在安装包依赖项时不考虑最大版本

假设我正在开发一个名为magicr做一些统计魔术我希望它使用另一个名为的包中的函数fairydust 假设存在于 CRAN 上很遗憾fairydust刚刚向 CRAN 发布了 2 0 0 版本完全破坏了我计划使用的功能所以我更新了

随机推荐

选择每隔一个可见的表格行

我有一个显示树结构的表格超级类别和子类别当用户单击超类别时子类别的显示属性将被切换现在我想在每两个表格行上添加交替背景颜色但当然只考虑当前可见的那些下面是结构的简化示例 table tr td Super 1 td tr tr
jquery如何检查url是否包含word？

我希望能够检查 url 是否包含目录一词这就是我正在尝试的 document ready function if window location href indexOf catalogue trail toggle 该网站的网址可能
ViewChild 和 focus()

我有一个包含默认隐藏文本区域的组件 div class action ui g 2 edit div
发现内存泄漏问题 cStringUsingEncoding

嘿我正在尝试使用 cStringUsingEncoding 将 NSString 转换为 C 字符串但出现内存泄漏我的理解是 cStringUsingEncoding 返回一个指向字符数组的指针该数组仅保证在 NSString 对象
如何使用 Spotlight 传递参数来运行 shell 脚本？

有人提到我们可以使用聚光灯执行 shell 脚本将其重命名为 myscript command 如下所述here https stackoverflow com questions 2877741 how to run a shell s
Coverity 为使用“cov-build”的构建定义了哪些预处理器符号？

我们使用 Coverity 的扫描构建 http scan coverity com 为免费和开源项目提供服务我正在研究 Coverity 关于受污染参数的两项调查结果 TAINTED SCALAR 污点是误报因此我尝试使用 Cover
Tyrus 客户端无法设置传入缓冲区大小

我尝试通过 WebSocket 传输大于 4M 的文件我在用着org glassfish tyrus tyrus server 1 13 1 and org glassfish tyrus tyrus container grizzly
当字段获得焦点时更改可绘制对象

我有一些EditText我的布局 xml 中的字段它们都遵循以下模式
Django 错误：未配置 DjangoTemplates 后端

我正在使用 Django 我需要从给定模板 lab html 动态生成 HTML 文件 from django template import Template Context from django conf import setting
Macdeployqt 不工作

我已经安装了最新版本的 Qt 5 1 当我尝试使用 macdeployqt 工具在 Mac 上部署我的应用程序时该应用程序仍然无法在其他 Mac 上运行它在我的 Mac 上完全正常工作并且没有指示任何错误经过研究我发现了这一点我
针对高分辨率密集像素设备的媒体查询

我们正在尝试专门针对 Samsung Galaxy Nexus 它的分辨率为 1280 x 720 像素密度为 2 这使其能够像桌面设备一样显示页面我们已经尝试过了 media screen and max device width 72
在 C# 中使用 String.Format 格式化字符串时出现问题

我需要以特定格式在消息框中打印一个字符串我使用的代码类似于如下所示 string text for int i 0 i
用于选择特定内容的正则表达式，前提是该内容未包含在注释中

我正在寻找与模式 src js 匹配的正则表达式但这不应包含在注释中考虑以下扩展样本输入被 OP 描述为正确
为什么 PHP 中的 T 是意外的 T_VARIABLE

这个 PHP 错误中的 T 是什么意思 Parse error syntax error unexpected T VARIABLE mean 我知道错误本身意味着什么但我想知道为什么它不仅仅是变量 T 代表令牌当 PHP 代码运行
如何在 macOS 上的 Qt 中使用 OpenMP 进行编译？

我试图在我的 C Qt 应用程序中引入一些 OMP 并行化但无法在 macOS 下编译它同事们正在使用 Windows 或 Linux 一切都工作正常我需要在 Qt 的 pro 文件中编写什么并在我的系统中执行哪些操作此网站或任何其
当所有代码更改均由 DBA 完成时，是否有替代使用 EF 进行 Code First 迁移的方法？

我读过有关代码优先迁移的内容但似乎这并不真正适合企业我们有一个 DBA 来完成所有数据库更改我们不需要将这些更改放入类中也不需要由应用程序执行数据库迁移如果我们更改类和 Fluent API 然后让 DBA 对数据库进行更改
存储过程 - 结束日期

我正在听 Hansel 分钟播客 StackOverflow 使用 ASP NET MVC Jeff Atwood 和他的技术团队在播客过程中他们谈论 SQL Server 并说了类似存储过程的时代已经结束的话现在我不是一名 DB
cookie 不起作用，apache 到 nginx

我已将我的网站从 apache 移至 nginx 但现在我遇到的问题是当我的用户尝试登录网站时我的网站不想向他们发送 cookie 或启动会话这是我的登录脚本
字体非常难看

我正在使用以下代码绘制一个字符串 public Image DrawString String lString Image lImage new Bitmap 128 128 Rectangle rec new Rectangle 0 0
使用相同 glm 的 glm 预测和 geom_smooth() 之间的差异

我正在尝试使用概率模型重现其他人的工作不幸的是我没有太多关于他们的方法的信息只有他们的起始数据和模型图当我在 ggplot 中绘制数据并使用拟合线时geom smooth method glm 我能够重现以前的工作然而当我尝试使

使用相同 glm 的 glm 预测和 geom_smooth() 之间的差异

使用相同 glm 的 glm 预测和 geom_smooth() 之间的差异 的相关文章

随机推荐

热门标签

使用相同 glm 的 glm 预测和 geom_smooth() 之间的差异的相关文章