如何在这个线性模型中强制删除截距或等效项？

2024-04-04

考虑下表：

DB <- data.frame(
  Y =rnorm(6),
  X1=c(T, T, F, T, F, F),
  X2=c(T, F, T, F, T, T)
)
           Y    X1    X2
1  1.8376852  TRUE  TRUE
2 -2.1173739  TRUE FALSE
3  1.3054450 FALSE  TRUE
4 -0.3476706  TRUE FALSE
5  1.3219099 FALSE  TRUE
6  0.6781750 FALSE  TRUE

我想用两个不带截距的二元变量（TRUE 或 FALSE）来解释我的定量变量 Y。

这种选择的理由是，在我的研究中，我们无法观察到X1=FALSE and X2=FALSE同时，因此对于该水平，除 0 之外的均值是没有意义的。

有拦截

m1 <- lm(Y~X1+X2, data=DB)
summary(m1)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  -1.9684     1.0590  -1.859   0.1600  
X1TRUE        0.7358     0.9032   0.815   0.4749  
X2TRUE        3.0702     0.9579   3.205   0.0491 *

无拦截

m0 <- lm(Y~0+X1+X2, data=DB)
summary(m0)

Coefficients:
        Estimate Std. Error t value Pr(>|t|)  
X1FALSE  -1.9684     1.0590  -1.859   0.1600  
X1TRUE   -1.2325     0.5531  -2.229   0.1122  
X2TRUE    3.0702     0.9579   3.205   0.0491 *

我无法解释为什么为变量 X1 估计两个系数。它似乎相当于具有截距的模型中的截距系数。

结果相同

当我们显示所有变量组合的估计时，两个模型是相同的。

DisplayLevel <- function(m){
  R <-  outer(
    unique(DB$X1),
    unique(DB$X2),
    function(a, b) predict(m,data.frame(X1=a, X2=b))
  )
  colnames(R) <- paste0('X2:', unique(DB$X2))
  rownames(R) <- paste0('X1:', unique(DB$X1))
  return(R)
}

DisplayLevel(m1)
          X2:TRUE  X2:FALSE
X1:TRUE  1.837685 -1.232522
X1:FALSE 1.101843 -1.968364

DisplayLevel(m0)
          X2:TRUE  X2:FALSE
X1:TRUE  1.837685 -1.232522
X1:FALSE 1.101843 -1.968364

所以这两个模型是等价的。

Question

我的问题是：我们可以只估计第一个效应的一个系数吗？我们可以强制 R 为组合分配 0 值吗X1=FALSE and X2=FALSE ?

是的，我们可以通过

DB <- as.data.frame(data.matrix(DB))
## or you can do:
## DB$X1 <- as.integer(DB$X1)
## DB$X2 <- as.integer(DB$X2)

#            Y X1 X2
# 1 -0.5059575  1  1
# 2  1.3430388  1  0
# 3 -0.2145794  0  1
# 4 -0.1795565  1  0
# 5 -0.1001907  0  1
# 6  0.7126663  0  1

## a linear model without intercept
m0 <- lm(Y ~ 0 + X1 + X2, data = DB)

DisplayLevel(m0)
#             X2:1      X2:0
# X1:1  0.15967744 0.2489237
# X1:0 -0.08924625 0.0000000

我已经明确胁迫你了TRUE/FALSE二进制转数值1/0，这样就不会处理对比度lm().

我的答案中出现的数据与你的不同，因为你没有使用set.seed(?) before rnorm()为了再现性。但这不是这里的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Regression

linearregression

LM

ANOVA

如何在这个线性模型中强制删除截距或等效项？的相关文章

替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
使用 R：如何创建带有日期的时间序列对象？

我有一年中每小时采集的一系列值是否可以创建一个保留小时和年份值的时间序列对象我的代码使用股票价格第一列中的值但不使用日期 stockprices ts lt ts stockprices 1 start 1 freq 168 您没有提
dmvnorm MVN 密度 - RcppArmadillo 实现比 R 包慢，包括一些 Fortran

The solution现已上线RCPP画廊 http gallery rcpp org articles dmvnorm arma 我从 RcppArmadillo 中的 mvtnorm 包重新实现了 dmvnorm 我有点喜欢犰狳但我
r caret 包中的 train 函数的模型输出尺寸巨大

我正在使用 bagFDA 模型进行训练train r caret 包中的函数并将模型输出保存为 Rdata 文件输入文件大约有 300k 条记录有 26 个变量但输出 Rdata 大小为 3G 我只是运行以下命令 modelout
如何在R中使用OpenNLP获取POS标签？

这是 R 代码 library NLP library openNLP tagPOS lt function x s lt as String x word token annotator lt Maxent Word Token Anno
使用 X11 窗口的 R 脚本仅打开一秒钟

我正在通过 Linux Mint 16 命令行运行 R 脚本它包含我想在窗口中显示的箱线图所以我使用 x11 函数来创建该窗口这是我的代码 testdata lt data frame sample 1 1000 size 100 r
绘制具有数据子集的图层时，因子水平的顺序会发生变化

我试图控制图例中项目的顺序ggplot2我查找了其他一些类似的问题并发现了如何更改我正在绘制的因子变量的水平顺序我正在绘制 12 月 1 月 7 月和 6 月 4 个月的数据如果我只对所有月份执行一个绘图命令它会按预期工作图例中排
如何加速 R for 循环？

我正在为 R 中 GWmodel 包中的 gwr basic 函数运行以下 for 循环我需要做的是收集任何给定带宽的估计参数的平均值代码如下 library GWmodel data DubVoter Dub voter LARent
S4 类 [（子集）带有附加参数的继承

这是一个扩展在 R 中的访问器函数中使用 callNextMethod https stackoverflow com q 24875284 2752888 2017 03 25 更新为了说明如何仅在加载方法时失败但在构建的包中时不会失
ggplot堆叠条 - 隐藏标签但保留标签位置

我在 ggplot 中有一个堆积条形图其中 geom text 标签位于每个条形的中心我想隐藏小条上的标签以便图表看起来不会过于拥挤我可以使用下面的代码来完成此操作但它会弄乱标签的位置正如您在下面的链接图片中看到的那样它们不再
Plotly 绘图不会在 RMarkdown 文档的 for 循环内渲染

我正在尝试动态构建一个需要运行循环的报告并为每次迭代打印一些消息表格和绘图我可以让一切正常运转except为了情节示例 rmd r echo FALSE results asis fig keep all message FALSE
修复 ggplot 中构面中的数据顺序

我在使用 ggplot 绘制数据时遇到问题我无法使每个方面内的数据正确排序我的样本数据是 data lt structure list Parameter c 0 1 0 7 0 0 0 2 0 2 0 7 0 0 0 1 0 3 0
删除 R 中具有重复属性的行

我有一个大数据框其中包含以下列 ID time OS IP 该数据帧的每一行对应一个条目在该数据框中对于某些IDs存在多个条目行我想删除这些多行显然同一 ID 的其他属性会有所不同或者换句话说我只想要每个 ID 一个条目行
循环中的knitr模板和子文档

圣诞节前我之前问过跨多个 knitr 文档的单一样式表 https stackoverflow com questions 20370584 single style sheet across multiple knitr document
确定向量中是否存在元素的最有效方法

我有几种算法取决于确定元素是否存在于向量中的效率在我看来这 in 这相当于is element 应该是最有效的因为它只返回一个布尔值在测试了几种方法之后令我惊讶的是这些方法是迄今为止效率最低的以下是我的分析随着向量大小的增加
使用pivot_longer将R中的多列变成一列[重复]

这个问题在这里已经有答案了我有一个dfpopulation看起来像这样未列出所有列和行 Region X1975 X1976 X1977 X2008 National Total 942420 93717 94974 132802 Be
使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
R lubridate：当地语言的工作日

如何获取本地语言的工作日和月份 My code library lubridate data lt c 10 02 2015 11 03 2015 data lubri lt dmy data wday data lubri label T
将天气 iframe 嵌入到 Shiny Dashboard 中

我正在尝试将 Forecast io 的天气预报嵌入到闪亮的仪表板中我最初在使用符号时遇到了麻烦但看到一篇文章提供了如何使用特殊字符格式化 HTML 代码的示例但是当我运行该应用程序时我看到一个简单的未找到即使我知道该链接有
有没有一种简单的方法可以根据多个标准进行排名，从而保留 R 中的联系？

当单个标准排序良好时 rank 函数会返回明显的结果 rank c 2 4 1 3 5 1 2 4 1 3 5 当单个标准具有联系时排名函数默认情况下将平均排名分配给联系 rank c 2 4 1 1 5 1 3 0 4 0 1 5

随机推荐

何时使用“raise_for_status”与“status_code”测试

我一直用 r requests get url if r status code 200 my passing code else anything else if this even exists 现在我正在解决另一个问题并决定允许其他错
出现异常：指定的网络名称不再可用。（0x80070040）尝试使用 ReadToEndAsync() 读取 HttpRequest Body 时

我有一个 API post Web 方法尝试使用 StreamReader 获取请求正文ReadToEndAsync 大多数情况下它工作正常但是对于非常随机的请求我收到以下异常客户端已断开连接有内在的例外指定的网络名称不再可用
Mat-accordion 不是已知元素

我正在开发一个 angular10 应用程序我尝试在我的项目中使用 mat accordion 每个组件使用模块每个组件都有自己的 module ts 文件下面是我的模块文件代码 import NgModule from angula
根据 hcharter 中给定的序列设置热图颜色范围

在这里我尝试使用创建热图highcharter hcharter where 小于 1应该是一种颜色粉红色 1 to 1应该是透明或白色的并且大于 1应该是另一种颜色紫色目前我已经使用编写代码hchart 并使用color stop
在 jquery 选择器中使用 rel 属性中的变量

我使用 rel 属性将 div 与按钮匹配我在相应 div 的 rel 字段中使用按钮的 id 有多个按钮单击按钮时我想使用 show 方法显示相应的 div 并隐藏其他 div 按钮工作正常但 div 没有响应我的直觉告诉我我
C Win32：从 HBITMAP 保存 .bmp 图像

我正在使用图像采集卡需要从计算机内存中获取图像并将其保存在图像文件中经过几天的尝试我最终得到了以下两个函数它创建了一个文件 Windows操作系统能够运行 bmp文件但位图文件是黑色的图像大小为900KB 640 480 有人知
Android 追加文本文件

我试图将对话框选择器中的唤醒时间和睡眠时间记录到这样的文本文件中但是对方法 commitToFile2 的调用不会附加文本文件 savedData txt 我知道这段代码非常非常肮脏我是 Java 新手所以任何其他建议将不胜感激 pa
在标签内运行 JavaScript？

我有一个处理选项卡切换的 JavaScript 文件这是来源 var tCount 0 function SwitchToTab id if id lt 0 id gt tCount id 0 for var i 0 i lt tCoun
在 ASP.NET Identity 2 中通过 UserManager.Update() 更新用户

I use ASP NET Identity 2 in an MVC 5项目我想更新Student数据通过使用UserManager Update 方法然而正如我继承自ApplicationUser类我需要映射Student to
@EnableGlobalMethodSecurity 与 @EnableWebSecurity

我正在使用 Spring 4 开发 REST API 我想使用 Spring Security 来保护一些端点但根据我所读到的内容可以使用以下任一方法来完成 EnableGlobalMethodSecurity or EnableWeb
如何在 iPhone PhoneGap jQuery Mobile 中将文件附加到邮件

我已经实施了Phone Gap 中使用 jQuery Mobile 的 iPhone 应用程序作为我的应用程序的一部分我需要单击邮件按钮发送电子邮件为此我添加了EmailComposer plug in 在 www 文件夹中添加了
是否有一种有效的算法来进行有限数量的整数分区？

我必须创建一个接受两个整数的方法让它们成为n and m 并返回有多少种求和方法m得到正数n 例如像这样的方法调用partition 6 2 应该返回 3 因为有 3 种可能的方法他们是5 1 4 2 and 3 3 顺便一提 4 2
如何在并行进程（python）中将项目追加到列表中？

这是我正在使用的更复杂代码的一个非常简单的版本问题是我想将 method 函数中计算的项目附加到稍后可以显示的某个列表中但是当运行此代码时列表对象为空而结果数组已满 import multiprocessing as mp glo
Chrome 中意外的令牌默认值 ({}).default

我收到错误 SyntaxError 意外的默认令牌在 Chrome Opera 中的任何对象上获取或设置属性默认时 default 有人可以解释为什么会发生这种情况吗 upd 请大家注意这对 FF 没有意义因此在测试时您可能会错过
选择未聚合的变量，功能上依赖于 GROUPing 变量

背景我正在一个非常受限的 T SQL 环境中工作其中只能定义一个对象的主体 VIEW 大概是 in CREATE VIEW My View AS 在引擎盖下这是我的 VERSION https learn microsoft com
如何获取多选框的所有选定值？

我有一个
从列表 PySpark 的列表中创建单行数据框

我有一个这样的数据data 1 1 1 2 1 3 1 4 1 5 1 6 我想创建一个 PySpark 数据框我已经使用了 dataframe SQLContext createDataFrame data features 但我总是得
共享主机上的 403 禁止 Laravel

我有一个共享主机我正在尝试让我的 laravel 项目在其上运行我正在使用 voyager 进行管理面板我将我的应用程序公共文件夹放在 public html 中并将项目的其余部分放在 public html 的同一级别上所以它看
从代理服务器后面调用 Web 服务

我需要在将使用 Web 服务 XML SOAP 服务的应用程序 C 中添加功能现在该应用程序可以并且大部分在具有代理服务器的企业环境中使用我了解 SOAP 服务使用 HTTP 协议因此应该使用端口 80 该端口通常保持打开状态
如何在这个线性模型中强制删除截距或等效项？

考虑下表 DB lt data frame Y rnorm 6 X1 c T T F T F F X2 c T F T F T T Y X1 X2 1 1 8376852 TRUE TRUE 2 2 1173739 TRUE FALSE 3

如何在这个线性模型中强制删除截距或等效项？

有拦截

无拦截

结果相同

Question

如何在这个线性模型中强制删除截距或等效项？ 的相关文章

随机推荐

热门标签

如何在这个线性模型中强制删除截距或等效项？的相关文章