为什么 R 和 statsmodels 给出的方差分析结果略有不同？

2023-12-13

使用小型 R 样本数据集和来自的 ANOVA 示例统计模型，其中一个变量的自由度报告不同，F 值结果也略有不同。也许他们的默认方法略有不同？我可以设置 statsmodels 以使用 R 的默认值吗？

import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols


##R code on R sample dataset

#> anova(with(ChickWeight, lm(weight ~ Time + Diet)))
#Analysis of Variance Table
#
#Response: weight
#           Df  Sum Sq Mean Sq  F value    Pr(>F)
#Time        1 2042344 2042344 1576.460 < 2.2e-16 ***
#Diet        3  129876   43292   33.417 < 2.2e-16 ***
#Residuals 573  742336    1296
#write.csv(file='ChickWeight.csv', x=ChickWeight, row.names=F)

cw = pd.read_csv('ChickWeight.csv')
cw_lm=ols('weight ~ Time + Diet', data=cw).fit()   

print(sm.stats.anova_lm(cw_lm, typ=2))
#                  sum_sq   df            F         PR(>F)
#Time      2024187.608511    1  1523.368567  9.008821e-164
#Diet       108176.538530    1    81.411791   2.730843e-18
#Residual   764035.638024  575          NaN            NaN

数据集的头部和尾部是相同的*，也是重量和时间的平均值、最小值、最大值、中值。

看起来“饮食”在 statsmodels 调用中只有一个自由度，这意味着它可能被视为连续变量，而在 R 中它有 3 个自由度，因此它可能是一个因子/离散随机变量。

要使 ols() 将“饮食”视为分类随机变量，请使用

cw_lm=ols('weight ~ C(Diet) + Time', data=cw).fit()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

pandas

StatsModels

ANOVA

为什么 R 和 statsmodels 给出的方差分析结果略有不同？的相关文章

使用 geom_abline() 和 ggplot

我是初学者ggplot2 距离我开始试验才过去 4 天所以如果这个问题听起来太基本了我深表歉意我很感激任何指导我已经在这个问题上苦苦挣扎了大约一个小时我正在尝试使用geom abline 如下 p lt ggplot mpg a
R：如何在不耗尽内存的情况下重新绑定两个巨大的数据帧

我有两个数据框df1 and df2每个都有大约 1000 万行和 4 列我使用 RODBC sqlQuery 将它们读入 R 没有任何问题但是当我尝试rbind他们我收到了最可怕的 R 错误消息 cannot allocate me
Dplyr select_ 和starts_with 对变量列表中的多个值进行选择

我正在从不同位置的不同传感器收集数据数据输出类似于 df lt data frame date c 2011 2012 2013 2014 2015 Sensor1 Temp c 15 18 15 14 19 Sensor1 Pressu
如何创建具有特定于每个方面的标题和副标题的分面图？

生成一个图该图与每列的单独图相结合带有标题和副标题以及每个图的垂直线我使用直方图创建了带有垂直线的列 library ggplot2 library gridExtra library tidyr actualIris lt dat
R 中的多面点阵图，例如线框：如何删除条带并添加 1 行字幕

我使用这种功能来自iris数据集 model test lt lm Sepal Length Petal Length Sepal Width Petal Width Species 2 data iris gg lt expand gr
从 pandas DataFrame 中的列创建元组

我想从 pandas 数据框中的列自动创建一个元组将传递给 scipy stats 函数以便元组的每一行都是数据帧每一列的值这是我的数据帧的标题 4 3 a 0 5 3 a 4 7 3 a 3 datetime pac 2015 09
R strsplit之前（和之后）保留两个分隔符

我有一个如下所示的字符串 x lt 01 01 121210 01 0001 我想将其分成一个向量以便得到以下内容 1 0 1 01 1 2 1 2 1 0 01 0 0 0 1 可以是或括号之间的位数可以是 2 个或更多我一直试图
在 Rdata 中保存矩阵并更新 Rdata 文件

我有一个矩阵 mat lt matrix data 1 30 ncol 10 nrow 3 我想将其保存到 Rdata save mat file m Rdata 然后加载回来 m lt load m Rdata 然后看看它的内容 m 1
如何使用通配符导入具有相似工作表名称的多个 Excel 文件？

我使用以下代码导入名为 My Bench Sheet 1 的工作表 bench file 1 pd read excel Bench1 xlsx sheet name My Bench Sheet 1 我有多个工作簿其中的工作表以我的工
如何编辑 R 函数的源代码？

我正在与earlywarnings包并想编辑其中编写的函数之一qda ews功能我可以fix 但我想编辑的功能由于某种原因在我使用时没有列出fix 该函数称为generic RShiny 这是 github 的链接 https gith
如何在 ifelse 中使用示例

我有以下清单 x rep a 100 如果我使用下表 ifelse x a sample c 1 100 1 0 当我第一次运行时我得到以下输出 1 22 22 22 22 22 22 22 22 22 22 22 22 22 22 22
如何在 Pandas 中每隔 n 行将 n 个 DataFrame 插入到另一个 DataFrame 中？

例如我有一个DataFrame A如下 A 0 1 2 现在我想每 2 行插入DataFrame B into A每 1 行和B如下 B 3 3 4 4 5 5 最后我想要 A 0 3 3 1 4 4 2 5 5 我怎样才能实现这个目标
通过 read.big.matrix 读取 R 中的大数据

我正在使用 r 读取尺寸为 3131875 5 的数据read big matrix 我的数据既有字符列又有数字列包括日期变量我应该使用的命令是 as1 lt read big matrix C Documents and Settin
使用 dplyr 通过管道删除空列

我有一个宽格式的参与者问卷答复数据框每列代表一个特定的问题项目数据框看起来像这样 id lt c 1 2 3 4 Q1 lt c NA NA NA NA Q2 lt c 1 4 5 Q3 lt c NA 2 3 4 Q4 lt c 2
计算 Dataframe 中具有 1 个或多个 NaN 的行数

我有以下内容 print df isna sum 这给了我 city 2 country 0 testid 0 house 1807 house number 248 po box 1845 zipcode 260 road 132 sta
如何定义 Flexdashboard 上社交网络图标的链接？

我向 Flexdashboard 的导航栏添加了社交图标但无法为每个图标添加适当的链接在 R Markdown 文件中我添加了 output flexdashboard flex dashboard social twitter fa
如何对预测值进行反向移动平均（在 pandas 中，rolling().mean）操作？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个像这样的 df import numpy as np import pandas as pd import matplotlib
pandas DataFrame：获取上个月缺少交易且无法移位（）的值

有没有办法在不生成虚拟行的情况下实现这一点这是我的数据源 Group Store Month Revenue Group1 A 201611 10 Group1 A 201612 20 Group1 A 201701 30 Group1
Pandas 使用 NaN 进行数据透视或重塑数据框

我有这个数据框我需要根据以下数据进行旋转或重塑frame col df frame 0 0 1 1 2 2 3 0 4 1 5 2 pvol 0 nan 1 nan 2 nan 3 23 1 4 24 3 5 25 6 vvol 0 10
如何为ggplot中的每个方面行添加y轴标题？

我正在做一个散点图facet grid 像那样 library ggplot2 ggplot df aes x y geom point facet grid group1 group2 我想要 y 轴标题y像这样位于每一行的中间绘制解决

随机推荐

位置之前的第一个索引

我有一个字符串和该字符串中的索引并且想要获取该索引之前的子字符串的第一个位置例如在字符串中 this is a test string that contains other string for testing 是否有一个函数给定
Visual Basic .NET 中的 C 样式指针

我研究 Visual Basic NET 中的 C 风格指针有一段时间了我遇到过http support microsoft com kb 199 824 wa wsignin1 0但我不知道这是否正确或如何应用我已经使用 c 中的程序
Angularjs 与 html5Mode 的正常链接

我正在 html 5 模式下使用 angularjs 它似乎控制了页面上的所有 href 但是如果我想要链接到应用程序同一域中但实际上不在应用程序中的某些内容该怎么办一个例子是 pdf If i do a href pdfurl An
如何使用 Google 地图将地址地理编码为纬度/经度

我希望能够在谷歌地图上绘制几家公司并了解我需要对这些公司进行地理编码我还在地图上的多个标记下方提供了代码如何对多个公司地址进行地理编码使用以下地址作为第一个示例并将其合并到我当前的代码中我真的需要有人的帮助因为我无法理解 Go
重构代码以避免反模式

我有一个 BusinessLayer 项目其中包含以下代码域对象是FixedBankAccount 它实现了IBankAccount 存储库被制作为域对象的公共属性并被制作为接口成员如何重构它以使存储库不再是接口成员域对象 Fix
此 C# FluentNHibernate 组件映射的等效 VB.NET 代码是什么？

我是一名 C 程序员只能编写 VB NET 代码在为我当前的客户进一步探索 NHibernate 时我遇到了 FluentNHibernate 我发现它非常有吸引力但现在我想知道如何将组件映射的 C 代码翻译为 VB NET
c# - 以编程方式将pdf转换为word [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导有谁知道以编程方式将 PD
如何为带有缩略图的纯 CSS/HTML 滑块创建标题，无需 java/jquery

我正在尝试创建一个滑块其中包含用于导航的图像缩略图我还想为每张幻灯片创建一个标题使其随特定幻灯片一起出现和消失这就是我现在所拥有的 http jsfiddle net yb02jzbq 源自http thecodeplayer co
iOS获取特定的UITableViewCell

我有一个UIButton在一个习惯中UITableViewCell 单击此按钮会触发事件 myButton addTarget self action selector buttonClicked forControlEvents UICo
Python 从类中的另一个函数调用一个函数

我正在尝试学习 python 但很难理解为什么这个类会抛出错误NameError name self is not defined 我已经关注了如何在类中调用函数并添加了self 但这没有帮助这是代码谁能指出原因 class Back
通过考虑 r (2) 中的分组 Q 矩阵来操作字符向量

我正在尝试编写基于Group多变的 item map具有项目信息其中包括显示哪个项目与哪个组关联的 q 矩阵 Group lt c 1 2 3 4 item map lt data frame item id c 21 41 61 72
我想在 php 中 cURL 谷歌搜索结果

我尝试了以下代码 url http www google co uk q query hl en prmd imvns source lnt tbs ctr countryUK 7CcountryGB cr countryUK 7Ccoun
如何连续改变正弦声音的频率？

我在用Pygame在窗口中渲染精灵我想播放正弦声音其频率取决于y该精灵的位置我不希望信号相位不连续实现这一目标的最佳方法是什么我想出了这个解决方案改变freq to newfreq然后像这样改变相位 newphase 2 np
如何在 JavaScript 正则表达式中用 (n-1) 次出现的同一字符替换 (n) 次出现的字符

我的数据是 Hello World I need Hello World 所以基本上 5 次出现的星号被替换为 4 次出现的星号我怎样才能做到这一点在正则表达式javascript中注意星星的数量是动态的我尝试过此操作但不确定如何
启动新的 Windows 应用程序：我应该使用 _TCHAR 还是 wchar_t 作为文本？

我正在用 C 为 Windows 编写一个新的个人爱好应用程序在我之前使用过的低级 Windows 内容中 TCHAR 或只是 TCHAR 用于字符串操作的数组 basic strings 使用有什么好处吗 TCHAR直接使用 Uni
LINQ to SQL C# 合并

给出下表 Length Width Color ID 18 18 blue 1 12 12 red 1 我想生成单列行 SIZES 18 x 18 12 x 12 我可以在 SQL 中执行此操作如下所示 DECLARE SIZES VA
通过使用范围解析避免多重继承引起的歧义

这是多重继承的示例我使用范围解析运算符而不是虚拟类来解决歧义 struct A int i struct B A struct C A struct D B C void f B i 10 void g std cout lt lt B
减少两个剪切图像之间的间距

我正在使用剪辑路径来剪辑两个图像结果是一切都很好但我想像这样减少这些图像之间的间距 clip wrap display inline element webkit clip path polygon 0 100 0 0 100 0 6
Toast 通知不起作用

下面的方法在调用设置 Toast 时执行但在经过一段时间后不会显示任何 Toast Windows 8 Metro 应用程序 Toast 通知是否还需要任何设置 int scheduledToastCounter 1 public voi
为什么 R 和 statsmodels 给出的方差分析结果略有不同？

使用小型 R 样本数据集和来自的 ANOVA 示例统计模型其中一个变量的自由度报告不同 F 值结果也略有不同也许他们的默认方法略有不同我可以设置 statsmodels 以使用 R 的默认值吗 import pandas as pd

为什么 R 和 statsmodels 给出的方差分析结果略有不同？

为什么 R 和 statsmodels 给出的方差分析结果略有不同？ 的相关文章

随机推荐

热门标签

为什么 R 和 statsmodels 给出的方差分析结果略有不同？的相关文章