python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析?

2024-02-15

我想使用 Pandas 数据框来分解一个变量的方差。

例如,如果我有一个名为“度”的列,并且我已针对各种日期、城市以及夜间与白天对其进行了索引,那么我想找出该系列中的变化中有多少部分来自横截面城市变化,有多少来自时间序列变化,有多少来自夜间与白天。

在 Stata 中,我会使用固定效应并查看 R^2。希望我的问题有意义。

基本上,我想做的是通过其他三列找到“度”的方差分析细分。


我设置了直接比较来测试他们,发现他们的假设可以略有不同 https://stackoverflow.com/questions/28755617/why-do-r-and-statsmodels-give-slightly-different-anova-results,从统计学家那里得到了提示,下面是与 R 结果匹配的 pandas 数据帧上的方差分析示例:

import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols


# R code on R sample dataset

#> anova(with(ChickWeight, lm(weight ~ Time + Diet)))
#Analysis of Variance Table
#
#Response: weight
#           Df  Sum Sq Mean Sq  F value    Pr(>F)
#Time        1 2042344 2042344 1576.460 < 2.2e-16 ***
#Diet        3  129876   43292   33.417 < 2.2e-16 ***
#Residuals 573  742336    1296
#write.csv(file='ChickWeight.csv', x=ChickWeight, row.names=F)

cw = pd.read_csv('ChickWeight.csv')

cw_lm=ols('weight ~ Time + C(Diet)', data=cw).fit() #Specify C for Categorical
print(sm.stats.anova_lm(cw_lm, typ=2))
#                  sum_sq   df            F         PR(>F)
#C(Diet)    129876.056995    3    33.416570   6.473189e-20
#Time      2016357.148493    1  1556.400956  1.803038e-165
#Residual   742336.119560  573          NaN            NaN
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析? 的相关文章

随机推荐

  • 如何对扩展 SqlMapClientDaoSupport 的 DAO 进行单元测试

    Spring DA 有助于编写 DAO 当使用iBATIS作为持久性框架并扩展SqlMapClientDaoSupport时 应该为DAO设置SqlMapClient模拟 但我不能这样做 SqlMapClientTemplate 不是一个接
  • 当我使用 Android Jetpack Compose 时,如何在 ViewModel 中设计 UI 状态类?

    我希望在 ViewModel 中设计 UI 状态类 以便在状态更改时启动 UI 重组 我读过一些示例项目 例如https github com android compose samples https github com android
  • 使用Java检索URL中的参数

    我有一个使用 XSL 和 XML 生成 PDF 的小 Servlet 因为我想通过 URL 指定文件 所以我需要从那里获取这些参数 localhost Servlet xml c xml test xml xsl c xsl test xs
  • 如何从 ASP 页运行 sqlcmd.exe?

    作为数据库修订控制 和自动安装 过程的一部分 我们需要能够在 ASP 页面内对各种 sql 文件运行 sqlcmd exe 我用来执行此操作的代码是 Dim cmd cmd sqlcmd S DATABASE SERVER U DATABA
  • 客户端程序验证 SSL_get_peer_certificate 返回的服务器证书?

    我有一个使用 C 编程语言中的 OpenSSL 的 SSL TLS 客户端程序 我正在寻找验证服务器证书的方法 X509 返回者SSL get peer certificate函数调用 另外 我还使用加载了自己的 CA 证书SSL CTX
  • MongoDB GetCollection 方法是否将整个集合加载到 RAM 或引用中? C#

    我有一个存储库类 用于处理 MongoDB 的所有数据库函数 这是构造函数的实现 public LocationRepository string connectionString if string IsNullOrWhiteSpace
  • 为什么“convert x.png y.png”会创建不同大小 (KB) 的图像?

    我有一些图像 我试图通过调整它们的大小来将它们标准化到一定的比例 当我开始调整图像大小时 我注意到它们的体积 KB 变得比原始图像大得多 我通过简单地执行以下操作进一步检查了它 转换 x png y png 并得到了一些差异 例如 在一种情
  • 通过 YouTube API 上传时,视频文件卡在 0%

    正如标题所示 视频文件可以通过 YouTube 的上传功能上传和处理 然而 当我尝试以编程方式上传它 通过 OAuth2 和 YouTube API v3 时 它总是陷入 0 的处理状态 SO 上有 youtubers 吗 有没有专门的论坛
  • 如何将项目添加到 NavigationView 中的菜单组

    在 Android 的文字游戏中 我目前有一个硬编码菜单 由left drawer menu xml并由 3 组组成 我的回合 对手的回合以及最后的其他内容 mLeftDrawer NavigationView findViewById R
  • 存储枚举 MongoDB

    我在 Mongo 数据库中存储每个用户的排名 管理员 版主 用户 和成就等枚举 据我所知 Mongo 没有枚举数据类型 这意味着我必须使用其他类型来存储它 我曾想过使用整数来存储它 我认为它比存储可以轻松表示为整数的所有内容的字符串占用的空
  • MySQL 导出/导入中特殊字符丢失

    我正在尝试将 MySQL 3 23 58 数据库移动到运行 5 5 19 的其他服务器 旧的指定了 latin1 编码 据我所知 底层数据确实是 latin1 我尝试了很多事情 主要是 使用 mysqldump 和 latin1 编码标志从
  • java中如何让线程休眠特定时间?

    我有一个场景 我希望线程休眠特定的时间 Code public void run try do something Thread sleep 3000 do something after waking up catch Interrupt
  • 异步 WCF 方法 WebOperationContext 在等待后为 null

    在以下示例中 该方法公开为 WCF 服务操作 并且该服务托管在 IIS 中 进入该函数时 WebOperationContext Current 将按预期设置 然而 等待完成等待后 WebOperationContext Current 将
  • 如何使用CSS在占位符中获取星号

    I want to add an asterisk mark to placeholder of inputs Something like this 我已经搜索过互联网但找不到有效的解决方案 我目前的做法 目前我正在尝试将其添加到 aft
  • 很好的黄瓜教程,不依赖于 Rails [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个好的黄瓜教程 它不会强迫我使用 Rails 有什么好的建议吗 我相信Rspec 书 ht
  • 您指定了正确的主机或端口吗? Kubernetes 上的错误

    我已经按照 hello world 教程进行了操作http kubernetes io docs hellonode http kubernetes io docs hellonode 当我跑步时 kubectl run hello nod
  • ggplot2scale_x_连续限制或绝对

    我在循环中使用以下 ggplot2 v0 9 scale x continious 逻辑 按县名称 试图将每个县的数据绘制在具有相同 x 比例的单独图上 MaxDays 365 3 p lt p scale x continuous lim
  • 如何强制 IntelliJ 使用 Maven 下载 javadocs?

    我对项目结构中的一些 Maven 条目有以下描述 文件系统中确实不存在 Javadoc 文件 同时 它存在于中央存储库中 为什么没有下载 如何强制下载 UPDATE 这些选项已经开启 设置后尝试重新编译 关闭 打开等 单击IntelliJ右
  • ARM 皮质:使用位带的互斥体

    鉴于此 在 ARM Cortex M3 上 我可以 原子地读取一位 原子地设置一位 原子地清除一位 如何将这些组合起来形成互斥体样式的操作集 try lock take lock release lock 看起来try lock or ta
  • python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析?

    我想使用 Pandas 数据框来分解一个变量的方差 例如 如果我有一个名为 度 的列 并且我已针对各种日期 城市以及夜间与白天对其进行了索引 那么我想找出该系列中的变化中有多少部分来自横截面城市变化 有多少来自时间序列变化 有多少来自夜间与