python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析？

2024-02-15

我想使用 Pandas 数据框来分解一个变量的方差。

例如，如果我有一个名为“度”的列，并且我已针对各种日期、城市以及夜间与白天对其进行了索引，那么我想找出该系列中的变化中有多少部分来自横截面城市变化，有多少来自时间序列变化，有多少来自夜间与白天。

在 Stata 中，我会使用固定效应并查看 R^2。希望我的问题有意义。

基本上，我想做的是通过其他三列找到“度”的方差分析细分。

我设置了直接比较来测试他们，发现他们的假设可以略有不同 https://stackoverflow.com/questions/28755617/why-do-r-and-statsmodels-give-slightly-different-anova-results，从统计学家那里得到了提示，下面是与 R 结果匹配的 pandas 数据帧上的方差分析示例：

import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols


# R code on R sample dataset

#> anova(with(ChickWeight, lm(weight ~ Time + Diet)))
#Analysis of Variance Table
#
#Response: weight
#           Df  Sum Sq Mean Sq  F value    Pr(>F)
#Time        1 2042344 2042344 1576.460 < 2.2e-16 ***
#Diet        3  129876   43292   33.417 < 2.2e-16 ***
#Residuals 573  742336    1296
#write.csv(file='ChickWeight.csv', x=ChickWeight, row.names=F)

cw = pd.read_csv('ChickWeight.csv')

cw_lm=ols('weight ~ Time + C(Diet)', data=cw).fit() #Specify C for Categorical
print(sm.stats.anova_lm(cw_lm, typ=2))
#                  sum_sq   df            F         PR(>F)
#C(Diet)    129876.056995    3    33.416570   6.473189e-20
#Time      2016357.148493    1  1556.400956  1.803038e-165
#Residual   742336.119560  573          NaN            NaN

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

scipy

StatsModels

ANOVA

python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析？的相关文章

稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
在 python pandas 中，如何保存“网格图”？

我对 pandas 绘图工具很陌生在文档中以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而当我尝试从图中获取图形参考并保存它时问题就出现了 myfigure myp
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型

随机推荐

如何对扩展 SqlMapClientDaoSupport 的 DAO 进行单元测试

Spring DA 有助于编写 DAO 当使用iBATIS作为持久性框架并扩展SqlMapClientDaoSupport时应该为DAO设置SqlMapClient模拟但我不能这样做 SqlMapClientTemplate 不是一个接
当我使用 Android Jetpack Compose 时，如何在 ViewModel 中设计 UI 状态类？

我希望在 ViewModel 中设计 UI 状态类以便在状态更改时启动 UI 重组我读过一些示例项目例如https github com android compose samples https github com android
使用Java检索URL中的参数

我有一个使用 XSL 和 XML 生成 PDF 的小 Servlet 因为我想通过 URL 指定文件所以我需要从那里获取这些参数 localhost Servlet xml c xml test xml xsl c xsl test xs
如何从 ASP 页运行 sqlcmd.exe？

作为数据库修订控制和自动安装过程的一部分我们需要能够在 ASP 页面内对各种 sql 文件运行 sqlcmd exe 我用来执行此操作的代码是 Dim cmd cmd sqlcmd S DATABASE SERVER U DATABA
客户端程序验证 SSL_get_peer_certificate 返回的服务器证书？

我有一个使用 C 编程语言中的 OpenSSL 的 SSL TLS 客户端程序我正在寻找验证服务器证书的方法 X509 返回者SSL get peer certificate函数调用另外我还使用加载了自己的 CA 证书SSL CTX
MongoDB GetCollection 方法是否将整个集合加载到 RAM 或引用中？ C＃

我有一个存储库类用于处理 MongoDB 的所有数据库函数这是构造函数的实现 public LocationRepository string connectionString if string IsNullOrWhiteSpace
为什么“convert x.png y.png”会创建不同大小 (KB) 的图像？

我有一些图像我试图通过调整它们的大小来将它们标准化到一定的比例当我开始调整图像大小时我注意到它们的体积 KB 变得比原始图像大得多我通过简单地执行以下操作进一步检查了它转换 x png y png 并得到了一些差异例如在一种情
通过 YouTube API 上传时，视频文件卡在 0%

正如标题所示视频文件可以通过 YouTube 的上传功能上传和处理然而当我尝试以编程方式上传它通过 OAuth2 和 YouTube API v3 时它总是陷入 0 的处理状态 SO 上有 youtubers 吗有没有专门的论坛
如何将项目添加到 NavigationView 中的菜单组

在 Android 的文字游戏中我目前有一个硬编码菜单由left drawer menu xml并由 3 组组成我的回合对手的回合以及最后的其他内容 mLeftDrawer NavigationView findViewById R
存储枚举 MongoDB

我在 Mongo 数据库中存储每个用户的排名管理员版主用户和成就等枚举据我所知 Mongo 没有枚举数据类型这意味着我必须使用其他类型来存储它我曾想过使用整数来存储它我认为它比存储可以轻松表示为整数的所有内容的字符串占用的空
MySQL 导出/导入中特殊字符丢失

我正在尝试将 MySQL 3 23 58 数据库移动到运行 5 5 19 的其他服务器旧的指定了 latin1 编码据我所知底层数据确实是 latin1 我尝试了很多事情主要是使用 mysqldump 和 latin1 编码标志从
java中如何让线程休眠特定时间？

我有一个场景我希望线程休眠特定的时间 Code public void run try do something Thread sleep 3000 do something after waking up catch Interrupt
异步 WCF 方法 WebOperationContext 在等待后为 null

在以下示例中该方法公开为 WCF 服务操作并且该服务托管在 IIS 中进入该函数时 WebOperationContext Current 将按预期设置然而等待完成等待后 WebOperationContext Current 将
如何使用CSS在占位符中获取星号

I want to add an asterisk mark to placeholder of inputs Something like this 我已经搜索过互联网但找不到有效的解决方案我目前的做法目前我正在尝试将其添加到 aft
很好的黄瓜教程，不依赖于 Rails [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个好的黄瓜教程它不会强迫我使用 Rails 有什么好的建议吗我相信Rspec 书 ht
您指定了正确的主机或端口吗？ Kubernetes 上的错误

我已经按照 hello world 教程进行了操作http kubernetes io docs hellonode http kubernetes io docs hellonode 当我跑步时 kubectl run hello nod
ggplot2scale_x_连续限制或绝对

我在循环中使用以下 ggplot2 v0 9 scale x continious 逻辑按县名称试图将每个县的数据绘制在具有相同 x 比例的单独图上 MaxDays 365 3 p lt p scale x continuous lim
如何强制 IntelliJ 使用 Maven 下载 javadocs？

我对项目结构中的一些 Maven 条目有以下描述文件系统中确实不存在 Javadoc 文件同时它存在于中央存储库中为什么没有下载如何强制下载 UPDATE 这些选项已经开启设置后尝试重新编译关闭打开等单击IntelliJ右
ARM 皮质：使用位带的互斥体

鉴于此在 ARM Cortex M3 上我可以原子地读取一位原子地设置一位原子地清除一位如何将这些组合起来形成互斥体样式的操作集 try lock take lock release lock 看起来try lock or ta
python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析？

我想使用 Pandas 数据框来分解一个变量的方差例如如果我有一个名为度的列并且我已针对各种日期城市以及夜间与白天对其进行了索引那么我想找出该系列中的变化中有多少部分来自横截面城市变化有多少来自时间序列变化有多少来自夜间与

python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析？

python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析？ 的相关文章

随机推荐

热门标签

python 中使用 pandas dataframe 和 statsmodels 或 scipy 进行方差分析？的相关文章