statsmodels 0.10.0中文文档

2023-11-07

为什么翻译

本人会计出身，转行数据分析（更多是用excel、sql、spss等工具），30岁开始入坑python，在学习statsmodels包的过程中，在知乎、百度、CSDN和github上均没有找到statsmodels的中文文档，一开始以为 ApacheCN 开源组织（号称一群有想法，爱装逼，爱斗图，有活力，爱搞事，爱吃辣条的朋友）已经翻译了该包的文档，最后发现他们只是翻译该文档的目录，为了更好地入坑，我只好用我那拙劣的英语、再加上谷歌翻译，经过三四个月时间的翻译，目前docs和example文件均已翻译，目前翻译ing，水平有限，请大家多担待。翻译这个活没有什么技术可言，但真的很苦逼。所以真的非常的感谢 ApacheCN 开源组织在我学习的过程中贡献的各种中文文档，非常感谢！

项目github链接地址：https://github.com/Squidxwh/statsmodels

关于统计模型

statsmodels是一个Python软件包，为scipy提供了补充，以进行统计计算，包括描述性统计以及统计模型的估计和推断。

statsmodels主要包括如下子模块：

回归模型：线性回归，广义线性模型，稳健的线性模型，线性混合效应模型等等。

方差分析（ANOVA）。

时间序列分析：AR，ARMA，ARIMA，VAR和其它模型。

非参数方法： 核密度估计，核回归。

统计模型结果可视化。

比较：statsmodels更关注统计推断，提供不确定估计和参数p-value。相反的，scikit-learn注重预测。

主要特点

线性回归模型：

-普通最小二乘法
-广义最小二乘法
-加权最小二乘法
-具有自回归误差的最小二乘
-分位数回归
-递归最小二乘法

具有混合效应和方差成分的混合线性模型
GLM：支持所有单参数指数族分布的广义线性模型
用于二项式和泊松的贝叶斯混合GLM
GEE：单向聚类或纵向数据的广义估计方程
离散模型:

-Logit 和 Probit
-多项 logit (MNLogit)
-泊松和广义泊松回归
-负二项式回归
-零膨胀计数模型

RLM: 鲁棒的线性模型，支持多个 M 估计器。
时间序列分析：时间序列分析模型

-完整的StateSpace建模框架
	-季节性ARIMA和ARIMAX模型
	-VARMA和VARMAX模型
	-动态因子模型
	-未观测到的组件模型

马尔可夫切换模型（MSAR），也称为隐马尔可夫模型（HMM）
单变量时间序列分析：AR，ARIMA
矢量自回归模型，VAR和结构VAR
矢量误差修正模型，VECM
指数平滑，Holt-Winters
时间序列的假设检验：单位根，协整和其他
用于时间序列分析的描述性统计数据和过程模型

生存分析:

-比例风险回归（Cox模型）
-生存者函数估计（Kaplan-Meier）
-累积发生率函数估计

多变量:

-缺失数据的主成分分析
-旋转因子分析
-MANOVA
-典型相关

非参数统计：单变量和多变量核密度估计
数据集：用于示例和测试的数据集
统计：广泛的统计检验

-诊断和规格检验
-拟合优度和正态性检验
-多元测试函数
-各种其他统计检验

使用MICE进行插补，秩序统计回归和高斯插补
调解分析
图形包括用于数据和模型结果的可视化分析的绘图功能
输入/输出

-用于读取Stata .dta文件的工具，但pandas具有较新的版本
-表输出到ascii，latex和html

其他模型
Sandbox：statsmodels包含一个 sandbox 文件夹，其中包含处于开发和测试各个阶段的代码，因此不被视为“生产就绪”。其中包括：

-广义矩法（GMM）估计器
-核回归
-scipy.stats.distributions的各种扩展
-面板数据模型
-信息理论测度

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)