假设检验2

2023-11-12

为研究东、中、西部各省市规模以上的企业发展状况，我们收集了各城市企业的主要经济指标，包括：总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率、产品销售率。我们用变量“类别”定义了各类城市，其中1为东部城市；2为中部城市；3为西部城市。数据文件为homework2.xlsx。假设显著性水平为 α = 0.01 \alpha=0.01 α=0.01，问：

1. 对三个类别的城市进行均值向量间的两两比较，查看结果

加载必要的包

import numpy as np
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
from IPython.display import display

data=pd.read_excel('./homework2.xls')
data.head()

在这里插入图片描述

group_1=data[data['类别']==1].drop(['类别','地区'],axis=1) # 去除地区、类别标签列，只保留数值列
group_2=data[data['类别']==2].drop(['类别','地区'],axis=1) # 去除地区、类别标签列，只保留数值列
group_3=data[data['类别']==3].drop(['类别','地区'],axis=1) # 去除地区、类别标签列，只保留数值列
group_1.head()

在这里插入图片描述

def multi_unparied_data(group1:pd.DataFrame,group2:pd.DataFrame,confidence=0.05):
    # 计算检验统计量
    n1=len(group1)
    n2=len(group2)
    p=np.shape(group1)[1] # 变量维度
    mean1=np.mean(group1).values.T
    mean2=np.mean(group2).values.T
    S1=np.cov(group1.T)
    S2=np.cov(group2.T)
    Sp=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2)
    T2=n1*n2*(mean1-mean2).T@np.linalg.inv(Sp)@(mean1-mean2)/(n1+n2)
    Test_statistics=(n1+n2-p-1)*T2/(p*(n1+n2-2))

    # 计算p值
    from scipy.stats import f

    pvalue=f.sf(Test_statistics,p,n1+n2-p-1)

    # 比较p值与显著性水平
    if pvalue<confidence:
        print('在显著性水平{0:}下，两组样本所在总体的均值向量不相等。(p={1:.4f})'.format(confidence,pvalue))
    else:
        print('在显著性水平{0:}下，两组样本所在总体的均值向量相等。(p={1:.4f})'.format(confidence,pvalue))
    return pvalue

multi_unparied_data(group_1,group_2)

在显著性水平0.05下，两组样本所在总体的均值向量相等。(p=0.2793)

multi_unparied_data(group_1,group_3)

在显著性水平0.05下，两组样本所在总体的均值向量不相等。(p=0.0097)

multi_unparied_data(group_2,group_3)

在显著性水平0.05下，两组样本所在总体的均值向量不相等。(p=0.0470)

2. 对三个类别的城市同时进行均值向量间的比较，查看结果

from statsmodels.multivariate.manova import MANOVA

model=MANOVA.from_formula(' 总资产贡献率 + 资产负债率 + 流动资产周转次数 + 工业成本费用利润率 + 产品销售率 ~ 类别', data=data).mv_test()
# 在''中填入公式，其中~左侧填入自变量名称，~右侧填入因素名称
print(model.results['类别']['stat'])

在这里插入图片描述

3. 承接问题2，你认为哪些变量导致了三个类别城市均值向量的差异？说出你的理由。

print(stats.f_oneway(group_1.总资产贡献率.values,group_2.总资产贡献率.values,group_3.总资产贡献率.values))
print(stats.f_oneway(group_1.资产负债率.values,group_2.资产负债率.values,group_3.资产负债率.values))
print(stats.f_oneway(group_1.流动资产周转次数.values,group_2.流动资产周转次数.values,group_3.流动资产周转次数.values))
print(stats.f_oneway(group_1.工业成本费用利润率.values,group_2.工业成本费用利润率.values,group_3.工业成本费用利润率.values))
print(stats.f_oneway(group_1.产品销售率.values,group_2.产品销售率.values,group_3.产品销售率.values))

在这里插入图片描述

model=MANOVA.from_formula(' 总资产贡献率 + 资产负债率 + 工业成本费用利润率 + 产品销售率 ~ 类别', data=data).mv_test()
print(model.results['类别']['stat'])

在这里插入图片描述

model=MANOVA.from_formula(' 总资产贡献率 + 资产负债率 + 工业成本费用利润率 ~ 类别', data=data).mv_test()
print(model.results['类别']['stat'])

在这里插入图片描述

model=MANOVA.from_formula('资产负债率 + 工业成本费用利润率 ~ 类别', data=data).mv_test()
print(model.results['类别']['stat'])

在这里插入图片描述
流动资产周转次数、产品销售率导致了三个类别城市均值向量的差异。

感谢 Datawhale 对开源学习的贡献！

感谢 Git-Model 创作团队！

参考文献：

Modeling-Universe/Data-Story/Task7_下_假设检验2_多元数值向量检验/假设检验2-多元数值向量的检验.ipynb

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

统计

假设检验2 的相关文章

阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

我使用以下代码来限制日志文件的大小最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du

随机推荐

我 JS 写的好好的，为什么要用那么复杂的 TS

今年前端面试有个很有意思的现象最经典的 JavaScript 基础类面试题不在被面试官宠幸原因很简单现在市场经济收紧公司的项目决策中往往切割掉了边角试错成本而 TypeScript 无疑更适合构建大项目和管理就像 Java 和
彻底理解embedding

本文转载自https blog csdn net weixin 42078618 article details 84553940 版权问题请联系博主删除首先我们有一个one hot编码的概念假设我们中文一共只有10个字只是假设
毕业设计记录-Pytorch学习-自己手写数字识别

今天用之前的模型训练手写数字数据集训练了50轮效果如下然后我就准备用自己手写的数字来检验看看模型的准确率自己找的一些数字图片但是经过测试全部预测成3 很不解搞了好几个小时到最后无意间看到他的数据集的时候才知道哪出了问题这是
Linux网络服务部署yum仓库

目录 1 Yum概述 2 Yum实现过程 3 Yum配置文件 3 1yum主配置文件 etc yum conf 3 2仓库设置文件 etc yum repos d repo 4 yum命令详解 5 源地址 6 搭建仓库的方式 6 1搭建本地
MVC，MVP和MVVM架构解析

文章目录关于架构框架和设计模式三者的说明一 MVC 1 概念 2 结构 3 模式 4 优缺点 5 适用场景二 MVP 1 概念 2 结构 3 与MVC对比 4 优缺点 5 适用场景三 MVVM 1 结构 2 解析 3 MVVM架构
Java内存区域与内存溢出异常

Java内存区域与内存溢出异常如上图所示首先java源代码文件 java后缀会被java编译器编译为字节码文件 class后缀然后再让类加载器加载各个类的字节码文件加载完毕后交由JVM执行引擎执行在整个执行过程中 JVM会用一
spdlog日志库说明文档（超详细）

spdlog日志库说明文档超详细 spdlog是一个开源快速只有头文件的C 11日志库 code地址在https github com gabime spdlog 基础示例在https github com gabime spdlog
技术点集（面试）

怎么使用 ConcurrentHashMap 才能是线程安全的 package util import java util Map import java util concurrent ConcurrentHashMap public c
java session id 生成_Java通过sessionId获取Session

Servlet2 1之后不支持SessionContext里面getSession String id 方法但是我们可以通过HttpSessionListener监听器和全局静态map自己实现一个SessionContext MySes
我说CMMI

一我说CMMI之二 CMMI里有什么 CMMI划分为三个分支适用于供方乙方的模型 CMMI DEV 主要是针对开发类组织的 CMMI SVC 主要是针对服务类组织的适用于需方甲方的模型 CMMI ACQ 主要是针对采购类组织的 C
排查 Linux cup 飙升问题

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录前言 Java 执行过程一使用 top 命令二使用ps命令查看cpu占比高的PID 三将对应的TID转换为16进制四使用jdk自带的命令jstack
使用ffmpeg解析H265视频编码

使用 ffmpeg 解析 H265 视频编码的方法如下下载并安装 ffmpeg 如果您的计算机上已经安装了 ffmpeg 则可以跳过此步骤打开命令行窗口 Windows 用户可以在开始菜单中搜索命令提示符输入以下命令来解析 H265
it项目管理（6）

1 教材练习题6 a b 路径1 A B E H K 长度 2 2 2 2 2 10 天路径2 A B E I J K 长度 2 2 2 5 1 2 14 天路径3 A C F H K 长度 2 3 3 2 2 12 天路径4 A C
如何用Python获取网页指定内容

文章目录 1 抓取网页源代码 2 抓取一个网页源代码中的某标签内容 3 抓取多个网页子标签的内容 Python用做数据处理还是相当不错的如果你想要做爬虫 Python是很好的选择它有很多已经写好的类包只要调用即可完成很多复杂的功能
服务器性能问题排查

服务器性能问题一般有两种高内存占用高CPU占用比如应用程序高内存占用可能是因为文件读写频繁的IO 内存频繁GC 进一步占用了内存和CPU 比如应用程序高CPU占用可能是因为大任务计算死循环卡死不断超时或者重试所以需要具体
基于SpringBoot开发的疫情信息管理系统

文章目录项目介绍主要功能截图部分代码展示设计总结项目获取方式作者主页超级无敌暴龙战士塔塔开简介 Java领域优质创作者简历模板学习资料面试题库关注我都给你文末获取源码联系项目介绍疫情信息管理系统 java项目
学习网络编程No.6【将服务器日志和守护进程化】

引言北京时间 2023 9 1 21 15 下午刚更新完博客同理再接再厉这样整天不需要干什么除了玩手机的日子不多了马上就要开学每天需要签到签退的日子就要来临烦躁照我预料下学期我们学校应该会开一门Java的专业课现在这种线下
ESP32-CAM摄像头开发

1 硬件接线参考博客 https blog csdn net wangyilong153 article details 124366728 ops request misc 257B 2522request 255Fid 2522 25
ply文件格式详细说明

典型的 PLY 文件结构头部顶点列表面片列表其他元素列表头部是一系列以回车结尾的文本行用来描述文件的剩余部分头部包含一个对每个元素类型的描述包括元素名如边这个元素在工程里有多少以及一个与这个元素关联的不同属性的列表
假设检验2

为研究东中西部各省市规模以上的企业发展状况我们收集了各城市企业的主要经济指标包括总资产贡献率资产负债率流动资产周转次数工业成本费用利润率产品销售率我们用变量类别定义了各类城市其中1为东部城市 2为中部城市 3为西部

假设检验2

1. 对三个类别的城市进行均值向量间的两两比较，查看结果

加载必要的包

2. 对三个类别的城市同时进行均值向量间的比较，查看结果

3. 承接问题2，你认为哪些变量导致了三个类别城市均值向量的差异？说出你的理由。

感谢 Datawhale 对开源学习的贡献！

感谢 Git-Model 创作团队！

参考文献：

假设检验2 的相关文章

随机推荐

热门标签