假设检验/T检验/F检验/Z检验/卡方检验

2023-11-09

****显著性水平:
一个概率值,原假设为真时,拒绝原假设的概率,表示为 alpha 常用取值为0.01, 0.05, 0.10

****什么是P值?
p值是当原假设为真时样本观察结果及更极端结果出现的概率。
如果P值很小,说明这种情况发生的概率很小,如果这种情况还出现了,那么就有理由拒绝原假设。P值越小,拒绝原假设的理由就越充分。
根据选取的检验统计量计算P值,通过P值确定是否拒绝该原假设。

****P值是指在零假设成立的情况下,观察到的检验统计量至少如同观察到的那样极端的概率。它用于假设检验,以确定观察到的数据是否具有统计学显著性。

****P值是具有零假设为真的情况下观察到的效应发生的概率。

****检验中常说的小概率:
在一次试验中,一个几乎不可能发生的事件发生的概率
在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设
小概率由我们事先确定;

****假设检验的基本思想是统计学的 小概率反证法 思想:对于一个小概率事件而言,其互斥事件发生的概率明显远远大于这一小概率事件,可以认为小概率事件在一次试验中不应当发生。因此,可以首先假定需要考察的假设是成立的,然后基于此假设计算从总体中抽样得到样本的概率,如果概率极小,则表明这是一个小概率事件,在一次试验中不会发生,进而推翻原假设。

****假设检验的具体步骤为:1.提出零假设和备择假设;2.构造检验统计量,并找出在零假设成立的情况下,检验统计量服从的分布;3.确定显著性水平、拒绝域以及临界值;4.计算检验统计量和p值;5.决策。

****检验统计量 是根据样本观测结果计算得到的样本统计量,是对零假设和备择假设作出决策的基础。

什么是t检验
t检验(Student’s T Test)比较两个平均值(均值),然后告诉你它们彼此是否有差异。并且,t检验还会告诉你这个差异有没有意义,换句话说,它让你知道这些差异是否可能是偶然发生的。

什么是t分数
t分数是两个组之间的差值与组内差的比值。t分数越大,组间的差异越大。t分数越小,组间的相似度就越大。t分数为3代表这些组是彼此之间的三倍。当你运行t-score时,t值越大,结果越可能重复。
t分数越大,这些组差异越大。
如果t分数越小,这些组越相似的。

什么是T值和P值
“足够大”多大?每个t值都有伴随着一个p值。p值是你的样本数据的结果偶然发生的概率。P值为0%至100%。它们通常写为小数。例如,5%的p值为0.05。低p值好;低假定值是好的;他们指出你的数据不是偶然发生的。例如,p值为0.1意味着实验结果只有1%的可能是碰巧发生的。多数情况下,p值为0.05(5%)表示数据有效。

t检验有哪些类型
t检验有三种主要类型:
1.独立样本t检验:比较两组平均值的方法。
2.配对样本t检验:比较同一组中不同时间(例如,相隔一年)平均值的方法。
3.单一样本t检验:检验单个组的平均值对照一个已知的平均值。

三、假设检验
统计假设检验(Hypothesis Test):事先对总体的参数或者分布做一个假设(刚才的例子我们就假设 p=0.5 的二项式分布),然后基于已有的样本数据去判断这个假设是否合理。即样本和总体假设之间的不同是纯属机会变异(因为随机性误差导致的不同),还是两者确实不同。常用的假设检验方法有 t- 检验法、x2 检验法(卡方检验)、F- 检验法等
基本思想:
1、从样本推断整体
2、通过反证法推断假设是否成立(假设整体满足分布,出现这个样本分布的概率大不大,如果概率非常小,那么假设不成立)
3、小概率事件在一次实验中基本不会发生(低于50%就不会发生,那么50%是我们选择的值,如果比较严格的话,可以把这个值降到1%)
4、不轻易拒绝原假设
5、通过显著性水平定义小概率事件不可能发生的概率
6、全称命题只能被否定而不能被证明(通过当前的样本我希望做一个假设,用分布的情况来推翻这个假设不成立,但是很难证明它成立)

一、假设检验
统计假设检验:事先对总体的参数或者分布做一个假设,然后基于已有的样本数据去判断这个假设是否合理。即样本和总体假设之间的不同是纯属机会变异(因为随机性误差导致的不同),还是两者确实不同。常用的假设检验方法有 t- 检验法,x2 检验法(卡方检验)、F- 检验法等。
基本思想:
1、从样本推断整体
2、通过反证法推断假设是否成立
3、小概率事件在一次实验中基本不会发生
4、不轻易拒绝原假设
5、通过显著性水平定义小概率事件不可能发生的概率
6、全称命题只能被定义而不能被证明(所谓全称命题是指一切全部等等不太容易一个一个验证的,没有办法证实,只要找到一个部分,就能证明这个命题错误;但是要证明这个命题是正确,就很费劲了)

三、原理
1、原假设怎样设定;(相等,不相等,差异性)
2、提高,增加,降低如何选择;
3、原假设是希望收集数据推翻的,如果假设成立(当前的事情发生的概率大小,当然我们希望当前假设将原假设推翻)。如果证据无法推翻原假设,那就既证明原假设成立,也不能证明原假设不成立。


因为原假设备被拒绝,如果出错的话,只能犯弃真错误,而犯弃真错误的概率已经被规定的显著性水平所控制了。这样对统计者来说更容易控制,将错误影响降到最小。

显著性水平
显著性水平是指当原假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率。这个值是我们做假设检验之前统计者根据业务情况定好的。
显著性水平α越小,犯第I类错误的概率自然越小,一般取值:0.01、0.05、0.1等。
当给定了检验的显著水平a=0.05时,进行双侧检验的Z值为1.96。
当给定了检验的显著水平a=0.01时,进行双侧检验的Z值为2.58。
当给定了检验的显著水平a=0.05时,进行单侧检验的Z值为1.645。
当给定了检验的显著水平a=0.01时,进行单侧检验的Z值为2.33。

检验统计量:据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。
拒绝域: 拒绝域是由显著性水平围成的区域。
拒绝域的功能主要用来判断假设检验是否拒绝原假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝原假设,否则不拒绝原假设。给定显著性水平α后,查表就可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。

假设检验步骤

提出原假设与备择假设;
从所研究总体中出抽取一个随机样本;
构造检验统计量;
根据显著性水平确定拒绝域临界值;
计算检验统计量与临界值进行比较。
两种假设检验
假设检验根据业务数据分为两种:一个总体参数的假设检验和两个总体参数的假设检验。

一个总体参数的假设检验,即只有一个总体的假设检验。

一、T 检验:
根据研究设计,t 检验有三种形式:
1.单个样本的检验:
用来比较一组数据的平均值和一个数值有无差异。例如,你选取了 5 个人,测定了他们的身高,要看这五个人的身高平均值是否高于、低于还是等于 1.70 m, 就需要用这个检验方法。
2.配对样本均数 t 检验(非独立两样本均数 t 检验)
用来看一组样本在处理前后的平均值有无差异。比如,你选取了 5 个人,分别在饭前和饭后测量了他们的体重,想检测吃饭对他们的体重有无影响,就需要用这个 t 检验。
3.两个独立样本均数 t 检验
用来看两组数据的平均值有无差异。比如,你选取了 5 男 5 女,想看男女之间身高有无差异,这样,男的一组,女的一组,这两个组之间的身高平均值的大小比较可用这种方法。
二、单个样本 t 检验
又称单样本均数 t 检验( one sample test ),适用于样本均数与已知总体均数 μ0 的比较,目的是检验样本均数所代表的总体均数是 μ 否与已知总体均数 μ0 有差别。
已知总体均数 μ0 一般为标准值、理论值或经大量观察得到的较稳定的指标值。
应用条件。总体标准 a 未知的小样
本资料,且服从正态分布


双边检验
最常见,应用于只是简单探究“是否存在差异”的研究问题。
单边检验
适用于探究“是否显著高于”或者“显著低于”的研究问题。

T检验和F检验的关系
t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的同时,也要做Levene's Test for Equality of Variances 。


T检验是用来比较两个均值之间是否有显著差异的一种检验方法。
T检验是比较两个均值差异的,不同种类T检验的差别其实在于均值的计算差异。
1.单样本T检验stats.ttest_1samp(data,u)
单样本T检验是用来检验一组样本的均值A与一个已知的均值B之间是否有差异。均值A是通过一组样本算出来的,均值B是已知的一个具体的值。
以往通过大规模调查已知某地新生儿出生体重为 3.30 kg .从该地难产儿中随机抽收35 名新生儿,平均出生体重为 3.42 kg ,标准差为 0.40 kg ,问该地难产儿出生体重是否与一般新生儿体重不同?
建立检验假设,确定检验水准
H0: μ=μ0
H1: μ≠ μ0
α=0.05
●计算检验统计量
强调自由度,自由度表示在样本中,可以自由变化的个数。
现样本中已取 35 个,已知均值,假设前 34 个人都已定下并可随机取,第 35 个就不可以随机选,为保证均值不变,第 35 个人一定是固定值的。
本例自由度 v=n-1=35-1=34,查表得得 t0.05/2=2.032。因为 t< t0.05/2. 故 P>0.05. 按 α=0.05 水准,不拒绝 H0, 差别无统计学意义,尚不能认为该地难产儿与一般新生儿平均出生体重不同。

2.双样本T检验stats.ttest_ind(data1,data2)
双样本T检验是用来检验两组样本的均值之间是否有差异。两个均值都是根据样本算出来的。
3.配对样本T检验stats.ttest_rel(data1,data2)
配对样本T检验与双样本T检验有点类似,也是用来检验两组样本的均值差异,只不过普通双样本T检验中的样本是乱序的,而配对样本T检验中的样本是一一对应的。总而言之,就是具有相同属性的数据之间进行相比,而不是混合总体进行相比。
---------
四、配对样本均数t检验:
简称配对 t 检验( paired t test ),又称非独立两样本均数 t 检验,适用于配对设计计量资料均数的比较。
配对设计( paired design )是将受试对象按某些特征相近的原则配成对子,每对中的两个个体随机地给予两种处理
配对样本均数 t 检验原理:关注的是差异值。
配对设计的资料具有对子内数据一 一 对应的特征,研究者应关心是对子的效应差值而不是各自的效应值。
进行配对 t 检验时,首选应计算各对数据间的差值 d,将 d 作为变量计算均数。
配对样本 t 检验的基本原理是假设两种处理的效应相同,理论上差值 d 的总体均数 μd 为 0, 现有的不等于 0 差值样本均数可以来自 μd= 0 的总体,也可以来 ud≠0 的总体。
可将该检验理解为差值样本均数与已知总体均数 pd (μd = 0) 比较的单样本检验,其检验统计量为:

P(AB)与P(A∩B)有什么区别
如果有两个圆,有一部分相交。那P(AB)就是A与B的总数减相交部分的值,而P(A∩B)求的就是相交部分的值。
P(AB)表示P(A∩B)AB同时发生的概率
P(A∪B)表示AB至少有一个发生的概率


1.基于偏度和峰度的假设检验
基于偏度-峰度的检验是利用了正态分布偏度(3阶矩)和峰度(4阶矩)都为0的特点。
如果样本数据能满足偏度和峰度均为0的假设,则可以认为总体服从正态分布。
由于该检验是基于偏度检验和峰度检验的,样本数量需要8个以上。

以下normaltest函数就使用该原理进行正态分布检验。
scipy.stats.normaltest(X)
该函数输出两个结果,第一个为检验统计量,第二个为p值。如果p值大于0.05(常用显著水平)即可认定总体服从正态分布。

使用偏度和峰度拟合优度检验的还有Jarque–Bera检验法。
S为偏度,K为峰度,n为样本数或自由度
同样,Jarque–Bera检验样本数量也需要8个以上。其使用方法如下:
scipy.stats.self_JBtest(X)
该函数输出两个结果,第一个为检验统计量,第二个为p值。如果p值大于0.05(常用显著水平)即可认定总体服从正态分布。

K-S检验原理
KS检验与其他方法不同是KS检验不需要知道数据的分布情况,是一种非参数检验方法,理论上可以检验任何一种分布情况(不限于正态分布检验)。当然付出的代价就是灵敏度没有专门针对某种分布的检验方法高(比如上面的normaltest)。另外,由于大多数KS检验软件在实现是都用大样本近似公式,因此KS算法更适合大样本(300以上)检验。
以下方法就是使用KS检验进行正态分布检验:
kstest(X,"norm")

f检验
T检验和F检验的由来:为了确定从样本中的统计结果推论到总体时所犯错的概率。
F检验又叫做联合假设检验,也称方差比率检验、方差齐性检验。是由英国统计学家Fisher提出。
通过比较两组数据的方差,以确定他们的精密度是否有显著性差异。

 t检验
T检验,也称student t检验,主要用户样本含量较小,总体标准差未知的正态分布。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
t检验分为单总体检验和双总体检验。
单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。
当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。

卡方检验
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

假设检验/T检验/F检验/Z检验/卡方检验 的相关文章

随机推荐

  • 点云数据学习总结之一:点云数据存储格式

    最近研究点云数据 找了下相关的资料 看了许多的博文 下面总结了我认为比较写的比较好的博文链接 有需要的可以看下 刚刚才研究 所以可能不全 欢迎大家补充 共同学习 同时 未避免转载的博客链接失效 所以对博客内容进行了截图 如果原博主觉得受到侵
  • RestHighLevelClient封装使用,Java调用ES客户端 [支持ES6.x]

    前言 之前做项目的时候 需要用到Es的操作 本来想使用EsJpa的 即SpringDataElasticsearch 结果项目采用的是SpringBoot1 x版本 不得已 只要自己封装RestHighLevelClient来使用 不过网上
  • 蓝桥杯python技能升级

    只通过了百分之40 后面超时了 给没有头绪的伙计们一个思路吧 也请大佬给一个更好的解题思路 import math n m map int input split max 0 此为加的最大点 当加的次数小于0的时候 return0 if m
  • el-select下拉框只回显value不回显label的原因以及解决方法

    el select的采用的是map的key value结构 因此只显示value而不显示label的原因是 value的类型不正确 只需要在回显之前加上一行代码 将这个value转换成对应的类型即可 我这个里面需要的int类型 因此转成in
  • 集合相似度(PAT)

    题目链接 https www patest cn contests gplt L2 005 一开始用map超时了 总是有一组数据超时 当时觉得很纳闷 后来学到了 其实set也是可以开数组的 map也是 include
  • ubuntu 下安装chrome浏览器

    1 将google chrome stable current amd64软件复制移动到家目录下 2 打开终端 路径在家目录下 3 依次运行下面三条命令 sudo apt get install google chrome stable s
  • Swift的几种传值方式

    传值方式 在进行页面跳转过程中无法避免需要进行值的传递 那么值的传递可以分为正向传值和反向传值 例如在SourceViewController跳转至DestinationViewController的过程中需把前者的属性值传递给后者称为正向
  • 【系列 1】手写vue响应式原理

    手写vue响应式原理 首先我们看看原生 vue 做了什么 可见 vm 第一层与 data 内都能获取到 data 数据 并且其数值都进行了 ge
  • 王道训练营-C语言-1

    1 字符 include
  • 【热门框架】Maven中聚合,继承指的是什么?有什么作用?

    Maven中的聚合和继承是两个重要的功能 用于管理多个项目的共同部分 1 聚合 Maven中的聚合 Aggregation 指的是将多个子项目聚合成一个父项目的过程 聚合的语法如下 xml
  • 数据库初探(1)————关于InnoDB和MyISAM两种数据库存储引擎

    1 mysql中最常见的两种数据库引擎 InnoDB存储引擎 InnoDB存储引擎是Mysql的默认事务引擎 也是最重要 使用最广泛的存储引擎 它被设计用来处理大量的短期事务 短期事务大部分情况下都是可以正常提交的 很少回滚 MyISAM存
  • 【超详解】JavaWeb三大组件讲解

    文章目录 前言 一 Servlet 二 Filter 三 Listener 总结 前言 JavaWeb三大组件指的是 Servlet Filter Listener 三者提供不同的功能 然而很多人可能只用过其中一个或者两个 Servlet
  • 创建React项目

    在开发React项目前最关键的当然是项目的创建 现在的前端工程化使得前端项目的创建也变得越来越复杂 在这里介绍三种从零开始创建React项目的方式 分别是在浏览器中直接引入 使用官方脚手架create react app 使用Webpack
  • 不会盗QQ,还当什么程序员?

    上面这个段子估计很多朋友都看过 程序员被黑过无数次 在其他人眼中 仿佛我们需要写得了木马 翻得了围墙 修得了电脑 找得到资源 但凡是跟计算机沾点边的 咱都得会才行 段子归段子 言归正传 对于咱们程序员来说 多多少少了解一些信息安全的技术知识
  • 打印HashMap的方法分享

    HashMap简介 Hash Map是哈希表基于 Map 接口的实现类 HashMap用于存储数据 允许使用null值和null键 除了非同步和允许使用 null 之外 HashMap 类与 Hashtable 大致相同 HashMap不保
  • 区块链三加一:什么是量化交易

    量化交易是指以先进的数学模型替代人为的主观判断 利用计算机技术从庞大的历史数据中海选能带来超额收益的多种 大概率 事件以制定策略 极大地减少了投资者情绪波动的影响 避免在市场极度狂热或悲观的情况下作出非理性的投资决策 量化交易 有时候也称自
  • Kali Linux Armitage生成被控端和主控端

    目录 说明 使用 Armitage生成被控端和主控端 说明 按照 Kali Linux2 网络渗透测试实践指南 第二版 第八章操作 仅供学习讨论使用 请勿进行非法操作 使用 Armitage生成被控端和主控端 选中 payload 然后选择
  • 深入解析锂电池保护电路工作原理

    1 锂离子电池介绍 锂离子电池是一种二次电池 充电电池 它主要依靠锂离子在正极和负极之间移动来工作 在充放电过程中 Li 在两个电极之间往返嵌入和脱嵌 充电时 Li 从正极脱嵌 经过电解质嵌入负极 负极处于富锂状态 放电时则相反 锂离子电池
  • 对象不支持“addEventListener”属性或方法 ie8 jquery

    解决方法 1 请查看你使用的jquery版本 2 jQuery 2 x 已经不支持IE9以下的IE浏览器 如果你想继续支持IE6 7 8 请使用jQuery 1 x版本 最新版本 jQuery 1 11 0 3 如果要兼容 IE 6 7 8
  • 假设检验/T检验/F检验/Z检验/卡方检验

    显著性水平 一个概率值 原假设为真时 拒绝原假设的概率 表示为 alpha 常用取值为0 01 0 05 0 10 什么是P值 p值是当原假设为真时样本观察结果及更极端结果出现的概率 如果P值很小 说明这种情况发生的概率很小 如果这种情况还