假设检验笔记

2023-11-10

假设检验,就是做了一个假设 H,然后通过实验得到相关的统计数据判断 H 是否(大概率)成立,或者有多大把握认为 H 成立。这个 H 一般是一个与分布、统计量相关的的命题,如 H : P { 硬 币 朝 上 } < 0.2 H: P\{硬币朝上\} < 0.2 H:P{}<0.2

Intuition

直觉上,假定 H 正确,会使某个事件 A 变成小概率事件,即 P ( A ∣ H ) P(A|H) P(AH) 很小,那么在 H 的条件下,A 几乎不可能发生,如 H : P { 硬 币 朝 上 } < 0.2 H: P\{硬币朝上\} < 0.2 H:P{}<0.2 A : 连抛100次,80次朝上 A:\text{连抛100次,80次朝上} A:连抛100次,80次朝上。但若果在检验实验中 A 居然发生了,那 H 大概率是错的,于是拒绝 H。

Example

tea
要检验此女士是否真能分辨「茶+奶」和「奶+茶」,可以进行伯努利实验:n 杯奶茶混合液给她逐杯试,如果她能至少分对 k 次,那就认为她真的能分辨。
为此可以作出假设 H 0 : 她 其 实 不 能 分 辨 , 只 是 瞎 猜 H_0:她其实不能分辨,只是瞎猜 H0:。将 H 0 H_0 H0 的对立假设记为 H 1 H_1 H1
选择这样假设是因为,这等价于对她的判断的分布作出假设:如果是瞎猜,那么她猜「茶+奶」和「奶+茶」的概率都应该是 0.5,对于每一杯她猜对的概率亦是 0.5,于是对于她猜对的总杯数 X,可以写出分布 X ∼ B ( n , 0.5 ) X\sim B(n,0.5) XB(n,0.5)
可以算出,要猜对多个的概率是很小的。即要观察的事件是 A : 分 对 至 少 k 杯 A:分对至少k杯 A:k,当 k 比较大时, P ( A ∣ H 0 ) P(A|H_0) P(AH0) 很小, A ∣ H 0 A|H_0 AH0 几乎不可能发生。
接下来就是进行实验,如果 A 发生了,就拒绝 H 0 H_0 H0、接受 H 1 H_1 H1,否则相反。

α \alpha α, P-value

这样检验有主观的成分:k 取多大,才能相信她大概率是真的能分辨(才能在 A 发生时拒绝 H 0 H_0 H0)?这可以换一种说法: P ( A ∣ H 0 ) P(A|H_0) P(AH0) 要多小(在 H 0 H_0 H0 条件下 A 要多难发生),才能在 A 真的发生时有足够的信心相信 H 0 H_0 H0 是错的?
此例中 P-value 就是 P ( A ∣ H 0 ) P(A|H_0) P(AH0)(P-value 应该是 A 和比 A 更难发生的事件概率和)。指定 k 的大小,等价于指定一个概率阈值 α \alpha α,只有当 P-value = P ( A ∣ H 0 ) ≤ α \text{P-value}=P(A|H_0)\leq\alpha P-value=P(AH0)α 时,才认为: A 发 生 ⇔ H 0 明 显 / 大 概 率 是 错 的 A 发生\Leftrightarrow H_0明显/大概率是错的 AH0/,于是在 A 发生时拒绝 H 0 H_0 H0
所有使得拒绝 H 0 H_0 H0 的 P-value 的集合叫拒绝域,此例中就是 [ 0 , α ] [0,\alpha] [0,α],即当实验测得 P-value 落在拒绝域时,就拒绝 H 0 H_0 H0 α \alpha α 常取 0.05、0.01 等小值。

Error: Type I, Type II

上帝知道 H 0 H_0 H0 实际上是真的还是假的,但人不知道,所以依据实验结果,决定要拒绝或接受 H 0 H_0 H0 时,此时做出的决策(拒绝/接受)可能是错的,错误分两类:

  • 第 I 类,弃真错误,即 H 0 H_0 H0 其实是真的(上帝视觉),但被拒绝了;
  • 第 II 类,取伪错误,即 H 0 H_0 H0 其实是错的,但被接受了。

犯第 I 类错误的概率,就是 A 发生时拒绝 H 0 H_0 H0 的概率,即 α \alpha α,又叫显著性水平 1 − α 1-\alpha 1α 称为置信度

References

  1. 统计学基础–假设检验
  2. 假设检验(Hypothesis Testing)
  3. 假设检验——这一篇文章就够了
  4. 【r<-Rmarkdown】常用数学符号的 LaTeX 表示方法
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

假设检验笔记 的相关文章

  • 《普林斯顿微积分》读书笔记

    写在前面 并不完整 只有零散的记忆 二 三刷的时候再补充吧 一些初等函数的导数 例如 x n n x n 1 sin x cos x 积分等于反导数 其他 待补充
  • 排列的生成(二) —— 序数法

    1 定义 n n n个元素的全排列有 n n n 个 如果将排列按顺序编号 并能够按照某种方法建立起每一个序号与一个排列之间的对应关系 那么就可以根据序号确定排列 反过来也可以根据排列确定它的序号 根据排列的序号生成对应排列的方法就称为序数
  • 参数估计(Parameter Estimation):频率学派(最大似然估计MLE、最大后验估计MAP)与贝叶斯学派(贝叶斯估计BPE)

    基础 频率学派与贝叶斯学派 http www douban com group topic 16719644 http www zhihu com question 20587681 最大似然估计 Maximum likelihood es
  • Lorenz系统、简单的Rossler系统和Chua电路系统的混沌吸引子——MATLAB实现

    1 Lorenz系统 美国著名气象学家E N Lorenz在1963年提出来的用来刻画热对流不稳定性的模型 即Lorenz混沌模型 可以简单描述如下 x
  • 数据结构 数学知识复习

    文章目录 指数 对数 级数 模运算 证明方法 归纳法证明 反例法证明 指数 X A X B
  • Stem-and-Leaf Plot in R

    Data set faithful 272 2 Waiting time between eruptions and the duration of the eruption for the Old Faithful geyser gt d
  • 关于suitesparse在windows平台下速度极慢以及奇奇怪怪的问题解决

    前言 好像suitesparse原本没有windows版本 然后国外一个大佬写了cmake搞出来的 所以可能存在一些奇奇怪怪的问题吧 主要是一下两点 1 windows相比linux环境速度奇慢 2 新手编译这个库经常会下载suitespa
  • 为什么样本方差里面要除以(n-1)而不是n?

    前段日子重新整理了一下这个问题的解答 跟大家分享一下 如果有什么错误的话希望大家能够提出来 我会及时改正的 话不多说进入正题 首先 我们来看一下样本方差的计算公式 刚开始接触这个公式的话可能会有一个疑问就是 为什么样本方差要除以 n 1 而
  • 《数字图像处理》学习总结及感悟:第二章数字图像基础(5)数学工具

    前往老猿Python博文目录 https blog csdn net LaoYuanPython 一 引言 本系列文章记录老猿自学冈萨雷斯 数字图像处理 的感悟和总结 不过估计更新会比较慢 白天要工作 都是晚上抽空学习 学习完一章再回头总结
  • 容斥原理——经典例题(组合数学)

    一 容斥原理 就是人们为了不重复计算重叠部分 想出的一种不重复计算的方法 先来认识一下这两个符号 与 如图 蓝色的圈就是c1c2 红色的圈围起来的就是c1c2 二 例题 组合数学 1 题目 1 1 题目描述 八是个很有趣的数字啊 八 发 八
  • diffusion models笔记

    ELBO of VDM Understanding 1 中讲 variational diffusion models VDM 的 evidence lower bound ELBO 推导时 53 式有一个容易引起误会的记号
  • 论文纠错(一)

    说说最近读的几篇论文的问题 果然有的论文还是不能细细地去读 一读就发现有问题 第一个是MSPCA里面的公式 7 到公式 8 那个Sr前面的2是不应该有的 也就是推导的时候出错了 第二个是GPUTENSOR里面的Gpu product的算法
  • 美国大学生数学建模竞赛赛题特点

    美国大学生数学建模竞赛赛题特点 赛题灵活度高 内容广泛 反恐 防灾 环境 健康医疗 交通 新能源等等 开放性大 评价类问题多且复杂 离散型优化问题多 除A题 如 2016B太空碎片的处理 2018D电动车充电桩的优化 2019D卢浮宫疏散路
  • 如何手动计算线性回归中 t 统计量的 p 值

    我对自由度为 178 的双尾 t 检验进行了线性回归 这summary函数为我的两个 t 值提供了两个 p 值 t value Pr gt t 5 06 1 04e 06 10 09 lt 2e 16 F statistic 101 8 o
  • 绘图框 p 值显着性注释

    我已经开始使用并喜欢绘制箱线图来表示我的数据 然而 我很难找到一种方法来对比这两个群体 使用Plotly时有没有办法引入数据之间的统计显着性比较 我想创建这样的图表 其中 对应于 p 值 0 05 我发现使用scipy stats ttes
  • 如何在 glmer 中获取随机效应的 p 值

    我想根据行动和国家层面的特征 使用 glmer 来分析抗议的主张何时针对国家 因此 我想获得固定效应和随机效应的 p 值 我的模型如下所示 targets lt glmer state ENV HLH HRI LAB SMO Capital
  • 在舍入为 0 之前,R 呈现的最小数字是多少?

    我正在使用 R 软件 引导 Kolmogorov Smirnov 测试 对非常大的数据集进行一些统计分析 这意味着我的 p 值都非常小 我已经 Bonferroni 纠正了我执行的大量测试 这意味着我的 alpha 值也非常小 以便拒绝原假
  • Python Kolmogorov-Smirnov 拟合优度检验中的 p 值非常低

    我有一组数据 并通过对数正态分布拟合相应的直方图 我首先计算对数正态函数的最佳参数 然后绘制直方图和对数正态函数 这给出了相当好的结果 import scipy as sp import numpy as np import matplot
  • 高中数学:不等式(初接高)

    1 二次不等式 2 分式不等式 最后的例题 是为了说明第三种情况 就是 不等号右边不为0时 要先进行移项操作 将右边化为0 这样 就转化成1 2两种情况了 3 其它复杂不等式 3 1 高次不等式 3 2 绝对值不等式 3 3 根式不等式 补
  • R Stargazer 报告系数、置信区间和精确 p 值

    我正在运行一个国家固定效应模型 进一步包括一个虚拟变量 我正在使用 Stargazer 包 但似乎无法弄清楚如何报告置信区间和确切的 p 值 如果我运行我的模型 stargazer dummy CPP title xx align TRUE

随机推荐

  • Vue2项目练手——通用后台管理项目第六节

    Vue2项目练手 通用后台管理项目 用户管理页 table表格 获取表格数据 目录列表 user js mock js index js Users vue 新增和编辑功能 Users vue 删除功能 使用的组件 Users vue 用户
  • 深度学习的优化方法

    优化方法 深度学习的优化方法 梯度下降算法 反向传播算法 BP算法 前向传播与反向传播 链式法则 反向传播算法 梯度下降优化方法 动量算法 Momentum 指数加权平均 动量梯度下降算法 AdaGrad RMSprop Adam 学习率退
  • Java 多线程联系5:模拟叫号看病

    需求说明 1 package KanBing 2 3 4 治病 5 6 7 public class CureThread implements Runnable
  • confluence安装和使用markdown编辑公式

    参考 https marketplace atlassian com apps 1211438 markdown macro for confluence hosting server tab installation https www
  • C++库大全

    基础类 1 Dinkumware C Library 参考站点 http www dinkumware com P J Plauger编写的高品质的标准库 P J Plauger博士是Dr Dobb s程序设计杰出奖的获得者 其编写的库长期
  • 自编译已集成视频播放功能CEF3.3239版本库 (官方版本编译类似)详解介绍步骤(含编译错误解决)

    工具及编译环境 VS2015 Cmake cmake官网 https cmake org CEF工程官网 https cef builds spotifycdn com index html 1 下载CEF源码 下面的源码是已经集成了播放视
  • MTK Android Driver知识大全

    转载请注明出处 http blog csdn net cbk861110 article details 40931835 一 Display 1 lcm 相关概念 1 1 MIPI接口 一共有三种接口 DBI 也做CPU或MCU接口 DP
  • Vue框架开发Electron12 - 动态改变Element-Ui默认el-Input背景样式

    Element ui是一个非常好的UI设计模块 它提供给我们很多好看的按钮样式 非常适用于快速搭建UI 下面说说如果使用了element ui之后 要更改它默认的el Input样式应该怎么操作 使用调试工具找出他的样式默认表 具体操作如下
  • 爬虫 第三讲 数据解析

    文章目录 爬虫 第三讲 数据解析 一 正则表达式 1 match 函数 search 函数 findall 函数 2 正则表达式中的元字符 3 正则表达式模式 4 正则表达式重复匹配 5 正则表达式中的位置匹配 6 正则表达式中的贪婪与非贪
  • 【Flink】Flink exitCode=239

    1 场景1 1 1 概述 checkpoint 设置3分钟 也失败 我申请的 资源是 yqu realtime yjm 1024 ytm 2048 ys 2
  • ChatGPT和百度文心一言写用例,谁更强?

    文心一言发布的第一时间 就排队申请了邀请码 昨晚看了下 邀请码已经到手 索性就拿一个例子试了一下 看看哪个能够真正意义上的提高生产力 最简单的录制了个GIF动画如下 问题 你是一个软件测试工程师 得到一个需求 软件程序Helios会自动采集
  • shell:遍历目录和子目录的所有文件

    bin bash function getdir for element in ls 1 do dir or file 1 element if d dir or file then getdir dir or file else echo
  • AcWing 861. 二分图的最大匹配

    https www acwing com problem content 863 二分图我不太清楚 我刚做了染色法解决二分图 然后我看了相关资料 https blog csdn net u011815404 article details
  • [4G&5G专题-122]:认证-华为认证概述

    1 链接 https e huawei com cn talent cert navType authNavKey 2 华为认证概述 3 认证等级 HCIA 工程师等级 HCIP 高级工程师等级 HCIE 专家级 4 学习培训 4 1 概述
  • JavaScript中结果转换为带有“千位分隔符”的数字

    在开发有关金额方面需求的时候 我们往往都需要对金额的显示进行一些处理 例如 将金额转换为带有 千位分隔符 的数字 像我们银行卡里的余额 购买商品时的总金额 就会有这一方面的需求 那么到底要怎么样去转换呢 这就需要用到 JavaScript
  • Hexo+Butterfly主题博客添加音乐播放器的简单版教程

    博客添加背景音乐 前言 基于Hexo框架 主题为Butterfly的个人博客 效果图 实现个人博客拥有全局吸底音乐播放器 即背景音乐 实现步骤 添加音乐播放器插件 可选择在vscode webstorm终端运行 一定要在博客项目文件中运行
  • IntelliJ IDEA 的 Spring 项目如何查看 @Value 的配置和值

    当你打开项目或者项目中的文件的时候 如果你有 Spring 的 Value 的配置 Intellij 将会自动将参数替换为值 如果你单击上面的值 那么这个配置参数将会显示为配置的参数名 如果你还想显示值的话 你需要重新打开这个文件或者项目
  • C++ 基础(数组)

    数组 是同一类型的多个元素的集合 声明了一个名为 a 的具有10个整数的数组 数组中的第一个元素 索引为0 设置为50 int a 10 a 0 50 数组初始化语法 int fib 5 0 1 1 2 3 或者使用循环 int array
  • Seaborn5分钟入门(六)——heatmap热力图

    微信公众号 Python读财 如有问题或建议 请公众号留言 Seaborn是基于matplotlib的Python可视化库 它提供了一个高级界面来绘制有吸引力的统计图形 Seaborn其实是在matplotlib的基础上进行了更高级的API
  • 假设检验笔记

    假设检验 就是做了一个假设 H 然后通过实验得到相关的统计数据判断 H 是否 大概率 成立 或者有多大把握认为 H 成立 这个 H 一般是一个与分布 统计量相关的的命题 如 H P 硬 币 朝