【统计学习】5分钟了解假设检验中的第一类错误和第二类错误

2023-05-16

5分钟了解假设检验中的第一类错误和第二类错误

  • 假设检验
  • 假设检验:可能性
  • Type-I 第一类错误
  • Type-II 第二类错误
  • 举个例子
  • 总结
  • 参考资料

在假设检验中,第一类错误和第二类错误是两种可能的错误类型。

  • 第一类错误(Type I Error)指的是将原假设(null hypothesis)拒绝,但实际上原假设是正确的。在统计学中,原假设通常指的是某种情况不存在或某种关系不存在。第一类错误的概率被称为显著性水平(significance level),通常用α表示。如果显著性水平为0.05,则意味着在100次独立实验中,大约有5次会出现拒绝原假设的情况,但实际上原假设是正确的。
  • 第二类错误(Type II Error)指的是将原假设接受,但实际上原假设是错误的第二类错误的概率通常用β表示,与第一类错误密切相关。当显著性水平α越小时,第一类错误概率越小,但第二类错误概率也会增加

在假设检验中,第一类错误和第二类错误是一对矛盾的错误类型。通常会根据实际情况来选择显著性水平α,以平衡第一类错误和第二类错误的概率。

下面的本文就是对统计假设检验期间发生的 Type-I和 Type-II 错误的直观而详细的解释。
第一类错误和第二类错误

假设检验

假设检验是通过观察样本数据来检验围绕总体参数的假设的领域,因为我们很少有整体的数据,所以只能从整体中进行抽样观察。这通常是通过从假设的中性状态(称为原假设、零假设、虚无假设)开始并根据观察到的样本数据证明或反驳这一点来完成的。

  • 原假设 (H0) 是假设总体数据中的现状(无关系或无差异)的中性假设。
  • H1 是 H0 的备选项,称为备择假设也被称为对立假设。

**假设检验的基本思想是概率性质的反证法。**根据所考察问题的要求提出原假设和备择假设,为了检验原假设是否正确,先假定原假设是正确的情况下,构造一个小概率事件,然后根据抽取的样本去检验这个小概率事件是否发生

假设检验过程如下:假设 H0 → 观察样本数据 → 拒绝或不拒绝 H0

我们假设中性H0为真,并在观察到的数据中寻找“拒绝”或“不拒绝”H0 的证据。根据观察到的样本数据,我们计算观察到的统计量和观察到的 P 值;例如:从我们观察到的样本中获得的假设 H0 为真的概率。

然后将该观察到的 P 值与预先确定的显著性水平(或 Alpha 值)进行比较。 此 Alpha 值充当阈值,超过该阈值会认为观察到的结果具有统计显着性。基于观察到的 P 值与预先选择的阈值 alpha 值的比较,就可以就假设的 H0 得出结论:

  • 观察到的 P 值 ≤ 预选 Alpha 级别 → 拒绝 H0
  • 观察到的 P 值 > 预选的 Alpha 级别 → 不拒绝 H0

由于观察到的 P 值是一个概率,因此总是有可能对“拒绝”或“不拒绝”原假设做出错误的判断。

在下图 1 中,左侧是假设的原假设 (H0) 总体分布右侧是备择假设 (H1) 总体分布。(两者都是未知的和假设的,因为没有整体的数据,只是根据抽样的样本判断)。观察到的样本将位于这些分布的某个位置,基于此我们将得出关于我们的零假设 (H0) 的结论。
零假设分布与备择假设分布
图1 :零假设(H0)分布和备选假设(H1)分布

如果分布没有重叠,我们将永远不会在结论中观察到错误。 但是在实际情况中,它们几乎总是重叠的。Type-I 和 Type-II 错误发生在这两个分布重叠的地方。

需要说明的是:对于原假设, 我们可以根据在数据中观察到的证据“拒绝它”,也可以“不拒绝它”,因为观察到的数据没有带来足够的重要证据

假设检验:可能性

实际上,H0 只有两个选项——它可以是 TrueFalse。同样,根据观察到的数据,我们只能得出两个可能的结论——我们可以拒绝 H0 或不拒绝 H0。其实这就变成了一个二分类的问题,H0是正确的还是错误的

  • (1)H0 是真,但是拒绝 H0
  • (2)H0 是真,不拒绝 H0
  • (3)H0 是假,拒绝 H0
  • (4)H0 是假,不拒绝 H0

(2)和(3),我们正在根据观察到的数据做出正确的结论。(1)和 (4),我们得出了错误的结论,因为观察到的数据发现与现实背道而驰。在场景 (1) 和 (4) 中,就是本文要解释的 Type-I 和 Type-II 错误。

如果对统计学不了解,但是知道一些机器学习的理论的话,可以使用下面的类比方法:上面的1-4其实就是我们一直说的混淆矩阵,2,3是分类正确的值,即 TP 和 TN,1,4则是FP和FN。

Type-I 第一类错误

Type-I错误是指当原假设实际上为真时拒绝原假设的场景。根据我们观察到的数据得出结论是观察到的结果在现实中具有统计意,但是我们认为它是无意义的。

如上所述,“拒绝”或“不拒绝”零假设取决于观察到的 P 值和预先确定的 alpha 值。所以在某些情况下,真实的原假设将被拒绝,因为观察到的 P 值将小于预先选择的 Alpha 水平。这就是Type-I错误的内容False-Positive

对于Type-I错误场景:

  • 真实情况H0 对总体为真
  • 观察结论拒绝H0

对于对总体正确的原假设,如果我们反复采样,可以得到原假设分布曲线,显示所有可能观察到的样本结果的概率。(下图2左侧H0分布)

当我们观察一个样本时,我们拒绝 H0,这意味着这个观察到的样本必须位于 H0 分布曲线的最右侧,与 H1 分布曲线重叠。下图 2 表示这种情况:
Type-I错误的概率
图2:Type-I错误的概率

Type-I错误的区域,称为临界区域,表示在零假设分布曲线的右尾端。这是由我们预先选择的 Alpha 值决定的。

如果我们观察到的结果落在这个区域,我们将拒绝零假设(对于这些场景,观察到的 p 值<Alpha)。由于 H0 在现实中是正确的,我们会得出False-Positive结论。

Type-II 第二类错误

Type-II错误是指当原假设实际上是错误的时不拒绝它的场景。根据我们观察到的数据得出的结论是,观察到的结果在实际上并不具有统计学意义,但是我们认为它是有意义的。 Type-II错误:False-Negative

这可能由于缺乏证据而发生,即我们的研究可能没有足够的统计能力来检测一定的效应大小。犯Type-II错误的概率用 Beta 表示。统计研究的功效(Power )定义为,Power = 1 - Beta。所以可以通过确保的研究具有较高的统计功效来减少犯Type-II错误的机会。

对于 Type-II 错误:

  • H0 对总体为假
  • 观察结论不拒绝H0

对于对总体错误的零假设,如果我们反复从总体中抽取样本,我们将得到一条备择假设分布曲线,显示所有可能观察到的样本结果的概率。(下图3右侧H1分布)

由于我们正在观察一个样本,因此我们没有证据拒绝 H0。这意味着这个观察到的样本必须位于 H1 分布曲线的最左侧,与 H0 分布曲线重叠(请参见下面的图3 代表这种情况)
TypeII错误
图3:Type-II错误的概率

Beta 是 Type-II错误率,由左侧的阴影区域表示。 右边的剩余区域代表统计功效(Power)。

如果观察到的结果落在该区域内,将无法拒绝零假设,即使我们知道 H0 对于总体而言是错误的。所以得出一个False-Negative结论。

举个例子

在假设检验中通过将观察值与预先确定的截止值 (Alpha) 进行比较来“拒绝”或“不拒绝”假设。所以考虑以下使 Alpha 越来越低的情况:

情况1如果 Alpha变得更严格(即 Alpha 的值越小),在拒绝 H0 方面的限制就会更严格,而在不拒绝 H0 方面的限制会更小。这会导致不太可能拒绝 H0,更有可能不拒绝 H0。

  • 在真实情况中 H0 为True的情况下,拒绝 H0 的可能性较小会导致Type-I错误比以前更少。
  • 在真实情况中 H0 为 False 的情况下,更可能不拒绝 H0 将导致比以更多的 Type-II 错误。

情况2如果 Alpha 级别变得不那么严格(即更高的 Alpha 值),在拒绝 H0 方面的限制将更少,而在不拒绝 H0 方面的限制更大。这会导致更有可能拒绝 H0,不太可能不拒绝 H0。

  • 在真实情况中 H0 为True的情况下,更有可能拒绝 H0 将导致以更多的 Type-I错误。
  • 在真实情况中 H0 为 False 的情况下,不太可能不拒绝 H0 将导致Type-II错误比以前更少。

因此显然存在二者的权衡,因为2类的错误是相关的,当一个增加另一个减少时,反之亦然。

从下图 4 可以看出,如果 Alpha 增加,则 Beta 减少,如果 Beta 减少,则 Alpha 将增加。
发生Type-I和 Type-II 错误的概率
图4:发生Type-I和 Type-II 错误的概率

哪个类的错误更糟糕呢?没有简单的答案,因为都取决于被检验的假设和做出错误结论的成本评估:如果Type-I 的成本较高,则应尽量避免如果制作Type-II成本高,也应该优先考虑。

但是通常认为Type-I误会产生更多后果,因为 Type-I错误意味着违背现状(H0)的假设,并可能导致引入新的变化,现有的状况产生更坏的影响。 而 Type-II 错误意味着无法拒绝对现状 (H0) 的假设,并且可能只会导致错失机会。

总结

假设检验是数据科学中一个非常重要的概念。统计的力量使我们能够对总体做出假设,观察数据样本以使我们能够拒绝或不拒绝我们的假设并得出结论。
假设检验有两种可能的错误——Type-I错误和Type-II错误。假设检验过程:假设一个中性 H0 → 观察数据(将观察到的 P 值与预先确定的 alpha 水平进行比较)→ 拒绝或不拒绝 H0

  • Type-I错误:False-Positive
  • Type-II错误:False-Negative

Type-I 和 Type-II 错误相互影响相反。减少一个总是增加另一个,反之亦然。一般来说,Type-I 错误被认为Type-II 错误更重要。但是,也要取决于被检验的假设以及围绕我们的假设得出这些错误结论的成本。

参考资料

  1. 假设检验中的第一类错误和第二类错误
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【统计学习】5分钟了解假设检验中的第一类错误和第二类错误 的相关文章

  • 蓝牙模块基础认知

    一 模块类型 1 经典蓝牙模块 BT xff1a 泛指支持蓝牙协议4 0以下的模块 xff0c 一般用于数据量比较大的传输 经典蓝牙模块可再细分为 传统蓝牙模块和高速蓝牙模块 2 低功耗蓝牙模块 BLE xff1a 指支持蓝牙协议 4 0
  • Ubuntu下 Rust 交叉编译 Windows程序

    Ubuntu下 Rust 交叉编译 Windows程序 系统版本信息安装添加工具链执行交叉编译 系统版本信息 前提 xff1a 已根据Rust官网安装配置好Rust 当前系统信息如下 Ubuntu 22 04 LTS x64rustup 1
  • golang中日期操作,日期格式化,日期转换

    golang中并没有像java一样提供类似yyyy MM dd HH mm ss格式的操作 xff0c 而是将其定义为golang的诞生时间 xff1a 2006 01 02 15 04 05 0700 MST 注意这在golang的日期格
  • windows11连接无线网后分享热点连接不上

    一直很喜欢用电脑连接无线网再开热点的方式 xff0c 一个是学校热点一次只能连接两个设备 xff0c 另一个是感觉电脑发出的无线信号比较稳定 但是最近用电脑开热点发现虽然手机能连上 xff0c 但是显示无网络连接 xff0c 就是打不开网页
  • C语言实现——顺序栈(top开始为0,也就是top指针指向下一个我们能够插入的地方)

    span class token macro property span class token directive hash span span class token directive keyword define span span
  • Linux查询服务器保修信息

    dmidecode grep 34 System Information 34 A9 egrep 34 Manufacturer Product Serial 34
  • ubuntu20.04下配置深度学习环境GPU

    卸载子系统 C Users thzn gt wsl list 适用于 Linux 的 Windows 子系统分发版 docker desktop 默认 docker desktop data Ubuntu 18 04 Ubuntu 22 0
  • SpringSecurity登陆接口

    接下我们需要自定义登陆接口 xff0c 然后让SpringSecurity对这个接口放行 让用户访问这个接口的时候不用登录也能访问 在接口中我们通过AuthenticationManager的authenticate方法来进行用户认证 所以
  • 【ubuntu20】filezilla连接主机和ubuntu20

    1 普通用户登录 sudo apt update sudo apt install openssh server 安装ssh br sudo systemctl status ssh 确认是否运行 br sudo ufw allow ssh
  • CentOS7+Nginx+阿贝云服务器使用心得

    最近有一个项目需要使用云服务器展示demo xff0c 由于是临时使用就想找一个免费的云服务器 由于以前在阿里云 腾讯云 华为云 百度云 亚马逊云都用过免费版 xff0c 这次就在网上搜了一下其它的免费云 正好就找到了阿贝云 https w
  • WSL2运行sudo gnome-session没反应

    必须注意当前用户 xff0c 不一定是在root下创建的gnome session xff0c 以我为例 xff0c 我当时是在leo用户下安装的gnome session xff0c 但之后一直都是以root用户登录 xff0c 所以运行
  • n个人围成一圈,第一个开始报数(1-3),凡报数3退出。问最后留下的人是原来第几号?

    include lt stdio h gt int main int i 61 0 j 61 0 k 61 0 n x int a 100 printf 34 please input a nu 34 scanf 34 d 34 amp n
  • 使用sea-orm执行migrate

    源码github地址 seaormdemo 一 下载工具链 sea orm cli 是sea orm 提供的工具链 xff0c 可通过cargo下载 cargo span class token function install span
  • PVE安装更新源错误

    pve系统ping 网络不通且不能进行apt install 描述 root 64 xuyuquan span class token comment apt get update span Err 1 http ftp debian or
  • failed to run command ‘java’: No such file or directory

    failed to run command java No such file or directory 程序里远程执行shell命令 xff08 nohup java jar xff09 的执行 xff0c 后台日志报错如下 xff1a
  • vue3中的setup函数

    原文 xff1a vue3中的setup函数 落雪小轩韩的博客 CSDN博客 vue3setup 一 概念 xff1a setup是vue3中的一个新的配置项 xff0c 值为一个函数 xff0c 我们在组件中用到的数据 方法等等 xff0
  • vue同步请求

    原文地址 xff1a vue 同步请求 Aa duidui的博客 CSDN博客 vue同步请求 同步请求执行的顺序 async await 挂上的才是同步 没挂上的还是异步 async 方法名 await 请求方法 参数 then res
  • Anaconda上设置虚拟环境,并在jupyter notebook中切换。

    个人记录 xff0c 但欢迎阅读和赐教 我之前在Anaconda Navigator中建立虚拟环境 xff0c 然后在jupyter notebook的terminal中增加对应环境的ipykernel xff0c 这样可行 xff0c 但
  • 字符,字节和编码

    级别 xff1a 初级 摘要 xff1a 本文介绍了字符与编码的发展过程 xff0c 相关概念的正确理解 举例说明了一些实际应用中 xff0c 编码的实现方法 然后 xff0c 本文讲述了通常对字符与编码的几种误解 xff0c 由于这些误解
  • http协议原理

    HTTP工作原理 HTTP协议定义Web客户端如何从Web服务器请求Web页面 xff0c 以及服务器如何把Web页面传送给客户端 HTTP协议采用了请求 响应模型 客户端向服务器发送一个请求报文 xff0c 请求报文包含请求的方法 URL

随机推荐

  • TLS协议/SSL协议

    历史背景 SSL Secure Socket Layer 安全套接层 是基于HTTPS下的一个协议加密层 xff0c 最初是由网景公司 xff08 Netscape xff09 研发 xff0c 后被IETF xff08 The Inter
  • TCP协议

    TCP 基础 https www jianshu com p ef892323e68f TCP 使用固定的连接 TCP 用于应用程序之间的通信 当应用程序希望通过 TCP 与另一个应用程序通信时 xff0c 它会发送一个通信请求 这个请求必
  • UDP协议

    UDP 概述 xff08 User Datagram Protocol xff0c 用户数据报协议 xff09 用户数据报协议 UDP 只在 IP 的数据报服务之上增加了很少一点的功能 xff0c 这就是复用和分用的功能以及查错检测的功能
  • TCP和UDP的区别

    TCP协议与UDP协议的区别 首先咱们弄清楚 xff0c TCP协议和UDP协议与TCP IP协议的联系 xff0c 很多人犯糊涂了 xff0c 一直都是说TCP协议与UDP协议的区别 xff0c 我觉得这是没有从本质上弄清楚网络通信 xf
  • 网络协议概述

    互联网协议介绍 互联网的核心是一系列协议 xff0c 总称为 互联网协议 xff08 Internet Protocol Suite xff09 xff0c 正是这一些协议规定了电脑如何连接和组网 我们理解了这些协议 xff0c 就理解了互
  • go 编写tcp和udp服务端和客户端

    TCP协议 TCP IP Transmission Control Protocol Internet Protocol 即传输控制协议 网间协议 xff0c 是一种面向连接 xff08 连接导向 xff09 的 可靠的 基于字节流的传输层
  • tcp黏包问题

    服务端代码如下 xff1a span class token keyword package span main span class token keyword import span span class token punctuati
  • go sync.Pool 深入

    new函数的调用时机和pool的内存释放规则 以下代码调用了四次Get函数 xff0c 但是并不是每次都会new 第一次 xff0c 是a 61 pool Get byte xff0c 首次Get xff0c 在pool的private私有
  • 【AI理论学习】深入理解扩散模型:Diffusion Models(DDPM)(理论篇)

    深入理解扩散模型 xff1a Diffusion Models 引言扩散模型的原理扩散过程反向过程优化目标 模型设计代码实现Stable Diffusion DALL E Imagen背后共同的套路Stable DiffusionDALL
  • gin 框架原理

    Gin的路由原理 Gin的路由基于Trie树和压缩字典树算法 xff0c 什么是Trie树 xff1f 其实很好理解 xff0c 看下图 xff1a 单词at xff0c bee xff0c ben xff0c bt xff0c q组成的T
  • PowerDesigner导入sql脚本

    1 依次点击File gt Reverse Engineer gt Database 2 弹出弹窗对模型进行命名 xff0c 同时在DBMS下拉选择框中需要选择自己对应的数据库类型 xff0c 点击确定 新的弹窗 xff0c 选中Using
  • Gin路由算法模拟

    概述 Gin的路由算法是采用压缩字典树实现的 xff0c 基数树 xff08 Radix Tree xff09 又称为PAT位树 xff08 Patricia Trie or crit bit tree xff09 xff0c 是一种更节省
  • 使用gomail发送邮件

    概述 为了实现一个邮件验证码功能 xff0c 特意了解了一下go如何发送邮件 本来以为会很麻烦 xff0c 没想到其实很简单 工具类 实现的工具类如下 xff1a span class token keyword package span
  • redis实现消息队列的几种方式及其优劣

    概述 常用的消息队列有 xff0c rabbitMq kafka RocketMq ActiveMq等 这些消息队列需要独立安装部署 xff0c 作为一个中间件来提供服务 xff0c 虽然有着高性能 高可靠的优点 xff0c 但是额外部署这
  • linux系统或者windows WSL安装redis最新版本

    概述 因为windows的最新版本redis已经在16年就停止更新了 xff0c 目前最新的版本只到redis3 xff0c 很多redis新增的特性都无法使用 例如redis5的stream xff0c windows版本就没有 这篇文章
  • 在面对一些亿级流量场景,消息队列届的排头兵kafka是如何保证高性能的呢?

    在面对一些亿级流量场景 xff0c 消息队列届的大哥kafka是如何保证高性能的呢 xff1f Kafka Reactor模型架构 Kafka客户端和服务端通信采取的是NIO的reactor模式 xff0c 它是一种事件驱动模式 react
  • Redis是如何实现高性能的?

    Redis作为应对高并发场景的利器 xff0c 它是如何实现高性能的呢 xff1f IO多路复用 传统对于并发情况 xff0c 假如一个进程不行 xff0c 那搞多个进程不就可以同时处理多个客户端连接了么 xff1f 多进程是可以解决一些并
  • go更新最新版本

    最近go1 18出了泛型 xff0c 趁着周末有时间 xff0c 赶不及要尝尝鲜呢 那如何更新我本地go到最新版本到1 18呢 1 下载安装包 https go dev dl 2 执行安装 点击打开安装程序 xff0c 点击next 选择卸
  • idea、goland泛型语法报错解决|go1.18泛型初体验

    go在1 18正式推出了泛型 xff0c 你是否和博主一样好奇其语法呢 xff1f 快啊来看看吧 1 版本更新 amp 插件更新 go如何更新到最新版本 xff0c 可以查看https www hengyumo cn momoblog de
  • 【统计学习】5分钟了解假设检验中的第一类错误和第二类错误

    5分钟了解假设检验中的第一类错误和第二类错误 假设检验假设检验 xff1a 可能性Type I 第一类错误Type II 第二类错误举个例子总结参考资料 在假设检验中 xff0c 第一类错误和第二类错误是两种可能的错误类型 第一类错误 xf