机器学习中概率论知识复习

2023-11-03

机器学习先验知识概率论部分,发现看Machine Learning(-Andrew Ng)课程的时候中间有推导过程不是很明白,遂针对性复习。

知识内容组织结构,参考:《Probability Theory Review for Machine Learning》(Machine Learning-Andrew Ng,课程讲义复习笔记2)

内容补充,参考维基百科。

公式编辑参考:http://meta.math.stackexchange.com/questions/5020/mathjax-basic-tutorial-and-quick-reference


1 基本概念

概率论在机器学习中扮演着一个核心角色,因为机器学习算法的设计通常依赖于对数据的概率假设。

1.1 概率空间

说到概率,通常是指一个具有不确定性的event发生的可能性。例如,下周二下雨的概率。因此,为了正式地讨论概率论,我们首先要明确什么是可能事件。
正规说来,一个probability space是由三元组 (Ω,F,P) 定义:
- Ω 样本空间
- F2Ω ( Ω 的幂集)为(可度量的)事件空间
- P 为将事件 EF 映射到0~1真值区间的概率度量(概率分布),可以将 P 看作概率函数
注: Ω 的幂集 2Ω ——是 Ω 的所有子集的集合,符号: P(Ω):={ U|UΩ} |Ω|=n 个元素, |P(Ω)|=2n 个元素。

假设给定样本空间 Ω ,则对于事件空间 F 来说:
- F 包含 Ω 本身和
- F 对于并集闭合,例如:如果 α,βF ,则 αβF
- F 对于补集闭合,例如:如果 αF ,则 (Ωα)F

Example1: 假如我们投掷一个(6面)骰子,那么可能的样本空间 Ω={ 1,2,3,4,5,6} 。我们可能感兴趣的事件是骰子点数是奇数还是偶数,那么这种情况下事件空间就是 F={ ,{ 1,3,5},{ 2,4,6}} .

可以看到样本空间 Ω 为有限集时,就像上一个例子,我们通常令事件空间 F 2Ω 。这种策略并不完全通用,但是在实际使用中通常是有效的。然而,当样本空间为无限集时,我们需要仔细定义事件空间。
给定一个事件空间 F ,概率函数 P 需要满足几个公理:
- (非负)对于所有 αF,P(α)0
- P(F)=1 ,事件空间的概率值为1
- (互斥事件的加法法则)对于所有 α,βFαβ=,P(αβ)=P(α)+P(β)

Example2: 回到掷骰子的例子,假设事件空间 F 2Ω ,进一步地,定义 F 上的概率函数 P 为:
P({ 1})=P({ 2})==P({ 6})=16
那么这种概率分布 P 可以完整定义任意给出事件的发生概率(通过可加性公理)。例如,投掷点数为偶数的概率为:
P({2,4,6})=P({2})+P({4})+P({6})=16+16+16=12
因为任意事件(此处指样本空间内的投掷出各点数)之间都没有交集

1.2 随机变量

随机变量在概率论中扮演着一个重要角色。最重要的一个事实是,随机变量并不是变量,它们实际上是将(样本空间中的)结果映射到真值的函数。我们通常用一个大写字母来表示随机变量。
Example3: 还是以掷骰子为例。 另 X 为取决于投掷结果的随机变量。 X 的一个自然选择是将 i 映射到值 i ,例如,将事件“投掷1点”映射到值1。我们也可以选择一些特别的映射,例如,我们有一个随机变量 Y ——将所有的结果映射到0,这就是一个很无聊的函数。或者随机变量 Z ——当 i 为奇数时,将结果 i 映射到 2i ;当 i 为偶数时,将结果 i 映射到 i

从某种意义上说,随机变量让我们可以将事件空间的形式概念抽象出来,通过定义随机变量来采集相关事件。举个例子,考虑Example1中投掷点数为奇/偶的事件空间。我们其实可以定义一个随机变量,当结果 i 为奇数时取值为1,否则随机变量取值为0。这种二元算计变量在实际中非常常见,通常以指示变量为人所知,它是因用于指示某一特定事件是否发生而得名。所以为什么我们要引进事件空间?就是因为当一个人在学习概率论(更严格来说)通过计量理论来学习时,样本空间和事件空间的区别非常重要。这个话题对于这个简短的复习来说太前沿了,因此不会涉及。不管怎样,最好记住事件空间并不总是简单的样本空间的幂集。
继续,我们后面主要会讨论关于随机变量的概率。虽然某些概率概念在不使用随机变量的情况下也能准确定义,但是随机变量让我们能提供一种对于概率论的更加统一的处理方式。取值为 a 的随机变量 X 的概率可以记为:

P(X=a)PX(a)

同时,我们将随机变量 X 的取值范围记为: Val(X)

1.3 概率分布,联合分布,边缘分布

我们经常会谈论变量的分布。正式来说,它是指一个随机变量取某一特定值的概率,例如:
Example4:假设在投掷一个骰子的样本空间 Ω 上定义一个随机变量 X ,如果骰子是均匀的,则 X 的分布为:
PX(1)=PX(2)==PX(6)=16
注意,尽管这个例子和Example2类似,但是它们有着不同的语义。Example2中定义的概率分布是对于事件而言,而这个例子中是随机变量的概率分布。
我们用 P(X) 来表示随机变量 X 的概率分布。
有时候,我们会同时讨论大于一个变量的概率分布,这种概率分布称为联合分布,因为此事的概率是由所涉及到的所有变量共同决定的。这个可以用一个例子来阐明。
Example5:在投掷一个骰子的样本空间上定义一个随机变量 X 。定义一个指示变量 Y ,当抛硬币结果为正面朝上时取1,反面朝上时取0。假设骰子和硬币都是均匀的,则 X Y 的联合分布如下:

P X=1 X=2 X=3 X=4 X
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习中概率论知识复习 的相关文章

  • python---的各种算法

    今天来聊聊python中的算法 比如AES DES RSA 1 MD5加密 md5是一个大的hash算法 它不存在解密的逻辑 市面上所为的解密是通过撞库来实现的 我们可以简单的理解为生活中的防伪码 1 不加salt 简单理解为密钥 from
  • 【语义分割】综述——一文搞定语义分割

    本文记录了博主阅读的关于语义分割 Semantic Segmentation 的综述类文章的笔记 更新于2019 02 19 语义分割 综述 一文搞定语义分割 参考文献网址 An overview of semantic image seg
  • 如何是matlab中的折线图变得更加的光滑?

    原来的代码如下 y2 Convergence2 m figure Name y2 Position 200 200 500 500 plot y2 title E2 xlabel Iteration ylabel Objective Fun
  • 网上学自动化测试靠谱吗 自己亲自试听一下去感受下就知道了

    众所周知 目前我国软件测试每年都要新增大量岗位 但学校还没有开展软件测试相关的课程 而企业培养的人才远远不足需求 因此自学和培训就成为目前主流的从事软件测试的两个最有效的途径 但相对自学来说 参与培训能够在较短时间内学到软件测试的相关知识
  • Claude2 AI实战:重新认识我们自己

    交流源于内心本真的需要 通过交流来降低信息的不对称 今天的交流对象是一个集大成者的老学者 当然是由 Claude2 扮演 相信会有不一样的收获 角色设定 你是一名集大成者的年迈学者 在哲学 社会学 历史 心理学等方面都有很高的造诣 现在我们
  • 【华为OD机试真题 Python】加扰字符串

    前言 本专栏将持续更新华为OD机试题目 并进行详细的分析与解答 包含完整的代码实现 希望可以帮助到正在努力的你 关于OD机试流程 面经 面试指导等 如有任何疑问 欢迎联系我 wechat steven moda email nansun09
  • 到底什么是Cortex、ARMv8、arm架构、ARM指令集、soc?一文帮你梳理基础概念【科普】

    更多信息请关注公众号 一口Linux 一 到底什么是Cortex ARMv8 arm架构 ARM指令集 soc 有粉丝问我到底什么是ARM 搞不清楚Cortex arm内核 arm架构 ARM指令集 soc这些概念都是什么关系 下面一口君给
  • xxljob 定时任务执行 报:job handler not found

    用xxljob做一个定时任务调度 执行以后出现执行失败 提示的找不到执行器 一般情况下是因为管理中心的JobHandler名称与代码中定义的不匹配 或者与pom文件引入的xxljob 版本不匹配 先检查一下这两个地方 在定时任务代码的入口文
  • 钩子函数(HOOK)完整的教程

    基本概念 钩子 Hook 是Windows消息处理机制的一个平台 应用程序可以在上面设置子程以监视指定窗口的某种消息 而且所监视的窗口可以是其他进程所创建的 当消息到达后 在目标窗口处理函数之前处理它 钩子机制允许应用程序截获处理windo
  • MySQL-分库分表详解(七)

    作者 小刘在C站 个人主页 小刘主页 努力不一定有回报 但一定会有收获加油 一起努力 共赴美好人生 学习两年总结出的运维经验 以及思科模拟器全套网络实验教程 专栏 云计算技术 小刘私信可以随便问 只要会绝不吝啬 感谢CSDN让你我相遇 前言
  • ClickHouse的WITH-ALIAS是如何实现的

    ClickHouse的WITH ALIAS是如何实现的 WITH ALIAS包含相似但不同的两个特性 WITH lt 表达式 gt as lt 别名 gt WITH lt 别名 gt as lt 子查询 gt WITH lt 表达式 gt
  • centos安装apt-get

    apt get众所周知是ubantu的安装工具 经常被类比于centos的yum 不过有的时候经常遇到安装文档出现apt get安装 这个时候并不是替换成yum都能成功的 有的源yum是没有的 这个时候就很头疼 搜了一圈都是大同小异的 都是

随机推荐

  • c语言中 %d与%2d与%02d的区别在哪里

    在c语言中 1 d代表直接输出整数a 例如 int main int a 1 printf d n a 输出结果为1 return 0 2 2d代表如果我们输出的数字位数为2 例如 int main int a 1 printf 2d a
  • LaserScan数据转PointCloud2

    通过stage ros中rosbag record a记录的数据 里面的坐标系分别是odom gt gt base foot print gt gt base link gt gt base laser link 通过 rosrun tf
  • DBeaver设置背景色

    如图 设置sql编辑器背景色 方法 点击 窗口 gt 首选项 选择背景色 设置自定义颜色 最后应用并关闭
  • debounce与throttle实现与原理

    前言 前端时间在面试中 面试官让我写一个关于input输入框 并且实时搜索的问题 我就当然用keyup事件来写 写完面试官还是挺满意的 又问我一个问题 如何减少每次输入频繁请求的性能开销 这个我就犯难了 事后 我百度了下 查到了thrott
  • JS面试题整理

    1 JS的数据类型有哪些 它们是如何存储的 JavaScript一共有八种数据类型 其中分为基本数据类型和引用数据类型 基础数据类型 String Number Boolean Undefined Null Symbol ES6新增的数据类
  • 使用java读取execel

    需要下载jxl jar 去官网下载 代码如下 import java io import java util Scanner author Administrator version 1 0 Date 2011 06 07 java练习 p
  • ModelMatrix、ModelViewMatrix、ProjectionMatrix、NormalMatrix模型矩阵、模型视图矩阵、投影矩阵、正规矩阵详解

    ModelMatrix ModelViewMatrix ProjectionMatrix ModelMatrix模型矩阵 模型视图矩阵 投影矩阵 正规矩阵详解 1 前言 在openGL经常用到ModelMatrix ModelViewMat
  • 游戏盾可以防止DD和CC吗

    游戏盾是针对游戏行业专门研发的一款防DD和CC的产品 在市场上游戏盾不同与传统的单点抗D 它是由一个乃至多个高防节点池组成 每个节点池里面都是包含有成百上千个节点存在的 并且采用自主大数据和Anycast算法来实现智能调度 轻松将正常玩家和
  • 服务器 ping 不通有哪些原因导致的

    服务器 ping 不通有哪些原因导致的 太心急 即网线刚插到交换机上就想 Ping 通网关 忽略了生成树的收敛时间 当然 较新的交换机都支持快速生成树 或者有的管理员干脆把用户端口 access port 的生成树协议关掉 问题就解决了 某
  • 通过Git使用GitHub

    目录 一 建立个人仓库 二 配置SSH密钥 三 克隆仓库代码 四 推送代码到个人仓库 五 代码拉取 一 建立个人仓库 1 建立GitHub个人仓库 首先注册GitHub用户 注册好了之后 打开用户的界面 然后就是配置问题 配置好后拉到最下方
  • docker网络--多机通信--4--ingress笔记

    docker网络 多机通信 4 ingress 一 介绍 二 ingress网络 1 啥 2 增 3 删 4 改 5 查 三 ingress实验 1 说明 2 整体拓扑图 3 实验步骤 1 预置条件 2 步骤 4 原理说明 四 外部负载均衡
  • spring-bean的生命周期和怎么配置spring-bean的后置处理器

    前言 本章是spring基于XML 配置bean系类中第6篇讲解spring bean的生命周期和怎么配置spring bean的后置处理器 个人主页 尘觉主页 个人简介 大家好 我是尘觉 希望我的文章可以帮助到大家 您的满意是我的动力 在
  • 计算PI值到一亿位的算法 (转)

    计算PI值到一亿位的算法 转 more 我大体上考虑了一下用Delphi计算PI值到一亿位的算法 得到一个大体的算法 也好用来交流一下 这是一个构造一种新的长四则运算的算法 所谓长四则运算 是指用数据库的字段来作一个小数 用一个记录来作一个
  • 基于python的毕业设计仓库库存管理系统

    更多项目资源 最下方联系我们 目录 Python项目介绍 资料获取 Python项目介绍 计算机毕业设计python毕设项目之python仓库库存管理系统 IT实战课堂 哔哩哔哩 bilibili计算机毕业设计python毕设项目之pyth
  • 微信浏览器清理缓存的方法

    项目场景 项目包含电脑浏览器和手机的微信公众号两个部分 现在需要在微信端对项目进行测试 问题描述 在微信端打开项目的网页 发现某些部分的功能不如预期 退出微信并在服务器端进行修改 修改完成再次打开该网页 跟修改前的表现一样没有任何变化 原因
  • 企业u盘系统服务器,服务器u盘装系统

    服务器u盘装系统 内容精选 换一换 如果Linux操作系统云服务器未安装密码重置插件 可以参见本节内容重新设置密码 本节操作重置的是root用户的密码 您可以重置完root密码后登录云服务器后再更换秘钥或重置非root用户的密码 Windo
  • Group conv vs. Depthwise separable conv

    本王有话说 这俩属于是做轻量化绕不开的经典工作 盘踞武林好多年 我们的目标学会并企图超越它 分组卷积 Group conv paper 原理 分组卷积 即ResNeXt的亮点 受Inception和AlexNet的启发产生 Inceptio
  • 通过css样式定义span标签实现文本输入框功能

    span style width 200px height 24px line height 24px font size 14px padding 5px 8px border 1px solid ddd 我是文本输入框 span
  • TensorFlow学习过程记录 -- 问题解决

    在运行过程中 输出总是会产生两行警告信息 WARNING tensorflow From D python35 lib site packages tensorflow python util tf should use py 118 in
  • 机器学习中概率论知识复习

    机器学习先验知识概率论部分 发现看Machine Learning Andrew Ng 课程的时候中间有推导过程不是很明白 遂针对性复习 知识内容组织结构 参考 Probability Theory Review for Machine L