Laplace Smoothing

2023-11-12

拉普拉斯平滑(Laplace Smoothing)

拉普拉斯平滑（Laplace Smoothing）又称为加 1 平滑，是比较常用的平滑方法。平滑方法的存在时为了解决零概率问题。

一、为什么要做平滑？

零概率问题：在计算事件的概率时，如果某个事件在观察样本库（训练集）中没有出现过，会导致该事件的概率结果是 0 。这是不合理的，不能因为一个事件没有观察到，就被认为该事件一定不可能发生（即该事件的概率为 0 ）

二、理论支撑

为了解决零概率的问题，法国数学家拉普拉斯最早提出用加1的方法估计没有出现过的现象的概率，所以加法平滑也叫做拉普拉斯平滑。
假定训练样本很大时，每个分量x的计数加1造成的估计概率变化可以忽略不计，但可以方便有效的避免零概率问题。

三、公式

对于一个随机变量，它的取值范围是{1,2,3…,k}，在m次试验过后的观测结果为 { z ( 1 ) , z ( 2 ) , z ( 3 ) . . . , z ( m ) } \{z^{(1)},z^{(2)},z^{(3)}...,z^{(m)}\} {z(1),z(2),z(3)...,z(m)},极大似然按照以下公式计算： ϕ = ∑ i = 1 m I { z i = j } m (1) \phi=\frac{\sum_{i=1}^mI\{z^{i}=j\}}{m}\tag{1} ϕ=m∑i=1mI{zi=j}(1) 使用Laplace平滑后，计算公式变为： ϕ = ∑ i = 1 m I { z i = j } + 1 m + k (2) \phi=\frac{\sum_{i=1}^mI\{z^{i}=j\}+1}{m+k}\tag{2} ϕ=m+k∑i=1mI{zi=j}+1(2)

总结

拉普拉斯平滑：分子加1，分母加K，K代表类别数目

引用

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

Laplace Smoothing 的相关文章

回溯法-装载问题

子集树问题和子集树的0 1背包问题类似但是没有考虑价格 include
【Parallels Desktop】解决Sorry, This Application Cannot Be Run Under A Virtual Machine

问题描述解决步骤 Win R 或Cmd R 打开运行窗口输入regedit并点击确定打开注册表编辑器依次展开HKEY LOCAL MACHINE HARDWARE ACPI DSDT文件夹鼠标右键点击PRLS 选择重命名
Redis第二讲 Redis数据持久化AOF和RDB

RDB快照 snapshot 在默认情况下 Redis 将内存数据库快照保存在名字为 dump rdb 的二进制文件中你可以对 Redis 进行设置让它在 N 秒内数据集至少有 M 个改动这一条件被满足时自动保存一次数据集 save
【修仙境界】等级划分

文章目录一下境界 1 炼气一共13层 2 筑基分初中后期和大圆满 3 结丹分初中后期和大圆满 4 元婴分初中后期和大圆满 5 化神分初中后期和大圆满二中境界 1 炼虚分初中后期和大圆满 2 合体分初
C++ 编程出错的地方（考试选择题易错点）

一 int IsSvn int n if n 7 0 return 1 要判断这个数能不能被7整除你就只返回1吗那岂不是只返回1 没有0的情况了应该改为 int IsSvn int n if n 7 0 return 1 else r
2021年电赛模块化程序总结

文章目录 1 ADC0804 2 LCD1602 3 AD9854 1 ADC0804 集成A D转换器品种繁多选用时应综合考虑各种因素选取集成芯片一般逐次比较型A D转换器用的比较多 ADC0804就是这类单片集成A D转换器 ADC

随机推荐

9、HTML：有序列表（ol），无序列表（ul），描述列表（dl、dt、dd）详解

1 什么是列表什么是列表什么是有序列表什么是无序列表上面写的 3 句话就是一个列表你懂得 2 有序列表有序列表英文叫做 ordered list 所以标签也是取这个词组的首字母 ol ol标签括起来的范围就是有序列表的范围而
Win11怎么修改c盘用户名？

Win11怎么修改c盘用户名不知道的小伙伴们可以学起来了谨慎操作以下的方法提供给你希望对你有所帮助 Win11更改C盘user用户名教程一开启Administrator权限并登入搜索框搜索cmd 右击以管理员身份运行出现cm
C++每日一问：C++ 内存管理——内存泄漏及处理

2 内存泄漏 2 1 C 中动态内存分配引发问题的解决方案假设我们要开发一个String类它可以方便地处理字符串数据我们可以在类中声明一个数组考虑到有时候字符串极长我们可以把数组大小设为200 但一般的情况下又不需要这么多的空间
唯一分解定理（分解质因子）

唯一分解定理每个大于一的自然数均可写为质数的积而且这些素因子按大小排列之后写法只有一种方式最简单的写法 include
matlab绘制正弦函数、幅度调制初步、Inner matrix dimensions must agree错误

以sin 2 f t 表达式来绘制正弦图像必须给定数值序列才能绘制出图像 t必须给定一个数值序列然后计算出 y sin 函数值序列以t为横轴 y为纵轴就绘制出了图像先给出f 4 在这里是有几个周期采样率Fs 100 matlab
flask从入门到精通，知识讲解+代码演示 day1

flask从入门到精通知识讲解代码演示 day1 文章目录 flask从入门到精通知识讲解代码演示 day1 一 flask是什么二使用步骤 1 创造flask项目 2 初入flask 3 flask代码初运行 4 flask从
Spring Cloud实战(五)-声明式接口模块

接着上一篇 Spring Cloud实战四配置中心现在开始搭建api模块一声明式接口模块api 1 pom xml
数学建模-相关性分析（Matlab）

注意代码文件仅供参考一定不要直接用于自己的数模论文中国赛对于论文的查重要求非常严格代码雷同也算作抄袭如何修改代码避免查重的方法 https www bilibili com video av59423231 清风数学建模一基础
GPU与GPGPU泛淡

GPU与GPGPU泛淡 GPU Graphics Processing Unit 也即显卡是一种专门在个人电脑工作站游戏机和一些移动设备如平板电脑智能手机等上作图像运算工作的微处理器它已经是个人PC和移动设备上不可或缺的芯片
C#数据类型之枚举类型

一枚举类型的定义 public enum 枚举名称枚举数据类型枚举的数据类型可以省略默认类型为int 枚举项1 枚举项的值枚举项的值是整数可以自己设置枚举项2 枚举项3 例如 public enum month ushort 一
Clion + mysql (win/Mac + 本地/远程)

新手教程那些年我用clion操作mysql的一些经验教训本文目录使用clion自带的数据库工具对数据库进行操作连接本地数据库建库建表编辑表格修改字段名查询数据插入新的数据 sql常用语句 mysql版 win Clio
口罩检测——数据准备(2)

文章目录前言一数据介绍二数据标注三数据转换总结前言上一篇文章中小编讲解了口罩检测的环境要求在这一篇文章中我们就正式进入项目的讲解我们从数据准备开始数据是模型快乐的源泉没有高质量的数据再好的模型也白搭一数据介
Flink消费Rabbit数据，写入HDFS - 使用 BucketingSink

一应用场景 Flink 消费 Kafka 数据进行实时处理并将结果写入 HDFS 二 Bucketing File Sink 由于流数据本身是无界的所以流数据将数据写入到分桶 bucket 中默认使用基于系统时间 yyyy MM
通过 Tensorflow 的基础类，构建卷积神经网络，用于花朵图片的分类

实验目的通过 Tensorflow 的基础类构建卷积神经网络用于花朵图片的分类实验环境 import tensorflow as tf print tf version output 2 3 0 实验步骤一数据获取和预处理 1
第五章静态资源 CDN 引入

第五章静态资源 CDN 引入静态请求 CDN 用户将静态资源数据请求到ECS服务器 ECS服务器解析到阿里云的CDN中 CDN可以理解为一个无限大的内容磁盘缓存本身没有文件存储当用户访问 getItem 的一个静态资源文件的时候会
【线代】特征值、惯性指数、标准型、规范型的关系？等价、相似与合同？

目录 1 两矩阵特征值相同 1 1 实对称矩阵A B的特征值相同 2 二次型的标准型 2 1 标准型唯一吗 2 2 标准型与秩 2 3 标准型与特征值 2 4 正交变换与特征值 2 5 两个二次型的标准型相同 3 规范型 3 1 规范型唯一
Qt Install Framework使用方法

Qt程序的打包发布现在已经可以通过其发布的Installer Framework框架来完成通过修改一些配置文件即可实现首先现在该框架官网提供1 3 0 1 4 0和1 5 0版本的下载本文书写时根据有新的谁他吗还用旧的准则下载1
Spring----初识

Spring 是一种轻量级开发框架旨在提高开发人员的开发效率以及系统的可维护性 Spring 官网 Spring Home Spring 框架指的都是 Spring Framework 它是很多模块的集合使用这些模块可以很方便地协助我们
Qt 设计师-Qt Designer基础控件介绍

Layouts Vertical Layout 垂直布局 Horizontal Layout 水平布局 Gird Layout 栅格布局 FormLayout 表单布局关于布局有很多博客写的很好就不再赘述了本人常用Qt Designer
Laplace Smoothing

拉普拉斯平滑 Laplace Smoothing 拉普拉斯平滑 Laplace Smoothing 又称为加 1 平滑是比较常用的平滑方法平滑方法的存在时为了解决零概率问题一为什么要做平滑零概率问题在计算事件的概率时如果某个事

热门标签