广义线性模型（GLM）

2023-11-15

在线性回归中，y丨x；θ~N（μ，σ^2)。在逻辑回归中，y丨x；θ~Bernoulli（Φ）。这两个都是GLM中的特殊的cases。我们首先引入一个指数族（the exponential family）的概念。如果一个分布能写成下列形式，那么我们说这个分布属于指数族。

η是分布的自然参数（natural parameter ），比如伯努利分布中的Φ；T(y)是充分统计量（sufficient statistic ），个人理解是能充分体现数据特点的更低维的数据，在这里通常T(y)=y。式子看起来不友好，个人理解，无非是将一个分布写成了一个指数形式。概率P>0，而指数函数的也都是大于0的，通过b，a，T来修改指数函数得到我们想要的形式。

以Bernoulli分布为例：

所以我们可得，b(y)=1,η^T=log（Φ/1-Φ），a(η)=log(1-Φ），该分布中η为标量，所以η=log（Φ/1-Φ），两边以e为底，得

Φ=1/（1+e^η）。令人惊讶的是，这恰好就是我们的logistics function。其建立的是一种概率和自然参数的关系，在逻辑回归中我们的参数就是我们手里的样本数据，想对样本做一个二分类，自然而然联系二项分布，从而推出logistics function。

接着我们来看高斯分布，在线性回归中我们通过假设误差ε~N(0,σ^2),然后通过最大似然推出目标是最小化

显然，与方差σ^2无关，为了简化，先设其为1.所以我们可以将高斯分布写成：

然后一一对应可以得到：

我们可以看到，不同的分布对应的解析式是不一样的。比如我们要对一个问题建模，首先我们分析这些数据服可能从什么分布，最简单的就对0，1问题建模必然首选伯努利分布，根据GLM推出我们需要的hypothesis。下面就介绍怎么使用GLM。

要想使用GLM解决问题，我们必须遵守三个假设：

1.y丨x；θ~exponentialfamily（η），即给定x和θ，y是服从指数族的某个分布的。

2.h(x)=E[y丨x]。以logistics regression为例，我们预测的h(x)是一个概率，所以有

hθ(x) = p(y = 1|x; θ) = 0 · p(y =0|x; θ) + 1 · p(y = 1|x; θ) = E[y|x; θ].)

3.η = θTx ;即η和x满足线性关系

根据这三个假设，我们就能得到线性回归和逻辑回归中的假设是如何来的。线性回归中：

逻辑回归中：

这也解释了当我们做LR二分类的时候为什么会采取该假设，因为二分类是服从伯努利分布的，而我们从伯努利分布推出上式，自然就该应用此假设。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Machine Learning

广义线性模型（GLM）的相关文章

Kaggle竞赛题目之——Digit Recognizer

Classify handwritten digits using the famous MNIST data This competition is the first in a series of tutorial competitio
【Machine Learning】5.特征工程和多项式回归

特征工程和多项式回归 1 导入 2 多项式特征 3 特征选择 4 多项式特征与线性特征的关联 5 特征缩放 Scaling features 6 复杂函数的拟合 7 课后题特征工程使用线性回归机制来拟合非常复杂甚至非线性存在 x n
深度学习系列之ANN

到此 ANN网络从最基础的单层感知器到为深度网络作模板延伸的BP网络将模型结构参数训练算法都举例讲解的很透彻为下面的CNN网络的学习打下坚实的基础这个在线编辑器体验太差了好好写一篇长文章想知道博客上与大家交流转换过程太麻
机器学习——深度学习(Deep Learning)

Deep Learning是机器学习中一个非常接近AI的领域其动机在于建立模拟人脑进行分析学习的神经网络最近研究了机器学习中一些深度学习的相关知识本文给出一些很有用的资料和心得 Key Words 有监督学习与无监督学习分类回归
基于Levenberg-Marquardt训练算法的BP网络Python实现

基于Levenberg Marquardt训练算法的BP网络Python实现分类统计机器学习算法理论 2013 07 15 23 40 430人阅读评论 0 收藏举报经过一个多月的努力终于完成了BP网络参考的资料为 1 Tra
【基于协同过滤算法的电影推荐】

目录 1 协同过滤算法 1 1 CF与 User Item 推荐算法区别 1 2 UserCF 1 3 ItemCF 2 评价指标 3 基于userCF与itemCF电影推荐 3 1 MovieLens数据集 3 2 userCF代码实现
论文阅读笔记4——MOTR: End-to-End Multiple-Object Tracking with TRansformer(利用Transformer进行多目标跟踪)

首个完全基于端到端 Transformer 的多目标追踪模型 21年5月上传到arxiv上论文论文代码代码 space 1 Abstract 摘要大概由两部分组成一是过去启发式算法的缺陷二是MOTR的基本思路他说MOT问题的关
朴素贝叶斯理论推导与三种常见模型

朴素贝叶斯 Naive Bayes 是一种简单的分类算法它的经典应用案例为人所熟知文本分类如垃圾邮件过滤很多教材都从这些案例出发本文就不重复这些内容了而把重点放在理论推导其实很浅显别被理论吓到三种常用模型及其编码实现
OpenCV中SVM的参数具体设置

CvSVMParams CvSVMParams svm type CvSVM C SVC kernel type CvSVM RBF degree 0 gamma 1 coef0 0 C 1 nu 0 p 0 class weights 0
R-squared 和 Adjusted R-squared联系与区别

原文见 https discuss analyticsvidhya com t difference between r square and adjusted r square 264 8 下面是自己理解的总结大概意思就是说 R squ
关于二阶锥优化（SOCP）的学习

原来数学不好的时候真的很难深入下去做研究最近的两个月时间里我就边学习SOCP相关的理论知识一边拿它当工具来分析多视角几何中的问题包括Triangulation Homography Estimation等接触到SOCP的起因在
线性回归和逻辑回归

1 回归和分类的问题比如我们想预测房价预测天气预测股票等这些数值都是一些连续型的数值如果我们想知道我一些房间中有多少个卧室那么这些肯定是一个整数比如说2个卧室 3个卧室不可能是2 1个卧室 3 68个卧室类似于小数的这样一个连
confidence weighted learning

这个算法原作者意思是在NLP中面对高维向量和数据稀疏时效果会不错算法保持了当前预测向量w的均值和方差并做优化代码实现如下 cw learning algorithm def get phi confidence parameter p
指数分布的定义形式及应用

转载请注明出处 http blog csdn net ningyaliuhebei article details 46409941 指数分布是连续型随机变量指数分布具有无记忆性指数分布是特殊的gamma分布指数分布 Exponent
深度学习 vs 概率图模型 vs 逻辑学

深度学习 vs 概率图模型 vs 逻辑学发表于 2015 04 30 21 55 1359次阅读来源 quantombone 0 条评论作者 Tomasz Malisiewicz 深度学习 deep learning 图模型人工智能
【nlp-with-transformers】

今天社群中的小伙伴面试遇到了一个问题如何保证生成式语言模型在同样的输入情况下可以保证同样的输出这里面造成问题的因素有两个方面一个方面是在forward过程中参数的计算出现了差异这种情况一般发生在游戏显卡中游戏显卡无法保证每一次底层
Structural Time Series modeling in TensorFlow Probability

在邯郸学步后想要深入用好Tensorflow中的STS model 还是要静下心来好好阅读点材料 f t f 1
Mxnet在Windows10, vs2015平台的编译及开发-CPU版本

环境基础配置 Windows10 cmake3 11 1 vs2015 QT5 11 1 mxnet配置 OpenBLAS v0 2 9 Win64 int32 opencv3 4 1 相关资源百度云链接 https pan baidu
【特征工程】特征选择与特征学习

特征选择与特征学习在机器学习的具体实践任务中选择一组具有代表性的特征用于构建模型是非常重要的问题特征选择通常选择与类别相关性强且特征彼此间相关性弱的特征子集具体特征选择算法通过定义合适的子集评价函数来体现在现实世界中数据通常是
如何使用 Whisper 和 Spleeter AI 工具制作卡拉 OK 视频

介绍人工智能工具可用于处理图像音频或视频以产生新颖的结果直到最近在不使用大量时间和计算能力的情况下自动编辑图像或音频仍然具有挑战性即使如此通常也只能运行交钥匙滤波器来删除声音中的某些频率或更改图像的调色板较新的方法使用人工智

随机推荐

合宙Air700E/4G模块使用AT指令查询基础信息

Air700E使用AT指令查询基础信息前言 AT指令使用 AT 确认AT固件 AT CGMR 请求制造商版本 AT CGMM 返回制造商型号编码 AT CGSN x 查询产品序列号 AT CGSN 1 查询IMEI AT CGSN 2 查
Flask项目（三）定义登录装饰器、图片服务、缓存机制、celery

Flask项目定义登录装饰器 redis文档图片服务封装七牛方法城区数据下拉列表缓存用户认证相关发布房源 map 函数 celery 基本使用房屋管理定义登录装饰器 utils commons py from werkze
x86汇编_MUL/IMUL乘法指令_笔记52

32位模式下整数乘法可以实现32 16或8位的操作 64位下还可以使用64位操作数 MUL执行无符号乘法 IMUL执行有符号乘法 MUL指令无符号数乘法 32 位模式下 MUL 无符号数乘法指令有三种类型执行 8 位操作数与 AL 寄
gitee删除上传到的远程分支的提交记录

在实际开发中可能也经常会遇到写完代码后提交到远程分支但发现写的提交信息有误不符合规范由于自己的gitee账号可能没有修改提交记录的权限因此最佳的解决方法是撤销本地分支当前的提交记录将代码回滚到上一个版本提交前重新强制再提交一版
大数据挖掘、分析与应用

第一讲基础知识大数据指无法在可承受的时间范围内用常规软件工具进行捕捉管理和处理的数据集合是需要新处理模式才能具有更强的决策力洞察力和流程优化能力的海量高增长率和多样化的信息资产数据挖掘 DataMining 是有组织有目的地收集
安装SQLServer2008出现[HKLM\Software\Microsoft\Fusion!EnableLog] (DWORD)设置为 1

问题当我们卸载SQLServer2008后再重新安装后会出现以下问题原因是卸载有时不能完全清理文件解决方法找到文件C Users user name AppData Local Microsoft Corporation删除Land
深度学习Pytorch（十）——基于torchvision的目标检测模型

深度学习Pytorch 十基于torchvision的目标检测模型文章目录深度学习Pytorch 十基于torchvision的目标检测模型一定义数据集二为PennFudan编写自定义数据集 1 下载数据集 2 为数据集编写
C++ 中基础的几种变量作用域，类作用域（C++复习向p5）

文章目录三种变量变量作用域初始化变量类作用域三种变量局部变量函数代码块中的变量形式参数函数参数中定义的变量在函数体中有效全局变量所有函数外部声明的变量变量作用域局部作用域局部变量在函数执行完后销毁全局作用域
最全面的Socket使用解析

前言 Socket的使用在Android的网络编程中非常重要今天我将带大家全面了解Socket及其使用方法目录 1 网络基础 1 1 计算机网络分层计算机网络分为五层物理层数据链路层网络层运输层应用层其中网络层负责根据
一次内网 Harbor 镜像仓库导出迁移过程记录

1 整体思路 Harbor 提供有丰富的 API 接口可以获取所有项目信息镜像和标签等信息通过编写 shell 脚本循环处理即可实现批量导出镜像包的需求登陆 Harbor 后左下角有 API 控制中心按钮进入可以查看和调试 2
centos 安装配置l2tp实现***

centos 安装配置l2tp实现 1 前言 L2TP是一种工业标准的Internet隧道协议功能大致和PPTP协议类似比如同样可以对网络数据流进行加密不过也有不同之处比如PPTP要求网络为IP网络 L2TP要求面向数据包的点对点连
OSI七层模型---数据链路层（以太网帧、MAC地址、MTU、MSS、ARP协议）

我们首先来了解一下物理层的作用物理层的主要目的是实现比特流的透明传输为数据链路层提供服务物理层接口解决了用几根线多大电压每根线什么功能以及几根线之间是怎么协调的问题物理层介质解决了数据载体材质以及价格优缺点的问题通信技术解决
01_I.MX6U芯片简介

目录 I MX6芯片简介 Corterx A7架构简介 Cortex A处理器运行模型 Cortex A 寄存器组 IMX6U IO表示形式 I MX6芯片简介 ARM Cortex A7内核可达900 MHz 128 KB L2缓存并行
李宏毅机器学习 2016 秋：6、Classification: Logistic Regression

文章目录六 Classification Logistic Regression 六 Classification Logistic Regression 我们来讲 Logistic Regression 我们在上一份投影片里面我们都已
点云Las格式分析及python实现

目录一 Las格式分析 1 公共头 2 变长记录 3 参考文献二安装laspy 2 0 2 三代码实现一 Las格式分析 1 公共头公共头用来记录数据集的基本信息如Li DAR点总数数据范围 Li DAR点格式变长记录总数
在switch语句中使用字符串以及实现原理

对于Java语言来说在Java 7之前 switch语句中的条件表达式的类型只能是与整数类型兼容的类型包括基本类型char byte short和int 与这些基本类型对应的封装类Character Byte Short和Integer
Go单体服务开发最佳实践

单体最佳实践的由来对于很多初创公司来说业务的早期我们更应该关注于业务价值的交付并且此时用户体量也很小 QPS 也非常低我们应该使用更简单的技术架构来加速业务价值的交付此时单体的优势就体现出来了正如我直播分享时经常提到我们在使用
什么是等保合规

近年来随着国家对网络安全的重视我国对网络安全的监管要求也越来越高各互联网企业都在积极落实网络安全等级保护关键信息基础设施安全保护制度为了保护网络安全企业也在按照网络安全法及等保2 0 系列标准要求积极寻求等级保护测评整
C语言进阶：C陷阱与缺陷（读书笔记总）

大家不要只收藏不关注呀哪怕只是点个赞也可以呀粉丝私信发邮箱免费发你PDF 最近读了一本C语言书 C陷阱与缺陷还不错挺适合刚刚工作后的人特此分享读书笔记写代码时应注意这些问题笔记已做精简读完大概需要30min 如果读起来感觉
广义线性模型（GLM）

在线性回归中 y丨x N 2 在逻辑回归中 y丨x Bernoulli 这两个都是GLM中的特殊的cases 我们首先引入一个指数族 the exponential family 的概念如果一个分布能写成下列形式那么我们说这个分布属于指

广义线性模型（GLM）

广义线性模型（GLM） 的相关文章

随机推荐

热门标签

广义线性模型（GLM）的相关文章