解读Logistic回归模型

2023-11-03

一、logistic回归的由来

logistic回归在百度百科是这样定义的:

        logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。

        由此可见 logistic回归是从线性回归模型推广而来的,线性回归模型如下:

h(x)=\theta _{0}+\theta _{1}x_{1}+\theta _{2}x_{2}+ ... +\theta _{n}x_{n}  -----------线性方程形式

h(x)=\Theta ^{T}X    ----------------向量形式

        h(x)输出为连续的值但是实际中会有"输出为离散型变量"这样的需求,例如:给定特征预测一次金融交易是否是欺诈(1表示是, 0表示不是),显然不能直接使用线性回归模型(上面的线性回归方程自变量的取值范围是-∞到+∞,右侧表达式的的值的范围也是-∞到+∞),而这时逻辑回归就派上用场了。

二、Logistic回归模型建立

        离散型变量涉及的问题通常称之为 分类问题,在分类问题中,尝试预测的是结果是否属于某一个类,下面我们从0-1二元分类问题开始理解。

        现假设因变量y取值为0和1,在自变量x的条件下因变量y=1的概率为p,记作p=P(y=1|x),那么y=0的概率就为1-p(因变量取1和取0的概率比值p/(1-p)   称为优势比),由 P(y=1|x) 推导 Sigmoid函数,推导过程如下:

Sigmoid函数公式:h(z)=\frac{1}{1+e^{-z}}         ----------------------- (1)

Sigmoid函数图形:(上下阈值无限逼近 1 和 0)

Logistic回归可理解为是在线性回归的基础上加一个Sigmoid函数对线性回归的结果进行压缩,令其最终预测值y在一个范围内(0到1之间),或者说是在用线性回归模型的预测结果去逼近真实标记的对数几率。

上述由 P(y=1|x) 推导 Sigmoid函数的过程中,设置了:

\large z=ln \frac{P(x|y=1)P(y=1)}{P(x|y=0)P(y=0)}

这里,需要一个引经据典,才能进行下一步推导:

1730 年,法国数学家棣莫弗(1677年-1754年)出版的著作《分析杂论》中包含了著名的棣莫弗─拉普拉斯定理。他使用正态分布取估计n(很大)时抛掷硬币出现正面次数的分布,即二项分布B(n,0.5)。这就是概率论中第二个基本极限定理的雏形。将近80年后,拉普拉斯(1749年-1827年)在 1812 年出版的《概率的分析理论》中,首先明确地对概率作了古典的定义。他指出当n很大时,二项分布B(n,p)(0<p<1)都可以用正态分布逼近。所以后人称之为棣莫弗-拉普拉斯中心极限定理

所以,我们假设 类条件概率密度 服从正态分布。

高中的时候我们便学过一维正态分布的公式为:

N(x|\upsilon ,\sigma ^{2}) = \frac{1}{\sqrt{2\pi\sigma ^{2} }}e^{-\frac{1}{2\sigma ^{2}}(x-\upsilon )^{2}}

拓展到多维时,就变成:

N(\bar{x}|\bar{\upsilon},\Sigma ) = \frac{1}{(2\pi) ^{\frac{D}{2}}} \frac{1}{\left |\sum \right |^{\frac{1}{2}}} e^{[ -\frac{1}{2} (\bar{x} - \bar{\upsilon })^{T} \sum ^{-1} (\bar{x} - \bar{\upsilon}) ]}     --------------------------  (2)

其中,\bar{X} 表示维度为 D 的向量,\bar{u} 则是这些向量的平均值,Σ 表示所有向量 \bar{X} 的协方差矩阵。

(2)式写成概率的形式:

P(x|c_{k}) = \frac{1}{(2\pi) ^{\frac{D}{2}}} \frac{1}{\left |\sum \right |^{\frac{1}{2}}} e^{[ -\frac{1}{2} (x - \upsilon _{k})^{T} \sum ^{-1} (x - \upsilon _{k}) ]}    

下面开始下一步推导:

由此得到 \large z = w^{^{T}}x + b   

那么 \large f(x) = w^{^{T}}x + b , 什么时候不需要考虑偏置项b?

\(x\)\(b\)吸收入向量形式 \(\hat{w} = (w;b)\),此时就不用单独考虑\(b\)了。

因此令 \theta = (w;b)x ,则 z = w ^{^{T}}x + b = \theta ^{T}x

即:z = \theta ^{T}x   ----------------------- (3)

综合上述 (1)式 和 (3)式,得到Logistic回归模型

h(x) = \frac{1}{1+e^{-\theta ^{T}x}}

完毕。

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

解读Logistic回归模型 的相关文章

  • unity

    一 理解我们要做的事 原本图片放入文件夹后是Default 默认 模式 但是需要大量处理图片的时候 我们希望它拖进去就是sprite模式 我们想修改unity原本的功能 二 unity是允许我们去修改它本身的一些功能的 你可以定制属于你的u

随机推荐

  • JVM系列(十) 垃圾收集器之 Parallel Scavenge/Old

    上篇文章我们讲解了单线程垃圾收集器 Serial SerialOld 与之相对应的多线程垃圾收集器就是 Parallel Scavenge Old 本文我们讲解下多线程垃圾收集器 Parallel Scavenge Old 垃圾收集器 新生
  • 2018年TI杯电子设计竞赛感悟

    2018年7月27日 电赛结束已经有三四天的时间了 今年的感悟和去年的相比很是不同 去年大一 刚刚入门单片机 搞点东西也都是瞎搞 没有一个像模像样的作品 即使是有也都是一些次品 半成品 得知学校选拔学生参加全国大学生电子设计竞赛 单数年为国
  • linux添加sshkey,linux 配置 ssh密钥登陆

    配置这个其实很简单 一点也不复杂 首先需要在服务器安装openssh 如果你不安装你是找不到配置密钥登陆的配置文件的 yum install y openssh 安装好后就需要去配置密钥登陆了 vi etc ssh sshd config
  • kali持久化U盘镜像安装教程

    https zhuanlan zhihu com p 436210497 utm id 0
  • opencv 轻松入门 面向python pdf_面向Python 的OpenCV轻松入门——第三章(3)

    3 3 按位逻辑运算 逻辑运算是一种非常重要的运算方式 图像处理过程中经常要按照位进行逻辑运算 本节 介绍 Opencv中的按位逻辑运算 简称位运算 在 Opencv内 常见的位运算函数如表3 1所示 表3 1 常见的位运算函数 函数名 基
  • linux的依赖关系

    依赖关系最简单的一个理解就是 Windows 上你玩游戏结果提示 directx 版本过低无法运行 以及常见的运行某个程序之后提示 mfc71 dll 未找到 还有就是用个软件结果安装说明上让你先去安装 net Linux 的依赖关系因为他
  • iOS开发入门教程

    当涉及到详细的教程和排版要求时 纯文本形式的回答无法满足您的需求 以下是一个简单的iOS开发入门教程大纲 您可以按照该大纲进行深入学习和实践 iOS开发入门教程大纲 1 开发环境搭建 下载和安装Xcode 配置iOS模拟器 2 Swift语
  • Echarts

    目录 1 1 什么是ECharts 1 2 ECharts基本使用 1 3 ECharts标题组件 1 4 ECharts工具箱组件 1 5 ECharts弹窗组件 1 6 ECharts饼状图 1 7 ECharts航线图 更详细的教程请
  • spice协议详解(二):spice支持功能和优势

    SPICE Simple Protocol for Independent Computing Environments 是目前最有潜力的开源虚拟桌面协议 最初是由Qumranet开发 后来被RedHat收购并开源 经过几年的社区开发 sp
  • 爆肝整理,Python自动化测试-Pytest参数化实战封装,一篇打通...

    目录 导读 前言 一 Python编程入门到精通 二 接口自动化项目实战 三 Web自动化项目实战 四 App自动化项目实战 五 一线大厂简历 六 测试开发DevOps体系 七 常用自动化测试工具 八 JMeter性能测试 九 总结 尾部小
  • [大话IT]圈套玄机—《圈子圈套》中的案例分析

    2006 02 22 00 20 14 Filter pattern 楼主 supernal pig 地址 http www12 tianya cn new Publicforum Content asp idWriter 2974942
  • 【拒绝主观!】C++继承中父类的构造函数和析构函数调用情况

    C 继承中父类的构造函数和析构函数调用情况 父类构造函数调用规则 子类会默认调用父类的无参构造函数 且发生在子类所有代码执行之前 原因 父类里面的一些成员可能被设置为private 导致该成员变量只能由父类自己初始化 如果父类不存在无参构造
  • java求s=a+aa+aaa+aaaa+aa...a的值,其中a是一个数字。例如2+2....(java50道经典编程题)

    题目 求s a aa aaa aaaa aa a的值 其中a是一个数字 例如2 22 222 2222 22222 此时共有5个数相加 几个数相加有键盘控制 对于这个题目来说还是比较简单的不过我在编码过程中好像漏了点东西 调试了几遍才好 这
  • React路由懒加载的方式之一

    第一步 在组件中引入 lazy Suspense这两个api import React Component lazy Suspense from react 导入我们的路由组件 示例 import Home from Home import
  • vue-router路由中对query中的参数进行加密

    vue router路由中对query中的参数进行加密 源码地址在文末 在创建路由的时候 添加两个方法 stringifyQuery 序列化传入的query参数 方法可以接收一个对象参数 在new Router的时候传递这个属性 在序列化q
  • HDU寝室断电快乐上网指南(基于树莓派3B+的软路由

    HDU寝室断电快乐上网指南 基于树莓派3B 的软路由 前言 准备工作 1 PPPOE拨号上网 2 解除禁用网卡 3 安装一些其它必要程序 3 1 hostapd 3 2 dnsmasq 4 WIFI热点配置 4 1 解除禁用hostapd
  • MySQL的子查询

    文章目录 什么是子查询 单行子查询和多行子查询 单行子查询 多行子查询 什么是子查询 子查询 是指一个查询语句嵌套在另一个查询语句内的查询 因此也称为 嵌套查询 比如 要查询谁的工资比Abel高 谁的工资比Abel高 方式1 两次查询 SE
  • UnityWebGL 设置启动后自动网页全屏2020.3.40f1版本

    Unity版本2020 3 40f1 这是原版 开始修改 1 打开html修改此处代码 数字改为auto 风格改为100 可直接粘贴代码如下 div style width 100 height 100 div
  • 【HttpRunnerManager】搭建接口自动化测试平台操作流程

    一 需要准备的知识点 1 linux 安装 python3 nginx 安装和配置 mysql 安装和配置 2 python django 配置 uwsgi 配置 二 我搭建的环境 1 Centos7 配置 rabbitmq mysql S
  • 解读Logistic回归模型

    一 logistic回归的由来 logistic回归在百度百科是这样定义的 logistic回归又称logistic回归分析 是一种广义的线性回归分析模型 常用于数据挖掘 疾病自动诊断 经济预测等领域 由此可见 logistic回归是从线性