回归(regression)和logistic regression

2023-11-06

回归

“回归”就是“回归本质”的意思。用一个函数去拟合一组数据 (xi,yi) ，随着数据越来越多，用来拟合的这个曲线就越来越接近真实的情况。这里 xi 可以是一个向量, 假设 xi∈Rn , 若用线性回归的方法, 首先把它扩展为 n+1 维, 用来拟合的参数 θ∈Rn+1 ; 其中 x0=1 , 对应 θ0 为截距. , 所以函数拟合的是一个 n+2 维的超平面( θT⋅x−y=0 ). 拟合后得到的超平面, 输出前 n+1 维的输入, 可以得到一个输出 y .
* linear regression：用直线拟合
* logistci regression：用一种曲线拟合（曲线的形状和sigmoid有什么联系?）

Logistics regression

θT⋅x是linear regression，套一层sigmoid将输出映射到 (0,1) 。

假设训练集为 (x(1),y(1)),(x(2),y(2)),...,(x(m),y(m)) ；输入特征为 x(i)∈Rn+1 （我们对符号的约定如下：特征向量 x(i) 的维度为 n+1 ，其中 x0=1 ，对应截距项）。由于logistic回归是针对二分类问题的，因此类标记 y(i)∈{0,1} 。假设函数(hypothesis function) 如下：

hθ(x)=11+e−θT⋅x,θ∈Rn+1

Interpretion： hθ(x(i))=Sigmoid(θT⋅x(i)) 是 y(i)=1 的概率， 1−hθ(x(i)) 是 y(i)=0 的概率( 吴恩达，Logistic Regression: Optimization Objective I)

训练 θ ，使其能最小化代价函数：

J(θ)=−1m[∑i=1mloghθ(x(i))+(1−y(i))log(1−hθ(x(i)))]

为什么cost function定义为这样？
* 首先的确可以定义为squared error的形式，即

J(θ)=1m∑i=1m(hθ(x)−y(i))2

但是该曲线not convex，即很难找到全局最优。定义为上面的形式则convex。
这里写图片描述

* 对某个 (x(i),y(i)) 分类讨论：
1. 当 y(i)=1 时， cost→∞ when hθ(x(i))→0 ; cost→0 when hθ(x(i))→1(i.e. y(i))
这里写图片描述

2. 当 y(i)=0 时， cost→0(i.e. y(i)) when hθ(x(i))→0 ; cost→∞ when hθ(x(i))→1
这里写图片描述

* 用 log 函数的意义在于，它就是好用，而且convex。（这里我也不明白，就先这么记着）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

回归(regression)和logistic regression 的相关文章

带有管道和 GridSearchCV 的 StandardScaler

我已将 standardScaler 放在管道上并且 CV mlpregressor predict x test 的结果很奇怪我想我必须从 standardScaler 取回这些值但仍然不知道如何做 pipe MLPRegresso
R：如何读取列线图来预测所需的变量

我正在使用 Rstudio 我使用函数创建了列线图nomogram从包装中rms使用以下代码从示例代码复制文档 http www inside r org packages cran rms docs nomogram library r
R中glmnet中的岭回归；使用 glmnet 包计算不同 lambda 值的 VIF

我有一组多重共线性变量我正在尝试使用岭回归来解决这个问题我正在使用glmnetR 中的包 alpha 0 用于岭回归 library glmnet 我有一系列 lambda 值并且我通过 cv glmnet 选择最佳 lambda 值
如何合并两个seaborn图？

来自Seaborn 文档 https seaborn pydata org examples joint kde html 以下代码片段将生成下面的图 import numpy as np import pandas as pd impor
使用 p 值的逐步回归删除 p 值不显着的变量

我想表演一个逐步线性回归 using p values作为选择标准例如在每个步骤中删除具有最高即最不显着 p 值的变量当所有值均由某个阈值定义的显着时停止alpha 我完全知道我应该使用 AIC 例如命令step or stepAIC
scipy linregress 函数错误的标准错误返回？

我遇到了一个奇怪的情况 scipy stats linregress 似乎返回了不正确的标准错误 from scipy import stats x 5 05 6 75 3 21 2 66 y 1 65 26 5 5 93 7 96 gra
DecisionTreeRegressor 的 Predict_proba 的等效项

scikit learn 的DecisionTreeClassifier支持通过以下方式预测每个类别的概率predict proba 功能这不存在于DecisionTreeRegressor AttributeError Decision
使用分类数据作为 sklearn Logistic 回归中的特征

我试图了解如何使用分类数据作为特征sklearn linear model s LogisticRegression 我当然知道我需要对其进行编码我不明白的是如何将编码特征传递给逻辑回归以便将其作为分类特征进行处理而不是将其在编码为标
使用支持向量回归进行时间序列预测

我一直在尝试使用Python语言中的支持向量回归来实现时间序列预测工具我使用 scikit learn 中的 SVR 模块进行非线性支持向量回归但我对未来事件的预测有严重的问题回归线非常适合原始函数根据已知数据但一旦我想预测未来的
在没有 numpy polyfit 的情况下在 python 中拟合二次函数

我正在尝试将二次函数拟合到某些数据并且我尝试在不使用 numpy 的 polyfit 函数的情况下执行此操作从数学上讲我试图关注这个网站https neutrium net mathematics least squares fitti
scale.default 中的错误：“center”的长度必须等于“x”的列数

我在用mboost包做一些分类这是代码 library mboost load so data rdata model lt glmboost is exciting data training family Binomial pred
R：动态更新公式

如何动态更新公式 Example myvar lt x update y 1 x x y 1 works as intended update y 1 x myvar y x doesn t work as intended update
如何在这个线性模型中强制删除截距或等效项？

考虑下表 DB lt data frame Y rnorm 6 X1 c T T F T F F X2 c T F T F T T Y X1 X2 1 1 8376852 TRUE TRUE 2 2 1173739 TRUE FALSE 3
没有预测器的 Sklearn 回归

是否可以在 sklearn 中使用或不使用即仅使用截距预测器来运行回归例如逻辑回归这似乎是一个相当标准的类型分析也许这些信息已经在输出中可用我发现的唯一相关的事情是sklearn svm l1 min c但这会返回一个非空模型
Scikit-learn 具有使用“特征”的自定义评分函数

我正在尝试使用一种名为 SERA 平方误差相关区域的新指标作为本文中提到的不平衡回归的自定义评分函数 https link springer com article 10 1007 s10994 020 05900 9 https lin
生成因子变量水平的预测值

我正在使用连续结果变量对多个因子变量进行回归lm 例如 fit lt lm dv factor hour factor weekday factor month factor year count data df 我想生成预测值 yhat
优化 R 中的嵌套 for 循环

我尝试加速下面的代码但没有成功我读到Rfast https cran r project org web packages Rfast Rfast pdf包但我也未能实现该包有没有办法优化R中的以下代码 RI lt function
从拟合的 lm 或 glm [R] 获取每个因子水平（以及交互作用）的数据数量

我在 R 中有一个逻辑回归模型其中所有预测变量都是分类变量而不是连续变量除了响应变量它显然也是分类二元变量打电话时summary model name 有没有办法在每个因子水平中包含一个表示观测值数量的列我在 R 中有一个逻辑回
Pandas 中每列的曲线拟合 + 外推值

我有一个包含大约 300 列的数据集每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
仅运行相应源代码已更改的单元测试？

我正在 Jenkins CI 服务器中运行单元测试和 Selenium 测试众所周知在大型项目中测试需要很长时间才能运行 Java 是否有一个工具框架只能触发其源代码已更改的测试这是因为并非每次对 SCM 的提交都会影响源代码的所有

随机推荐

c++ 内存管理一：初识内存分配工具

文章目录前言 1 new 和 delete 2 new 和delete 3 operator new 4 placement new 5 malloc和free 6 allocator 前言侯捷 c 内存管理学习总结笔记在C 中有几
win服务器文件复制命令,用命令形式从Windows系统拷贝文件到Linux

1 将本机文件复制到远程服务器上 scp home administrator news txt root 192 168 6 129 etc squid home administrator 本地文件的绝对路径 news txt 要复制到
452. 用最少数量的箭引爆气球

452 用最少数量的箭引爆气球在二维空间中有许多球形的气球对于每个气球提供的输入是水平方向上气球直径的开始和结束坐标由于它是水平的所以纵坐标并不重要因此只要知道开始和结束的横坐标就足够了开始坐标总是小于结束坐标一支弓箭可以
自动控制原理实验二二阶系统阶跃响应

实验源码已经上传CSDN了需要的可直接下载链接 https download csdn net download weixin 53129688 87694703 实验内容其中 z 和wn对系统的动态品质有决定的影响 z为阻尼比由于
电子书杜春雷 ARM体系结构与编程

https pan baidu com s 1AYpTxklTRXCpqGV6hD3UzQ 提取码 j7ku
IO流概念与open函数操作

IO流 input output stream 存储设备磁盘 rom 能永久保存读取写入速度慢内存 ram 读取速度快不能永久保存断电就没了贵狭义 CPU运算暂时写入内存没读满就不存进去见file 再存入磁盘保存广义
STM32的RTC使用

STM32的RTC使用初始化RTC 设置时间保存时间获取实时时间 RTC后备区另类使用初始化RTC define RTC SET CONFIG FLAG 0x6066 lt RTC设置完成标志判断是否第一次配置 if HAL RTC
自动化运维工具Ansible基础部署与使用

目录一安装部署二配置 Ansible最基础的模块为ping模块主要用于判断远程客户端是否在线用于ping本身服务器返回值为changed ping 三 ansible批量管理 shell模块 copy模块 yum模块 file
MATLAB中peaks函数的用法

MATLAB中peaks函数感觉比较有意思是两个变量的样本函数用法主要为 z peaks 返回一个49 49的矩阵 z peaks n 返回一个n n的矩阵 peaks n 没有输出参数时这个函数直接使用surf来绘制peaks 默认
sklearn之feature_importance_参数的学习

一随机森林原文链接 https blog csdn net zjuPeco article details 77371645 随机森林的算法可以用如下几个步骤概括用有抽样放回的方法 bootstrap 从样本集中选取n个样本作为一个训
PBR 与 OpenGL ES 2.0 中的LOD纹理：Mipmap （关于Lod和Bias）

MipMap 当使用Mipmap的时候可能会用到xxxLod 和 xxxBias 这几种纹理采样函数在片段着色器中 vec4 texture2D sampler2D sampler vec2 coord vec4 textureCube
对抗js前端加密的万能方法

1 前言现在越来越多的网站采用全报文加密测试的时候需要逆向提取加密算法以及密钥过程十分繁琐和复杂本文提供一种更为简单快捷的方法来解决此问题原理大致如下使用浏览器的Override Hook加密前的数据配置代理地址发送给中转服务
LC滤波器简单设计法 - 一文读懂LC滤波器简单设计方法及原理介绍，LC值计算方法

LC滤波器简单设计法一文读懂LC滤波器简单设计方法及原理介绍 LC值计算方法 LC滤波器概述 LC滤波器也称为无源滤波器是传统的谐波补偿装置 LC滤波器之所以称为无源滤波器顾名思义就是该装置不需要额外提供电源 LC滤波器一般是由滤波
【Python进阶学习】根据数据绘制省份热力地图（源码）

输入 pro sales csv 省份与值数据 province 省份列 deal 值列输出中国地图 html 优化显示省份名称使用notepad 打开中国地图 html 搜索 series 在1900多行这个 3 增加以下内容
mybatis utf8mb4 java_java.sql.SQLException: Unsupported character encoding 'utf8mb4'.

四月 12 2017 3 47 52 下午 org apache catalina core StandardWrapperValve invoke 严重 Servlet service for servlet SpringMVC in c
深度学习拾遗

深度学习 hinton bp算法李飞飞吴恩达黄广斌路奇深度学习优化的超参数 1 学习率学习率 learning rate或作lr 是指在优化算法中更新网络权重的幅度大小学习率可以是恒定的逐渐降低的基于动量的或者是自适应的
面向高维优化问题的混沌粒子群混合蝴蝶优化算法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 Matlab代码及详细文章讲解 4 参考文献 1 概述文献来源摘要为了解决蝶形优化
值类别左值引用右值引用

文章目录值类别关系图示例左值引用声明符语法示例反汇编伪代码右值引用声明符语法示例反汇编伪代码相关参考值类别每个 C 表达式运算符带上其操作数字面量变量名等可按照两种独立的性质加以辨别类型和值类别 v
快手java开发面试经验大全

1 自我介绍 2 java集合 hashmap详细介绍关键参数线程安全的集合队列和栈用两个栈实现队列算法 3 jvm结构 4 多线程锁 synchronized reentrantlock countdownlatch 锁升级 5
回归(regression)和logistic regression

回归回归就是回归本质的意思用一个函数去拟合一组数据 xi yi x i y i 随着数据越来越多用来拟合的这个曲线就越来越接近真实的情况这里 xi x i可以是一个向量假设 xi Rn x i in R n 若用线性回归的方

回归(regression)和logistic regression

回归

Logistics regression

回归(regression)和logistic regression 的相关文章

随机推荐

热门标签