如何找到逻辑回归模型特征的重要性？

2024-04-15

我有一个通过逻辑回归算法训练的二元预测模型。我想知道哪些特征（预测变量）对于正类别或负类别的决策更重要。我知道有coef_参数来自 scikit-learn 包，但我不知道它是否足够重要。另一件事是我如何评估coef_值对于消极类和积极类的重要性。我还读到了标准化回归系数，但我不知道它是什么。

假设有肿瘤大小、肿瘤重量等特征来决定测试用例是否恶性。我想知道哪些特征对于恶性和非恶性预测更重要。

要了解线性分类模型中给定参数的“影响”（逻辑就是其中之一），最简单的选择之一是考虑其系数的大小乘以数据中相应参数的标准差。

考虑这个例子：

import numpy as np    
from sklearn.linear_model import LogisticRegression

x1 = np.random.randn(100)
x2 = 4*np.random.randn(100)
x3 = 0.5*np.random.randn(100)
y = (3 + x1 + x2 + x3 + 0.2*np.random.randn()) > 0
X = np.column_stack([x1, x2, x3])

m = LogisticRegression()
m.fit(X, y)

# The estimated coefficients will all be around 1:
print(m.coef_)

# Those values, however, will show that the second parameter
# is more influential
print(np.std(X, 0)*m.coef_)

获得类似结果的另一种方法是检查模型在标准化参数上的拟合系数：

m.fit(X / np.std(X, 0), y)
print(m.coef_)

请注意，这是最基本的方法，并且存在许多用于查找特征重要性或参数影响的其他技术（使用 p 值、引导分数、各种“判别指数”等）。

我很确定您会在以下位置获得更有趣的答案https://stats.stackexchange.com/ https://stats.stackexchange.com/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

scikitlearn

LogisticRegression

如何找到逻辑回归模型特征的重要性？的相关文章

在 pandas 中单独打印一列的原始值？

我有一个数据框 df pd DataFrame name george age 23 name anna age 26 现在我想检索乔治的年龄 df df name george age 但这会输出一些额外的信息以及原始值 0 23 Nam
如何使用 conda 在一行中安装多个包？

我需要使用 conda 安装以下多个软件包我不确定 conda forge 是什么有些使用 conda forge 有些不使用它是否可以将它们安装成一行而不需要一一安装谢谢 conda install c conda forge d
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
如何使用 Python 3 正确显示倒计时日期

我正在尝试获取将显示的倒计时基本上就像一个世界末日时钟哈哈有人可以帮忙吗 import os import sys import time import datetime def timer endTime datetime datet
在python中对列表列表执行行总和和列总和

我想用python计算矩阵的行和和列和但是由于信息安全要求我无法使用任何外部库因此为了创建矩阵我使用了列表列表如下所示 matrix 0 for x in range 5 for y in range 5 for pos in

随机推荐

未捕获（承诺中）：错误：无法读取未定义的属性

组件使用参数将用户从服务中取出 Component selector users providers UserService template p user id p export class UserPageComponent imple
为什么Xcode自动创建带下划线的变量？

为什么在最新版本的 Xcode dp 4 中声明的变量是retain nonatomic是否在变量名前使用下划线这会创建某种类型安全吗例如我创建一个属性 property retain nonatomic IBOutlet UILab
如何在本地进行 Facebook Messenger Bot 开发？

设置 webhooks 时它会说Secure URL是必须的我在用ngrok https ngrok com 隧道本地主机地址这里有一个例子 https github com wit ai node wit https github
如果 Objective C 是 C 的严格超集，那么为什么它不能编译呢？

考虑以下源文件它是至少应该是有效的 C void id 我正在尝试编译它gcc c test m 但我收到以下错误 test m 1 error id redeclared as different kind of symbol
如何从R中的不同函数将数据依次写入csv文件中？

我有一个 CSV 文件我想根据我执行的功能将数据写入另一个 CSV 文件例如 Data csv Identity State City BusinessName BusinessNeed 12 California Los Angele
通过 angular-cli 生成的角度组件的自定义项目级模板

如何将自定义角度组件原理图添加到现有项目我想要例如my page将复制现有的组件模板 node modules schematics angular component 文件但带有编辑过的模板我希望它可以通过以下方式实现angular
UnionBy Linq 实现

我需要 Union 的实现来比较对象的属性而不是对象本身我想出了以下几点 public static IEnumerable
实时清除数据容器的内容

My problem is best explained by the architecture below 基本上我必须清除NSMutableData实时对象或任何其他对象即我无法阻止其包含线程有没有办法 API 来做到这一点 u
32feet.net 如何在 C# 中异步发现附近的蓝牙设备

我正在尝试使用32英尺 NET http 32feet codeplex comC 应用程序中的蓝牙库用于检测附近的设备我的小应用程序的目的是通过人们手机的蓝牙功能让电脑知道谁在房间里执行此类操作的最佳方法是让我想要跟踪的设备连接一
将网络摄像头从浏览器流式传输到 RTMP 服务器

我正在尝试将一些内容从浏览器的网络摄像头实现流式传输到随机 RTMP 服务器我让它工作到每 2 秒将 WEBM 我相信是 VP8 编码的电影片段发送到我的服务器的部分但棘手的部分是从该部分将其发送到 RTMP 服务器对 FFMPEG
如何简单地解析没有指定年份的日期？

我有一个工具它似乎可以给我日期但没有指定我需要转换的年份并且我正在使用 Java 来完成任务实际上是 Groovy 但在本例中足够接近示例日期是 13 Dec 12 00 00 它应该指的是 12 13 2011 因为年份未指定
HTML 俄语

我必须设计一个俄语版本的网站我从翻译那里得到文本我把它复制到Dreamweaver的代码中但它不起作用我有平常的头我应该怎么办您应该将文件的编码更改为 UTF 8 您可以执行此过程当您Save As文件在记事本中或者您可以使用
OpenSSL 上的 EVP_DecryptFinal_ex 错误

我正在使用 OpenSSL EVP 例程使用 AES 128 cbc 模式进行解密我使用 NIST 站点指定的测试向量来测试我的程序该程序似乎在 EVP DecryptFinal ex 例程处失败谁能告诉我有什么问题吗另外我如何在
处理 Swift 2 中异步闭包错误的最佳方法？

我使用了大量的异步网络请求顺便说一句 iOS 中的任何网络请求都需要异步并且我正在寻找更好的方法来处理来自 Apple 的错误dataTaskWithRequest哪个不支持throws 我有这样的代码 func sendRequest
创建名称为“securityConfig”的 bean 时出错：自动装配依赖项注入失败

我正在尝试结合 Java config 和 xml config 进行 Spring 安全身份验证但我收到一个错误创建名称为 securityConfig 的 bean 时出错自动装配依赖项注入失败我的代码似乎有什么问题一直在谷歌
无法在 Ubuntu 上的 PyCharm 上启动终端

我想运行一段代码为此我在我的 Ubuntu 机器上安装了 PyCharm 现在当我打开 PyCharm 应用程序并尝试打开终端时它会抛出错误并且不会打开终端 java io IOException Exec tty错误未知的pyc
管理面板中的 django choicefield 过滤器

默认情况下 django 管理员list filter提供型号选择中所有可用的过滤器但除了那些我还想要一个过滤器我们可以说它是无过滤器 class Mymodel char choice field choices 1 txt1 2
18M+行表的子查询和MySQL缓存

由于这是我的第一篇文章我似乎只能发布 1 个链接因此我在底部列出了我所指的网站简而言之我的目标是让数据库更快地返回结果我尝试包含尽可能多的相关信息以帮助在帖子底部提出问题机器信息 8 processors model name
在 Snowflake 的公共表表达式中使用“match_recognize”

更新已回答here https stackoverflow com questions 68544567 match recognize with cte in snowflake 68550312 68550312 我正在将一个有点复杂
如何找到逻辑回归模型特征的重要性？

我有一个通过逻辑回归算法训练的二元预测模型我想知道哪些特征预测变量对于正类别或负类别的决策更重要我知道有coef 参数来自 scikit learn 包但我不知道它是否足够重要另一件事是我如何评估coef 值对于消极类和积极类的

如何找到逻辑回归模型特征的重要性？

如何找到逻辑回归模型特征的重要性？ 的相关文章

随机推荐

热门标签

如何找到逻辑回归模型特征的重要性？的相关文章