用特征名称绘制特征重要性

2024-01-21

在 R 中，有预先构建的函数来绘制随机森林模型的特征重要性。但在python中似乎缺少这样的方法。我在寻找一种方法matplotlib.

model.feature_importances给了我以下内容：

array([  2.32421835e-03,   7.21472336e-04,   2.70491223e-03,
         3.34521084e-03,   4.19443238e-03,   1.50108737e-03,
         3.29160540e-03,   4.82320256e-01,   3.14117333e-03])

然后使用以下绘图函数：

>> pyplot.bar(range(len(model.feature_importances_)), model.feature_importances_)
>> pyplot.show()

我得到一个条形图，但我想得到带有标签的条形图，同时以排序的方式水平显示重要性。我也在探索seaborn并且找不到方法。

给没有时间浪费的数据科学家的快速回答：

将特征重要性加载到按列名称索引的 pandas 系列中，然后使用其绘图方法。对于分类器model训练使用X:

feat_importances = pd.Series(model.feature_importances_, index=X.columns)
feat_importances.nlargest(20).plot(kind='barh')

稍微详细一点的答案和完整的例子：

假设您使用 pandas 数据框中包含的数据训练模型，如果您将特征重要性加载到 pandas 的系列中，那么这相当轻松，然后您可以利用其索引来轻松显示变量名称。情节论证kind='barh'给了我们一个水平条形图，但你可以很容易地用这个参数代替kind='bar'如果您愿意，可以使用沿 x 轴显示特征名称的传统条形图。

nlargest(n)是一个 pandas Series 方法，它将返回具有最大序列的子集n价值观。如果您的模型中有很多特征并且您只想绘制最重要的特征，那么这非常有用。

使用经典 Kaggle Titanic 数据集的快速完整示例...

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
%matplotlib inline            # don't forget this if you're using jupyter!

X = pd.read_csv("titanic_train.csv")
X = X[['Pclass', 'Age', 'Fare', 'Parch', 'SibSp', 'Survived']].dropna()
y = X.pop('Survived')

model = RandomForestClassifier()
model.fit(X, y)

(pd.Series(model.feature_importances_, index=X.columns)
   .nlargest(4)
   .plot(kind='barh'))        # some method chaining, because it's sexy!

这会给你这个：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

matplotlib

RandomForest

Seaborn

用特征名称绘制特征重要性的相关文章

Twisted 的 Deferred 和 JavaScript 中的 Promise 一样吗？

我开始在一个需要异步编程的项目中使用 Twisted 并且文档非常好所以我的问题是 Twisted 中的 Deferred 与 Javascript 中的 Promise 相同吗如果不是有什么区别你的问题的答案是Yes and No
递归 lambda 表达式可能吗？

我正在尝试编写一个调用自身的 lambda 表达式但我似乎找不到任何语法或者即使它是可能的本质上我想将以下函数传输到以下 lambda 表达式中我意识到这是一个愚蠢的应用程序它只是添加但我正在探索可以在 python 中使用 l
Sublime Text 插件开发中的全局 Python 包

一总结我不知道 Sublime Text 插件开发人员如何使用 Sublime Text 查找全局 Python 包而不是 Sublime Text 目录的 Python 包 Sublime Text使用自己的Python环境而不是
为什么删除临时文件时出现WindowsError？

我创建了一个临时文件向创建的文件添加了一些数据已保存然后尝试将其删除但我越来越WindowsError 编辑后我已关闭该文件如何检查哪个其他进程正在访问该文件 C Documents and Settings Administra
Python 2.7 中的断言对我来说不起作用示例assertIn

我的 Mac 上安装了 python 2 7 通过在终端中运行 python v 进行验证当我尝试使用任何新的 2 7 断言方法时我收到 AtributeError 我看过http docs python org 2 library u
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

此问题与 smtplib 的 SMTP SSL 连接有关当与 SMTP 无 ssl 连接时它正在工作在 SMTP SSL 中尝试相同的主机和端口时出现错误该错误仅基于主机 gmail 设置也工作正常请检查下面的示例如果 Out
用 python 编写的数学语法检查器

我需要的只是使用 python 检查字符串是否是有效的数学表达式为了简单起见假设我只需要运算符也作为一元带有数字和嵌套括号为了完整性我还添加了简单的变量名称所以我可以这样测试 test 3 2 1 valid test 3
使用 Pandas 计算 delta 列

我有一个数据框如下所示 Name Variable Field A 2 3 412 A 2 9 861 A 3 5 1703 B 3 5 1731 A 4 0 2609 B 4 0 2539 A 4 6 2821 B 4 6 2779 A
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
TKinter 中的禁用/启用按钮

我正在尝试制作一个像开关一样的按钮所以如果我单击禁用按钮它将禁用按钮有效如果我再次按下它它将再次启用它我尝试了 if else 之类的东西但没有成功这是一个例子 from tkinter import fenster Tk
使用ssl和socket的python客户端身份验证

我有一个 python 服务器需要客户端使用证书进行身份验证我如何制作一个客户端脚本使用客户端证书由 python 中的服务器使用 ssl 和套接字模块进行身份验证有没有仅使用套接字和 ssl 而不扭曲的示例 from OpenSS

随机推荐

如何从AJAX事件中获取源元素？

我有一个表格其中的控件成行我想在输入更改时处理行中的其他元素
如何在调用和事件 VB.net 时传递附加参数

Public Event DocumentCompleted As WebBrowserDocumentCompletedEventHandler Dim arg As Object homeTeam guestTeam AddHandle
如何从 Windows 8 中的 MediaCapture API 获取反馈

我正在尝试在 Windows 8 应用程序中执行面部跟踪应用程序我知道为了访问相机流我必须使用MediaCapture AddEffectAsync 必须与 C 结合起来如图所示在这个样本中 http code msdn micros
为什么一些专业的网页设计师使用绝对路径而不是相对路径（例如 CSS、Javascript、图像等）？

我曾经认为每个人都使用相对路径例如 styles style css 但我想知道为什么一些受欢迎的网页设计师例如http www getfinch com http www getfinch com and http 31two com
使用 Visual Studio 2015 新模拟器调试 Cordova 应用程序 (android)

我不确定这是我在做一些愚蠢的事情还是只是在前沿我正在开发一个简单的 Cordova 应用程序但这是学术性的因为我可以使用标准的 Wizzard 生成默认应用程序重复此问题我让应用程序在 VS2013 上使用 Ripple 并偶尔在
将全局变量传递给函数

为什么下面的代码给我的是 0 而不是 1 我希望我的函数更改在函数外部声明的变量但我不想在函数声明中指定该变量 that 0 function go input input go that console log that 正如 Orio
从给定的物理和有效地址查找段地址

如何从给定的数据中找到段地址物理地址 0x119B 有效地址 0x10AB 公式可能是什么 x86 16位实模式下的有效地址只是20位的偏移量部分段偏移量 address https thestarman pcministry com
正则表达式 - 将数字与常量进行比较

如果我想匹配所有小于 2000 的数字我使用正则表达式 01 1 0 9 3 如果我想匹配 1 到 5 之间的所有数字我可以使用表达式 2 4 1 但是如果我想匹配 5 到 123 之间的所有数字怎么办有语法吗要匹配数字 gt 5
混合内容 - 不安全的样式表

在浏览器中我收到以下错误混合内容页面位于 https www website com https www website com 通过 HTTPS 加载但请求不安全的样式表 http fonts googleapis com css
使用自定义错误处理程序时如何从中止命令访问错误消息

使用 python Flask 服务器我希望能够使用 abort 命令抛出 http 错误响应并在正文中使用自定义响应字符串和自定义消息 app errorhandler 400 def custom400 error response
Python-LDAP 无法编译[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 所以我从源代码中获得了最新的 pyt
Django heroku 静态目录

我是 Heroku 的新手我尝试了一个没有 css 的简单 django 应用程序但我刚刚在我的应用程序中添加了一个 css 文件当我这样做时 git push heroku master 静态文件收集失败 gt Collecting
无论数据源如何，使用 Django/Django Rest Framework 验证和保存数据的正确过程是什么？

我有一个特定的模型我想对其执行自定义验证我想保证在创建新实例时始终存在至少一个标识符字段这样就不可能在没有这些字段之一的情况下创建实例尽管没有特别需要单独的字段 from django db import models class
Huggingface 分类与预测作斗争

我正在微调 longformer 然后使用进行预测TextClassificationPipeline and model inputs 方法我不确定为什么会得到不同的结果 import pandas as pd import datas
解析器未共享给依赖的 sbt 项目？

在这个似乎涉及 xsbt web plugin 的奇怪情况下我收到错误 unresolved dependency play play json 2 10 2 2 SNAPSHOT not found 当加载时server子项目依赖项和
使用 Validating 事件和 ErrorProvider 进行验证 - 显示错误摘要

当我的 WinForms 中存在错误时如何显示消息框数据无效尝试过类似的东西但它不起作用 if errorprovider1 null MessageBox Show Data is invalid 也许我必须使用 bool 来解决
不区分大小写的三元搜索树

我一直在使用三元搜索树 http en wikipedia org wiki Ternary search tree有一段时间作为数据结构来实现一个自动完成下拉组合框这意味着当用户输入 fo 时将显示下拉组合框富食物足球问题
线性图表中 x 轴上的多条线未显示

我有一个单轴折线图用户会选择year从下拉菜单中选择loan type从另一个下拉菜单然后图表应加载 12 个月的记录annual payment and scheduled payment 两者都是线性线仪表板 vue div cl
按发布日期列出的可用.packages

是否可以从 R 中获取 CRAN 包的发布日期我想获取 k 个最近发布的 CRAN 软件包的列表或者获取 dd mm yy 日期之后发布的所有软件包的列表类似于上面的信息available packages by date html
用特征名称绘制特征重要性

在 R 中有预先构建的函数来绘制随机森林模型的特征重要性但在python中似乎缺少这样的方法我在寻找一种方法matplotlib model feature importances给了我以下内容 array 2 32421835e 0

用特征名称绘制特征重要性

用特征名称绘制特征重要性 的相关文章

随机推荐

热门标签

用特征名称绘制特征重要性的相关文章