【LightGBM】feature_importance获取特征重要性

2023-05-16

使用LightGBM.feature_importance()函数给训练完毕的LightGBM模型的各特征进行重要性排序。

feature_importance             = pd.DataFrame()
feature_importance['fea_name'] = train_features
feature_importance['fea_imp']  = clf.feature_importance()
feature_importance             = feature_importance.sort_values('fea_imp',ascending = False)
 
plt.figure(figsize=[20,10],dpi=100)
ax = sns.barplot(x = feature_importance['fea_name'], y = feature_importance['fea_imp'])
ax.set_xticklabels(labels = ['file_id_api_nunique','file_id_api_count','file_id_tid_max','file_id_tid_mean','file_id_tid_min','file_id_tid_std','file_id_index_mean','file_id_tid_nunique','file_id_index_nunique','file_id_index_std','file_id_index_max','file_id_tid_count','file_id_index_count','file_id_index_min'],
                                    rotation = 45,fontsize = 15)
ax.set_yticklabels(labels = [0,2000,4000,6000,8000,10000,12000,14000,16000],fontsize = 15)
plt.xlabel('fea_name',fontsize=18)
plt.ylabel('fea_imp',fontsize=18)
# plt.tight_layout()
plt.savefig('D:/A_graduation_project/pictures/2_baseline1/特征重要性')

官方文档

feature_importance(importance_type='split', iteration=-1)
Get feature importances.

Parameters:
importance_type (string__, optional (default="split")) – How the importance is calculated. If “split”, result contains numbers of times the feature is used in a model. If “gain”, result contains total gains of splits which use the feature.
iteration (int or None, optional (default=None)) – Limit number of iterations in the feature importance calculation. If None, if the best iteration exists, it is used; otherwise, all trees are used. If <= 0, all trees are used(no limits).
Returns:
result – Array with feature importances.
Return type:
numpy array

————————————————
来源：https://blog.csdn.net/qq_41904729/article/details/117928981

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

lightGBM

Feature

importance

获取特征重要性

【LightGBM】feature_importance获取特征重要性的相关文章

[论文] Feature Squeezing:Detecting Adversarial Examples in Deep Neural Networks

思路 xff1a 对抗样本经过feature squeeze处理后大部分增加的干扰会被消除或者减小 xff0c 致使feature squeeze前后的分类结果向量 xff08 distributed vector xff09 L1距离很大
VINS（二）Feature Detection and Tracking

系统入口是feature tracker node cpp文件中的main函数 1 首先创建feature tracker节点 xff0c 从配置文件中读取信息 xff08 parameters cpp xff09 xff0c 包括 xff
【论文阅读】Feature Denoising for Improving Adversarial Robustness

阅读由来SCRDet 43 43 参考文献 20 https blog csdn net dujuancao11 article details 121590324 Feature Denoising for Improving Adver
【Feature Denosing】Feature Denoising for Improving Adversarial Robustness

摘要对图像分类系统的对抗攻击 xff0c 给卷积网络带去挑战的同时 xff0c 也提供了一个理解他们的机会对抗扰动使得网络提取的特征包含噪声受这个观察启发 xff0c 我们执行feature denoising 具体来说 xff0c
Feature Squeezing: Detecting Adversarial Examples in Deep Neural Networks笔记

Code https github com mzweilin EvadeML Zoo Feature squeezing reducing the color bit depth of each pixel and spatial smoo
SyntaxError: future feature annotations is not defined

作者遇到这个问题是在使用NVIDIA Jetson Xavier NX开发套件控制舵机时遇到的 xff0c 作者采用IIC通信方式控制PCA9685模块进而控制舵机在此问题解决过程中发现有人遇到相同问题 xff0c 所以做个补充别人给出
OpenLayers绘制图形

OpenLayers的显示构成由外向内为 ol Map 地图对象 ol layer Vector 图层对象layer Map含有多个layer 最终的显示效果是由多个layer叠加而成 ol source Vector和ol style S
机器学习-GBDT

GBDT gbdt是一种以CART树通常为基分类器的boosting算法大家可以仔细查一下boosting的介绍这里不再赘述 gbdt通过多轮迭代每轮迭代产生一个弱分类器每个分类器在上一轮分类器的残差基础上进行训练对弱分类器的
Lightgbm 直方图优化算法深入理解

一概述在之前的介绍Xgboost的众多博文中已经介绍过在树分裂计算分裂特征的增益时 xgboost 采用了预排序的方法来处理节点分裂这样计算的分裂点比较精确但是也造成了很大的时间开销为了解决这个问题 Lightgbm 选择了
java中的异步处理和Feature接口(一)

文章目录背景介绍 Feature接口 Feature接口和Tread的区别 Feature接口示例 Feature接口的局限性背景介绍想象这样一个场景你可能希望为你的法国客户提供指定主题的热点报道为实现这一功能你需要向谷歌或者
light gbm - python API 与 Scikit-learn API

我正在尝试应用 LightGBM 并已经完成了 Python API文档 Training API 和 Scikit learn API 有什么区别吗我们可以使用这两个 API 来针对同一问题获得相同的结果吗简短的回答是的如果您以相
docker libgomp.so.1 内的 Lightgbm：无法打开共享对象文件

我在我的 Mac 上安装了 LightGBM 并之前针对不同的项目进行了测试现在我在 Mac 上安装了 python 3 6 的 docker 中一旦我添加import lightgbm as lgbm在我的 Flask 应用程序中我
在 Google Colaboratory 上使用 GPU 运行 LightGBM/ LGBM

我经常在 Google Colabatory 上运行 LGBM 我刚刚发现这个页面说 LGBM 默认设置为 CPU 所以你需要先设置 https medium com am sharma lgbm on colab with gpu c1c
LightGBM错误：ValueError：为了提前停止，至少需要一个数据集和评估指标进行评估

我正在尝试使用 gridsearch 训练 LightGBM 当我尝试训练模型时出现以下错误 ValueError For early stopping at least one dataset and eval metric is req
如何保存 Tidymodels Lightgbm 模型以供重复使用

我有以下代码用于创建tidymodels工作流程与lightgbm模型但是当我尝试保存到 rds对象和预测 library AmesHousing library treesnip library lightgbm library ti
Lightgbm 提前停止无法正常工作

我正在使用 lightgbm 来执行机器学习任务我想使用早期停止来找到给定多个超参数的最佳树数然而 lgbm 停止种植树木同时仍在改进我的评估指标下面我附上了我的规格 params max bin 128 num leaves 8
如何使用lightgbm.cv进行回归？

我想对 LightGBM 模型进行交叉验证lgb 数据集并使用提前停止回合以下方法对于 XGBoost 来说没有问题xgboost cv 我不喜欢将 Scikit Learn 的方法与 GridSearchCV 一起使用因为它不支持提前
Lightgbm 中“is_unbalance”参数的使用

I am trying to use the is unbalance parameter in my model training for a binary classification problem where the positiv
访问 LightGBM 模型参数

有时我会保存 LightGBM 模型然后在重新加载它时想要访问有关模型构建方式的一些详细信息有没有办法恢复这个事实objective regression 例如为了方便起见这里是可以使用的简短代码 library lightgbm
LightGBM 警告：没有有意义的特征，因为所有特征值都是常数

我尝试过以下简单的代码 import lightgbm pandas params objective multiclass num classes 4 train df pandas DataFrame f0 0 1 2 3 5 f1 0

随机推荐

【训练加速】优化PyTorch的速度和内存效率（2022）

作者 xff1a Jack Chih Hsu Lin 编译 xff1a ronghuaiyang 导读你应该知道的18个PyTorch小技巧调试深度学习的pipelines就像找到最合适的齿轮组合你为什么要读这篇文章 xff1f 深度
【损失函数】图像分割损失CELoss中添加 OHEM

语义分割中常用交叉熵损失CE xff0c 在应用中通常添加OHEM以获取更好的收敛 xff08 经验阈值是0 7 xff09 xff0c 这里OHEM思想的来源是topk loss xff0c 其介绍参考论文损失函数 Learning
【Pytorch】梯度累积原理与实现

在深度学习训练的时候 xff0c 数据的batch size大小受到GPU内存限制 xff0c batch size大小会影响模型最终的准确性和训练过程的性能在GPU内存不变的情况下 xff0c 模型越来越大 xff0c 那么这就意味着数
【Python】TypeError: __init__() takes 1 positional argument but 2 were given

问题描述以下代码使用关键词参数时出现错误 xff1a TypeError init takes 1 positional argument but 2 were given class DAFormerHead BaseDecodeHea
Getting Started with PyTorch Image Models (timm): A Practitioner’s Guide

PyTorch Image Models timm is a library for state of the art image classification containing a collection of image models
【numpy】判断一个数组元素是否在另一个数组内 numpy.isin

numpy使用numpy isin element test elements xff0c 可以判断一个数组元素是否在另一个数组内详细用法请见官方文档该方法依次检查element中的元素是否在test elements里面 xff0c
PX4与TX2通信

PX4与TX2通信以及相关数据的获取目录 1 PX4硬件接口 2 TELEM1 2接口线序 3 PX4与TX2通信 PX4 IO口定义 xff1a PX4硬件 xff1a 4 通信测试 5 RTPS 43 ROS Jetson TX2终端
【Pandas】如何在 DataFrame 中插入行

pd DataFrame的insert方法是用于插入列的 xff0c 想插入行的话需要借助numpy insert 使用以下基本语法将行插入到 Pandas DataFrame 中的特定位置 xff1a import pandas as p
【pandas】dataframe中重复数据比较、筛选、去除等

当需要的是DataFrame那些重复数据 xff0c 尤其是要比较重复数据的异同时 xff0c 就需要将重复数据提取出来时 xff0c 再关联原数据 xff0c 并做排序 xff0c 进行比较方法一主要思路 xff1a 1 采用drop
【Pandas】两个DataFrame找出不同元素（作差）

两个DataFarame xff0c 存在相同的内容 xff0c 也存在不同的内容 xff0c 找出其中不同的内容可以通过元素删除来间接实现 xff1a df3 61 df1 append df2 drop duplicates keep
时间序列数据的特征工程总结

当下时间序列预测的方法主要有三种吧 xff0c 第一个是传统的时间序列预测方法 xff0c 典型代表有ARIMA和指数平滑法 xff1b 第二个是基于机器学习的方法 xff0c 目前用的最多的是lightgbm和xgboost xff0c
【PyTorch】torch.nn.Transformer解读与应用

nn TransformerEncoderLayer 这个类是transformer encoder的组成部分 xff0c 代表encoder的一个层 xff0c 而encoder就是将transformerEncoderLayer重复几层
【Python】使用f格式化时出现SyntaxError: invalid syntax错误

python中f 34 34 和 34 34 format 是等价的 xff0c 前者更加简洁例如 xff1a user 61 1 print f 34 C user 34 但是在低版本python中并不支持f 34 34 xff0c 会
【PyTorch】nn.TransformerEncoder 使用 src_key_padding_mask 时出现nan

问题描述 xff1a 在使用nn TransformerEncoder时 xff0c 不使用src key padding mask xff0c 编码的输出正常 xff0c 使用src key padding mask后编码结果变成nan了
【scikit-learn】scaler.fit_transform()和transform()的区别与使用

scikit learn提供了Scaler来进行数据的标准化处理 xff0c 例如StandardScaler类是一个用来讲数据进行均值方差归一化的类所谓归一化和标准化 xff0c 即应用下列公式 xff1a 使得新的X数据集方差为1 x
【Pandas】相关性分析corrwith与corr

pandas有两类相关性分析的函数 xff0c 分别是DataFrame的corrwith和Series的corr xff0c 注意这俩不能混用 corrwith用于计算DataFrame中行与行或者列与列之间的相关性 xff0c 而cor
【比赛方案】2019年CCF大数据与计算智能大赛乘用车细分市场销量预测冠军解决方案

共使用一个lgb模型与一个规则模型进行融合 xff0c 总运行时长约3min 代码全部整合到一个文件里了 xff0c 共约500行本次比赛初赛有60个车型 xff0c 复赛有82个车型 xff0c 由于初赛时长较长 xff0c 复赛时长较
教你用python高效刷leetcode

由于Python语法的简洁性 xff0c 用python来刷leetcode往往能用比别的语言更少的代码量AC 但是如果不是对python很熟悉就会比较尴尬了 xff0c 如果有些功能明明有高效的内置方法因为不知道要自己实现或者不了解其复
解决MMCV CUDA Compiler : not available

问题描述 xff1a 安装完mmcv full使用mmdetection时 xff0c 提示MMCV CUDA Compiler not available xff0c 发现并未使用GPU 分析解决 xff1a 导致无法使用GPU的原因可能
【LightGBM】feature_importance获取特征重要性

使用LightGBM feature importance 函数给训练完毕的LightGBM模型的各特征进行重要性排序 feature importance 61 pd DataFrame feature importance 39 fea

【LightGBM】feature_importance获取特征重要性

【LightGBM】feature_importance获取特征重要性 的相关文章

随机推荐

热门标签

【LightGBM】feature_importance获取特征重要性的相关文章