如何在Python中的多类分类问题上获取每个类的SHAP值

2024-04-12

我有以下数据框：

import pandas as pd
import random

import xgboost
import shap

foo = pd.DataFrame({'id':[1,2,3,4,5,6,7,8,9,10],
                   'var1':random.sample(range(1, 100), 10),
                   'var2':random.sample(range(1, 100), 10),
                   'var3':random.sample(range(1, 100), 10),
                   'class': ['a','a','a','a','a','b','b','c','c','c']})

我想运行一个分类算法来预测 3classes

所以我将数据集分成训练和测试，然后运行 xgboost

cl_cols = foo.filter(regex='var').columns
X_train, X_test, y_train, y_test = train_test_split(foo[cl_cols],
                                                        foo[['class']],
                                                        test_size=0.33, random_state=42)


model = xgboost.XGBClassifier(objective="binary:logistic")
model.fit(X_train, y_train)

现在我想得到平均形状值每个班级，而不是平均值absolute从此代码生成的 SHAP 值：

shap_values = shap.TreeExplainer(model).shap_values(X_test)
shap.summary_plot(shap_values, X_test)

此外，该图标记了class为 0,1,2。我怎么知道哪个class从原来的0,1 & 2 对应吗？

因为这段代码：

shap.summary_plot(shap_values, X_test,
                 class_names= ['a', 'b', 'c'])

gives

和这段代码：

shap.summary_plot(shap_values, X_test,
                 class_names= ['b', 'c', 'a'])

gives

所以我对这个传说已经不太确定了。有任何想法吗？

我有同样的问题，也许这个问题可以帮助：https://github.com/slundberg/shap/issues/764 https://github.com/slundberg/shap/issues/764

我还没有测试过，但似乎顺序应该与您调用时的顺序相同model.predict_proba()。在上面的链接中，建议使用class_names=model.classes_摘要图的选项。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

machinelearning

xgboost

shap

如何在Python中的多类分类问题上获取每个类的SHAP值的相关文章

Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
通过 python 中的另外两个修改数组[重复]

这个问题在这里已经有答案了假设我们有三个一维数组 A 长度为 5 B 长度相同示例中为5 C 更长比如长度为 100 C最初用零填充 A给出索引C应更改的元素它们可能会重复以及B给出应添加到初始零的值C 例如如果A 1 3 3
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
如何在Windows中的Python 3.9下pip安装pickle？

我需要pickle https docs python org 3 9 library pickle html module pickle包安装在我的下面Python 3 9在 Windows 10 下我尝试过的当尝试与pip inst
django 模板 - 如何动态访问变量？

假设我有一个具有以下上下文的 django 模板 data1 this is data1 data2 this is data2 data name data2 现在我知道了data name 假设它是 data2 是否可以用它来访问变量d
Django 多对多关系（类别）

我的目标是向我的 Post 模型添加类别我希望以后能够按不同类别有时是多个类别查询所有帖子模型 py class Category models Model categories 1 red 2 blue 3 black title
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
Python 属性和 Swig

我正在尝试使用 swig 为一些 C 代码创建 python 绑定我似乎遇到了一个问题试图从我拥有的一些访问器函数创建 python 属性方法如下 class Player public void entity Entity enti
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何在matplotlib中调整x轴

I have a graph like this x轴上的数据表示小时所以我希望x轴设置为0 24 48 72 而不是现在的值很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
无法让gunicorn使用Python 3

我有 Ubuntu NGINX Gunicorn 以及可与 Python 3 设置配合使用的虚拟环境但我的 Flask 应用程序仍然以 2 7 6 运行我已系统地按照说明进行操作但找不到解决方案 Gunicorn 配置文件 progr
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
pandas.read_fwf 忽略提供的数据类型

我正在从文本文件导入数据框我想指定列的数据类型但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些

随机推荐

我需要在 Swift 中 memset 一个 C 结构体吗？

AFAIK 在 swift 中调用类结构的默认初始化程序会将所有内容初始化为0 nil 在 C 中例如套接字编程有时会使用 memset 在使用结构之前将所有内容设置为 0 我是否也需要在 swift 中使用 memset 还是我写
为什么使用erts_debug:size/1时atom的内存为零？

I use erts debug size 1计算erlang VM中atom的内存但我发现输出为零谁能解释一下原因 7 gt erts debug size true 0 原因是原子与原子的数据一起保存在原子表中因此整个节点中只有一
如何从Python中的给定文本创建一组类及其变量和方法

我想从给定的文本配置创建一组类其变量和方法特别是使用 django 模型例如我有一个要在 models py 中创建的模型列表 classes users posts commnets vars a b bb vv aa metho
Spring MVC 静态资源位于单独的 jar 中

最近我的同事问我是否可以将静态资源 css 图像 js 放在单独的 jar 文件中并从 spring mvc 应用程序访问这些静态资源我在谷歌上搜索但没有发现任何有趣的东西所以我的问题是可能吗如果是的话您能解释一下该由谁来做
复杂的 php mysqli 查询插入数据（如果不存在）：获取重复列名“？”

所以伙计们请查看我的示例代码并帮助我我找不到解决方案在我传递等参数的行上不断出现重复的列名称我在查询中一起传递了 7 个变量知道可能是什么问题吗 SQL INSERT INTO wifi ssid password name
键入时更新文本框

在 Access 中我有一个包含三个文本框的表单我正在尝试更新一个名为的文本框tbx组合名称两者的组合 textbox tbx姓氏人的姓氏 textbox tbx名字人的名字我的问题是我使用什么文本框属性以便在输入文本时tbx
检查开关参数的正确方法是什么

检查开关值的正确方法是什么 function testSwitch Param switch swth Write Host Value of swth is swth if swth IsPresent Write host Switch
从证书 x509 中提取公钥

我正在寻找一种从 JavaScript 中的证书 x509 PEM 格式中提取公钥的方法如下所示 openssl x509 in cert cer pubkey noout gt pub txt 您需要能够解析 ASN 1 结构的东西
decltype中的成员函数调用

以下代码 struct A int f int auto g int x gt decltype f x 无法编译并出现错误 error cannot call member function int B f int without obj
如何在手机SD卡或其他位置搜索文件

我想搜索用户移动设备上具有特定扩展名的文件我尝试搜索但找不到任何直接的 API 是否有特定的 API 或者是否有实现相同目的的繁琐方法或者是否有一种机制可以调用 linux 调用 find 或类似的东西 Thanks boolean i
使用 Flask 代理到另一个 Web 服务

我想将对 Flask 应用程序发出的请求代理到计算机上本地运行的另一个 Web 服务我宁愿使用 Flask 而不是更高级别的 nginx 实例这样我们就可以重用应用程序中内置的现有身份验证系统我们越能保持这种单点登录越好是否有现
我可以改变传递给 setState 函数的状态吗？

我知道我不应该直接在 React 中改变状态但是当我使用函数时情况如何 onSocialClick e gt const id e target value this setState prevState props gt prevSta
以编程方式在 WooCommerce 中创建多个优惠券

我一直在寻找一种向 WooCommerce 批量添加优惠券的方法它实际上是一个包含 800 个会员号码的列表可以提供折扣而优惠券似乎是实现此目的的最佳方式我找到了一种以编程方式添加单张优惠券的方法 http docs woothem
Pycharm的终端不会更改Project Interpreter处Python版本对应的Python版本

我已经安装了 PyCharm 2016 3 并在 Windows 上安装了两个版本的 Python 3 5 2 和 2 7 9 我想使用这两个版本因此我在项目解释器窗口中对其进行了配置我选择的是3 5 2版本如下图之后我打开Pyt
在 Meteor 应用程序中使用 Disqus / reCaptcha

我正在开发一个使用 Meteor 的应用程序我正在尝试在我的其中一个表单上使用 reCaptcha 并在我的某些页面上使用 Disqus 评论系统但问题是当我运行流星服务器时这些都没有被渲染以下是我添加到模板中的示例 Disqus
如何结合 websockets 和 http 来创建一个保持数据最新的 REST API？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在考虑使用 websockets 和 http 构建一个 REST API 其中我使用 websockets 告诉客户端新数据可用或直接向客
根据连续值之间的差异将列表拆分为子列表

我有一个值列表其中每个值至少有一个但通常是多个连续值且增量为 0 033 l 26 051 26 084 26 117 26 15 26 183 31 146 31 183 34 477 34 51 34 543 我想将此列表拆分为
Java事件派发线程讲解

我最近开始学习和探索 Java 中 GUI 编程的基础知识编程已经有一段时间了我只做过后端工作或工作因此我最接近的用户界面是命令控制台我知道这很尴尬我正在使用 Swing 据我所知这意味着我也在使用 AWT 我的问题是基于这段代
MySQL SELECT 中的条件 SELECT

Table id price is active 1 20 99 0 2 10 99 1 3 30 99 0 4 15 99 1 5 35 99 1 我试图选择 is active 等于 1 的所有行的 COUNT 所以我使用了这个简单的查
如何在Python中的多类分类问题上获取每个类的SHAP值

我有以下数据框 import pandas as pd import random import xgboost import shap foo pd DataFrame id 1 2 3 4 5 6 7 8 9 10 var1 rando

如何在Python中的多类分类问题上获取每个类的SHAP值

如何在Python中的多类分类问题上获取每个类的SHAP值 的相关文章

随机推荐

热门标签

如何在Python中的多类分类问题上获取每个类的SHAP值的相关文章