shapley和树的shap

2023-11-18

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

shapley and shap

Shapley交互阶的计算
关于树结构Shap的计算

Shapley交互阶的计算

首先一阶的计算公式
在这里插入图片描述
二阶（交互值）计算

三阶计算

一般式（来源于文章Fuzzy measures and integrals in MCDM）

举个例子，设N={1，2，3}
在这里插入图片描述

特别地，计算时需要知道所有特征组合，因此复杂度很高，达到指数级别。

关于树结构Shap的计算

如果采用树结构的话，只需要遍历树所有可能的路径上的特征即可
（文章Explainable AI for Trees: From Local Explanations to Global Understanding）
直观例子
如果只有一个特征分裂，即树深度为1，假设特征有10个，如果以标准的计算方法，对于每一条样本，都要计算特征0在各个位置引入时的贡献度，特征1在各个位置引入时的贡献度，以此类推，起码要计算2^10种特征是否引入的可能性，才能最终推算出每个特征的贡献度。但是树的结构仍然深度为1，可能只使用特征0做了一次分裂就结束了。

有了 algorithm 1 之后, 我们可以把不同特征组合方式输入进去来求得各个特征的贡献度, 但特征组合仍然是 2^M 的指数级复杂度. 这里一个很自然的想法就是我们不需要遍历特征组合情况, 而只要遍历树的路径的所有可能即可, 在遍历过程中把计算的 path 信息记录下来, 然后在叶子节点就能计算出这条 path 的特征贡献信息. 这就是作者在文中提出的 Algorithm 2 的大致思路.
例如某个节点 x, 使用了特征 a 来做分裂条件, 那么在经过这个节点时, 不管特征组合如何变化, 只可能有特征 a 的存在与缺失两种情况, 这也是对应到代码中的 one path 和 zero path 的 fraction.

在计算交互值上，原来的公式可以变为
在这里插入图片描述

这个公式表示这个SHAP交互作用值可以解释为特征j存在时,特征i的SHAP值和特征j不存在时,特征i的SHAP值之间的差值。
使用Explainable AI for Trees中的算法2两次,一次忽略固定存在的特征j，一次不存在特征j。

在这里插入图片描述
x是我们要解释的实例，f(x)是当前实例的模型输出，fx(S) ≈ E[f(x) | xS]是以特征值集合S为条件的模型输出的估计期望值
通过将每个特征一次一个地引入到模型输出的条件期望函数fx(S) ≈ E[f(x) | xS]中，来计算Shapley值，并且将在每个步骤产生的变化归因于所引入的特征；然后在所有可能的特征排序上平均这个过程

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

算法

shapley和树的shap 的相关文章

根据Explain结果中的key_len判断MySQL联合索引中实际用到的索引字段

一数据表staff 现有数据表staff 字符集utf8 并创建有一些字段单独索引及组合索引index age birth salary包含三个字段 sf age tinyint DEFAULT NULL sf birthday date

随机推荐

廉价的全闪存雷电 NAS 折腾笔记：NUC9 操作系统踩坑

上一篇文章中分享了关于低成本全闪存 NAS 的个人方案选择本篇文章来聊聊硬件相关部分以及软件的基础配置部分也聊聊雷电组网的踩坑之旅写在前面我使用的设备是 NUC9i5QNX 这台设备的硬件基础规格可以在 Intel ARK
2023年华为od机试 Java【刻录光盘备份】

前言 python代码链接 JavaScript代码链接题目有一系列文件需要通过光盘备份每张光盘的容量固定为500MB 文件的大小均为整数MB并且不超过500MB 文件不可拆分或分卷备份需要确定最少需要多少张光盘来完成备份输入
ngnix+lua+js埋点实现自定义日志采集

ngnix lua js埋点实现自定义日志采集 1 收集数据的页面 js埋点在想要手机数据的页面预先放一段js代码当用户发生行为时触发js方法收集数据发到后端 http 192 168 4 101 index html 这里的i
在Windons子系统ubuntu中安装ssh（保姆级教程）

1 什么是ssh SSH Secure Shell 是一种用于远程登录和安全文件传输的网络协议 SSH服务是在计算机上运行的服务程序它允许用户通过网络安全地远程访问计算机并执行各种操作以下是关于SSH服务的一些重要信息远程登录 SSH
流操作

StreamReader 与 FileStream 的区别用法有关StreamReader的内容参考http blog sina com cn s blog 796ffec50100te51 html StreamReader 旨在以一种
“互联网+”最可行的路径就是“社群+”

互联网最可行的路径就是社群 36氪的朋友们 2016 04 05 17 04 文章摘要商业正从物以类聚走向人以群分编者按本文作者卢彦原文来自微信公众号互联网思维 ID webthinking 36 氪经授权转载前不久阿里
【C++】通讯录管理系统

1 系统功能介绍与展示 2 创建项目 3 菜单功能代码封装函数显示该界面如 void showMenu 在main函数中调用封装好的函数 include
jmeter批量上传图片， csv文件参数化——详细讲解

我们在测试的过程中需要把图片放到请求中而且还需要不一样的图片批量修改图片后缀我们也可以吧文件生成我们想要的后缀 1 首先创建一个文本txt 在文本中输入 ren jpg png 然后把txt的文件修改成bat后缀的进行双击在
关于Altium Designer PCB元器件的3D封装

关于Altium Designer PCB元器件的3D封装虽然Altium Designer为我们提供了丰富的元件封装库资源但是在实际的电路设计中电子元器件技术的不断更新换代有些特定的元器件封装仍需要我们自行制作另外有时根据工程
python3 中 dict和list 效率比较

import time def count time func def int time args kwargs start time time time 程序开始时间 res func args kwargs over time time
给 Ubuntu 操作系统配置静态 IP

针对 Ubuntu 22 04 3 操作系统的静态 IP 配置一查看初始的网络信息查看网卡名称 ifconfig 查看网关信息 route n 二编辑网络配置文件编辑文件配置文件的名称可能不一样自己去 etc netplan
手把手教你Modelsim仿真【2020.4版本】

首先新建一个文件夹 test5 打开Modelsim 依次选择 File gt Change Directory 把目录选择到创建的 test5 文件夹创建库依次选择 File gt New gt Library 一般我们选择第三个库
软文营销如何吸引用户情感意识引起共鸣

当今互联网营销铺天盖地自网络开始普及后网络营销发展速度非常快然而我们需要在众多营销中取胜就需要技术创新不管平台如何变化有一个要素仍然至关重要写好广告文案因为文案内容才是读者了解你的关键所在今天178软文网小编将分享我们最好
大模型开发：从数据挖掘到智能应用

在当今的数字化时代数据的生成和处理已经成为一项重要的战略任务随着大数据技术的发展企业组织以及个人对海量数据的需求越来越大这也就催生了数据挖掘算法模型开发的快速发展数据挖掘算法模型开发是一种从大量数据中提取有价值信息的过程这些信
国服ps4如何修改服务器地址,国服ps4如何修改服务器地址

国服ps4如何修改服务器地址内容精选换一换本节介绍如何查看云服务器的mac地址云服务器的mac地址不支持修改登录Linux云服务器执行以下命令查看云服务器的mac地址 ifconfig查看MAC地址ifconfig登录Linu
【3分钟速读】运营到底是干啥的？

欢迎关注天善智能我们是专注于商业智能BI 人工智能AI 大数据分析与挖掘领域的垂直社区学习问答求职一站式搞定作者陈老师在咨询行业打拼了10 年在如何诊断经营问题建立分析体系解决专项问题上有超过30个大型项目积累与实战天
时间序列预测（一）基于Prophet的销售额预测

时间序列预测一基于Prophet的销售额预测小O 小H 有没有什么方法能快速的预测下未来的销售额啊小H Facebook曾经开源了一款时间序列预测算法fbprophet 简单又快速传统的时间序列算法很多例如AR MA ARIMA
创建对象的几种方式

一工厂模式工厂模式解决了创建相似对象的问题但却没有解决对象识别的问题怎样知道一个对象的类型 function createPerson name age job var o new Object o name name o age
走进大数据，感受大数据

摘要大数据时代已经到来现阶段我国大数据产业发展如何大数据应用领域在哪大数据价值在哪里带着这些疑问走进大数据感受大数据带来的神奇魔力关注作者需要大数据学习视频资料其他文章可以找到大师组织 2017年9月8日腾讯董事会主
shapley和树的shap

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档 shapley and shap Shapley交互阶的计算关于树结构Shap的计算 Shapley交互阶的计算首先一阶的计算公式二阶交互值计算三阶计算一般式

热门标签