uplift model增益模型相关术语概念名词汇总

2023-11-10

因果推断-增益模型综述 :http://proceedings.mlr.press/v67/gutierrez17a/gutierrez17a.pdf​​​​​​​

名词/缩写 英文全称 名词解释 备注
treatment   干预、实验组  
control   不干预、控制组  
uplift model uplift model 增益模型: 预测某种干预treatment的增量的模型  
CE   causal effect 因果效应:  用户在干预和不干预的情况下的提升,即干预前后结果的差值。
ACE Average Causal Effect 平均因果效应:  取所有用户的因果效应期望的估计值来衡量整个用户群的效果。  
ITE Individual Treatment Effect 个体因果效应()  
ATE Average Treatment Effect 平均因果效应 所有用户的因果效应期望。
CATE Conditional Average Treatment Effect 条件平均因果效应 所有用户的因果效应期望。
Conditional是指基于用户的特征。
CIA Conditional Independence Assumption 条件独立假设 用户特征和干预策略相互独立。
AB实验的两组样本在特征分布上基本一致,即满足CIA。
ATT   只关注treatment的ATE  
ATC   只关注control的ATE  
Meta-learning methods Meta-learning methods 元学习方法  
S-learner Conditional Outcome Modeling  (COM)   将treatment作为特征,干预组和非干预组一起训练,解决bias不一致的问题。
问题: 特征维度很高,干预/不干预只有1-dim,容易导致treatment效果丢失。
T-Learner grouped Conditional Outcome Modeling (Grouped COM / GCOM)   为解决COM中增益效果提升趋向于0的问题。模型加强了对T的权重,其他流程跟COM一样。
X-Learner     在T-learner基础上,利用全量的数据进行预测,主要解决Treatment组间数据量差异较大的情况。
R-learner   R-learner的思路将问题转化为定义损失函数R-loss的形式进行学习训练,更专注残差。  
标签转换方法 The Class Transformation Method  

适用于treatment、 outcome都是二分类的情况。通过将预测目标做转换,实现one model的预测。
解决实验组、对照组用户分组概率问题:
(1)数据重采样,个人建议下采样
(2)引入用户倾向分,即每个用户倾向于被分配到实验组、对照组的概率。

增量直接建模 Tree-Based Method    
分布散度     常见的分布散度有KL散度、欧式距离、卡方散度。
因果森林 CausalForest   因果森林的核心是把一个个建立好的因果树 causal tree(或 uplift tree)做组合ensemble,把每棵因果树计算出的干预结果取平均。
CTS算法 Contextual Treatment Selection    
基于神经网络的方法 NN-Based Method    
DragonNet      
uplift柱状图   计算流程:
(1)在测试集上,将实验组和对照组分别按照模型预测出的增量由高到低排序,根据用户占比,分别划分10等份,即Top10%, 20%,…100%
(2)分别计算Top10%, 20%,…100%的用户平均预测转化概率,即Avg(y-pred),预测分数的均值,然后相减作为这个十分位分组内的提升uplift,绘制柱状图
基尼曲线 Qini Curve 计算流程:
(1)在测试集上,将实验组和对照组分别按照模型预测出的增量由高到低排序,根据用户占比,分别划分10等份,即Top10%, 20%,…100%
(2)计算Top10%, 20%,…100%的Qini系数,生成Qini曲线数据(Top10%, Q(Top10%)),…(Top100%, Q(Top100%))

1、Qini系数计算公式:Q(i)
2、因为Qini系数分母是实验组和对照组的总样本量,如果样本量差异比较大,结果将变得不可靠。

调整Qini曲线 Adjusted Qini Curve 调整Qini曲线是为了避免实验组和对照组数据不均衡而导致Qini系数失真而设计的。

1、Aqini系数计算公式:

AUUC
增益曲线面积
Area Under the Uplift Curve  uplift曲线如何绘制?
使用AUUC评价模型时,优点是可以避免实验组和对照组用户数量差别较大导致的指标不可靠问题。
但,当分桶时,对照组边界点预估出的增量与实验组边界点的预估有较大差别的时候,Qini曲线和AUUC两个指标都不可靠。要选AUUC的另一个计算方法。

1、AUUC指标计算公式:G(i)

AUUC非平衡情况分析   如果实验组和对照组满足随机性,但不平衡,即不是1:1或 P(T=1|x)=q, q!=0.5概率。那么增益曲线uplift curve:  
AUUC优化-降低方差      
累积增益曲线 Cumulative Gain Curve   

1、指标计算公式:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

uplift model增益模型相关术语概念名词汇总 的相关文章

  • RecyclerView(一)—— ListView的使用

    ListView ListView在过去绝对可以称得上是Android中最常用的控件之一 几乎所有的应用程序都会用到它 由于手机屏幕空间比较有限 能够一次性在屏幕上显示的内容并不多 当我们的程序中有大量的数据需要展示的时候 就可以借助Lis
  • vscode给某行代码添加标签

    只有你习惯于一种编程工具风格 vscode几乎都能给你做的 Numbered Bookmarks 数字标签跳转类似与webstrom 定义 Ctrl SHIFT 数字 跳转 Ctrl 数字 vscode给某行代码添加标签 标注 用于代码间快
  • Qt使用QJSEngine执行脚本

    有时候需要进行一些计算 程序是使用c 来实现的 使用c 来进行计算不是很灵活 这时候可以使用脚本来进行计算 这样灵活 且易于扩展 写了一个简单的Demo进行验证 具体例子如下 include
  • Java - 带参的异常处理模块try(xxx){...}

    带资源的try语句 try with resource 的最简形式为 try Resource res xxx 可指定多个资源 do something try块退出时 会自动调用res close 方法 关闭资源 其实这样做的原因 主要是

随机推荐

  • mysql24,Mysql24之事务隔离级别和MVCC

    TOC 事前准备 为了故事的顺利发展 我们需要创建一个表 CREATE TABLE hero number INT name VARCHAR 100 country varchar 100 PRIMARY KEY number Engine
  • mmdetection 中 Mask Rcnn检测结果可视化(DICE计算、PR曲线绘制等)

    mmdetection中的Mask Rcnn是一个很不错的检测网络 既可以实现目标检测 也可以实现语义分割 官方也有很详细的doc指导 但是对新手来说并不友好 刚好之前笔者写的mmlab系列里面关于可视化都还没有一个详细的文档 也在此一并介
  • 逆向破解之破解补丁与劫持Dll

    破解补丁 前言 破解补丁的作用是修改程序内存地址的硬编码 以此来实现破解软件 这是常见的JE跳转用来判断注册码是否正确 若401108位置的汇编指令给Nop掉就能实现破解 编写代码 1 C语言 运行程序后输入要破解的程序进程ID inclu
  • yolov5源码解读--训练策略

    yolov5源码解读 训练策略 超参数解读 命令行参数 train 模型迭代 测试 超参数解读 hyp scratch yaml lr0 0 0032 初始学习率 lrf 0 12 使用余弦函数动态降低学习率 lr0 lrf momentu
  • spark入门小例子

    来源 我是码农 转载请保留出处和链接 本文链接 http www 54manong com id 1221 1 pyspark 2 spark shell spark网页管理页面 http 127 0 0 1 4040 jobs 3 设置日
  • Redis常见数据结构的常用命令及引用

    String 1 常用命令 字符串常用操作 SET key value 存入字符串键值对 MSET key value key value 批量存储字符串键值对 SETNX key value 存入一个不存在的字符串键值对 GET key
  • AVLTree-平衡二叉树-coming soon

  • php验证用户账号密码正确,php-检查用户名和密码是否正确

    因为我的代码是正确的 所以我总是得到回显 Username Passwordcorrect 用户名 密码是否匹配 我的问题是 我在下面的代码中为PHP总是回显 用户名 密码错误 而做错了什么 require privstuff dbinfo
  • jupyter notebook使用基础及其快捷键,包括对文档操作、cell操作、快捷键、markdown

    目录 Jupyter Notebook介绍 使用原因 基本操作 新建notebook文档 对文档的操作 cell操作 什么是cell Jupyter支持两种模式 鼠标操作 Jupyter快捷键操作 markdown演示 手动建导航 Jupy
  • 网络编程 - Java SSLSocketFactory 创建方式

    SSL TLS 认证需要服务端提供 KeyStore jks TrustStore jks 实现方式 优缺点 服务端提供 CA Client CRT Client Key 文件 缺点 服务端提供原始签名 不安全不建议采用 服务端提供 Key
  • linux $0命令,Linux:awk命令详解

    简单使用 awk 对于文件中一行行的独处来执行操作 awk F print 1 4 使用 来分割这一行 把这一行的第一第四个域打印出来 AWK命令介绍 awk语言的最基本功能是在文件或字符串中基于指定规则浏览和抽取信息 awk抽取信息后 才
  • 2023最新pycharm详细安装教程,小白必看

    一 python官网 Python官网主要有python的About 简介 Downloads 下载 Documentation 文档 Community 团体 Success Stories 成功案例 News 新闻 Events 事件动
  • 贪吃蛇智能版(专家)

    在高级版本的基础之上 主要针对以下问题进行了处理 当长度逐渐变成 超过100之后 随机wander 追尾有比较大的随机性 弄不好就把自己围死了 这个时候已经不能再看到实物马上就去吃了 在吃之前必须先调整好自身的状态 等到认为调整的差不多的时
  • 如何在sqlserver建立新用户并关联相应的数据库

    我们经常需要在数据库上建立有权限的用户 该用户只能去操作某个特定的数据库 比如该用户只能去读 去写等等 那么我们应该怎么在sqlserver上设置呢 下面的步骤有点长 只要一步一步跟着设置就行 方法 步骤 如果你没有开通sqlserver身
  • GoWeb开发-3.JWT

    1 导入依赖库 go get u github com dgrijalva jwt go 2 生成token import fmt github com gin gonic gin jwt github com dgrijalva jwt
  • 将树莓派上的文件发送到服务器,怎样将树莓派变成网络文件系统版本4服务器...

    简介 网络文件系统 NFS 可以同时在版本2 3 4中运行 NFS版本4 NFSv4 在NFSv2和NFSv3 我最喜欢的改进是 NFSv4使配置防火墙变得简单 因为NFSv4仅使用一个端口 默认为2049 而NFSv2和NFSv3使用4个
  • 搭建 llvm 学习环境

    1 下载llvm git clone https github com llvm llvm project git 因为国内网络的原因 clone的时候没有反应 可以多此 Ctrl C 重新 clone 2 下载安装cmake 注意 下载的
  • 毕业设计-基于学习元的双螺旋深度学习模型

    目录 前言 课题背景和意义 实现技术思路 一 基于学习元的深度学习支撑系统 二 双螺旋深度学习模型 三 深度学习的开放课程设计实践 实现效果图样例 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备
  • 网页打开摄像头_听说,考试的时候你打不开摄像头?

    近期真没什么可写的 赶在考试之前就来说一说雨课堂打不开摄像头如何解决吧 先推荐一个检测浏览器摄像头权限的网址 https assistant ceping com qrcode type 1 lng zh 如果在这个网址下摄像头一切正常 雨
  • uplift model增益模型相关术语概念名词汇总

    因果推断 增益模型综述 http proceedings mlr press v67 gutierrez17a gutierrez17a pdf 名词 缩写 英文全称 名词解释 备注 treatment 干预 实验组 control 不干预