推荐系统（四）——因果效应uplift model系列模型S-Learner，T-Learner，X-Learner

2023-11-18

在之前的文章中我们介绍了使用因果推断中的去除混杂和反事实的相关理论来纠正推荐系统中的偏差问题。在这篇文章中主要和大家分享uplift model相关知识和方法。

例子

小夏的商铺在上次请了明星代言后，销量有所上升，但是他不清楚是不是每个人都对这个明星感冒，有的用户可能没看到广告也打算购买。如果小夏可以给部分用户推送明星代言广告，就可以节约一些成本了（机智的小伙伴可能已经发现了，这里就是一个反事实推断的过程，即如果不展示广告会是什么样呢？）。这里就可以用uplift model来建模。

基础知识

uplift model的作用是去探究因果效应（causal effect），即上述例子中展示与不展示广告的作用有多大。但是一般而言我们是只能得到一方面的数据集，即当前状态下要么是展示了广告，要么是没展示广告。
treatment(T)：在对象上进行的干预，即do，展示与不展示广告
variable(X)：出treatment之外自带的属性特征，如年龄、性别等，这些属性多半是不受干预影响的，即无论是否展示广告，用户的性别特征都不会改变
ITE：individual treatment effect，单个用户的效应， I T E = Y 1 ( x ) − Y 0 ( x ) ITE=Y_1(x)-Y_0(x) ITE=Y1(x)−Y0(x)
ATE：average treatment effect，整体的平均效应， A T E = E ( Y 1 ( x ) − Y 0 ( x ) ) ATE=E(Y_1(x)-Y_0(x)) ATE=E(Y1(x)−Y0(x))

S-Learner

在这里插入图片描述

通过现有模型（LR，GBDT，NN等）对干预和不干预的数据进行训练，在预测的时候分别对该用户被干预和不被干预时的P进行预测计算，相减后便是ITE
I T E = E [ Y ∣ X = x , T = 1 ] − E [ Y ∣ X = x , T = 0 ] ITE=E[Y|X=x,T=1]-E[Y|X=x,T=0] ITE=E[Y∣X=x,T=1]−E[Y∣X=x,T=0]

S-learner的优点在于他可以使用现有的模型，并且只依赖于一个模型，避免了多模型的累积误差
缺点在于他并没有对uplift直接建模，而是间接的做减法来得到，需要额外的特征工程

T-Learner

在这里插入图片描述

利用干预后的数据集和未干预的数据集分别训练两个模型，然后计算uplift
I T E = E [ Y 1 ∣ X = x ] − E [ Y 0 ∣ X = x ] ITE=E[Y_1|X=x]-E[Y_0|X=x] ITE=E[Y1∣X=x]−E[Y0∣X=x]

优点和S-Learner一样可以使用已有的模型，并且它不需要太多的特征工程工作
缺点就是存在双模型累积误差，当干预组和对照组之间的数据量差异较大，即不平衡时，对结果影响较大

X-Learner

通过交叉训练的方式，解决T-Learner中数据量差异问题。和T-Learner一样先用干预和不干预的数据训练两个模型分别得到 μ 1 = E [ Y 1 ∣ X = x ] \mu_1=E[Y_1|X=x] μ1=E[Y1∣X=x]和 μ 0 = E [ Y 0 ∣ X = x ] \mu_0=E[Y_0|X=x] μ0=E[Y0∣X=x]
用干预组的模型预测不干预的数据，用不干预的模型预测干预的数据得到 D 1 = Y 1 − μ 0 ( X 1 ) D^1=Y^1-\mu_0(X^1) D1=Y1−μ0(X1)， D 0 = μ 1 ( X 0 ) − Y 0 D^0=\mu_1(X^0)-Y_0 D0=μ1(X0)−Y0相当于去预测被干预的人，如果不被干预购买的概率；以及未被干预的人，如果施加干预购买的概率。然后计算他们的差值作为需要拟合的数据
以上述D为目标，新建两个模型， τ 1 = E [ D 1 ∣ X ] , τ 0 = E [ D 0 ∣ X ] \tau_1=E[D^1|X],\tau_0=E[D^0|X] τ1=E[D1∣X],τ0=E[D0∣X]，以此拟合他们的差值。
通过加权得到uplift,g(x)计算权重的函数，例如可以用倾向性得分来作为函数。下式可以看一个极端情况，g(x)=1时，

g ( x ) τ 0 + ( 1 − g ( x ) ) τ 1 g(x)\tau_0+(1-g(x))\tau_1 g(x)τ0+(1−g(x))τ1

优点是解决对照组和实验组之间数据不平衡的问题
缺点是多模型，存在误差的积累；在T-Learner的基础上还有两个模型，计算成本高
更多内容欢迎关注“秋枫学习笔记”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

随机推荐

钩子函数介绍和总结

Author 快来救救我 ps 快乐废宅文章目录前言一钩子函数 Hook 是什么理解特点举例钩子类型钩子程序组成部分钩子操作流程钩子函数的回调函数最后三参考文章前言我看了其他博客有些对钩子函数讲述的篇幅要不太
IBM Worklight开发环境安装

1 安装jdk1 6以上版本 2 下载安装mysql http ftp iij ad jp pub db mysql Downloads MySQL 5 1 mysql noinstall 5 1 62 win32 zip 3 下载mysq
成为黑客第一步：从这五本书开始

如果您想学习黑客并成为道德黑客那么这些最好的黑客书籍将带你走上正轨学习黑客如果你是一个完整的初学者并不是一件容易的事虽然网上有很多资源但是黑客资源往往很少因此阅读书籍通常很有帮助黑客可能会被不道德地使用还可能对个人和公司造
当HDF5需要重新创建大量group和dataset但是又提示原来的group已经存在怎么办

描述我在创建tff数据集的时候程序里面有循环写到hdf5需要根据某类名字创建group dataset 但是我有的时候会发现这段代码有问题我需要修改一下循环里面的某些东西然后再重新run 这个时候会提示创建的group或者datase
C++ 去掉字符串前后的空格

基本思路先去掉字符串头部的空格再去掉字符串尾部的空格实现方式一 include
ICLR 2023高分论文！ToMe：你的视觉Transformer可以更快！

点击下方卡片关注 CVer 公众号 AI CV重磅干货第一时间送达点击进入 gt CV微信技术交流群转载自极市平台作者科技猛兽导读这篇文章提出了一种无需训练即可加速 ViT 模型提高吞吐量的方法 Token Mergin
C语言static和extern关键字

1 static static修饰的变量自始至终只有一块空间当前文件才能使用生命周期是从定义开始直到程序结束全局变量的定义是在 c文件中但是声明全局变量是在 h中 static 静态型用它定义的变量自动初始化为0值或空值常用于
Django开发过程中的一些bug及解决方法

在使用django开发一个交易平台的过程中遇到各种各样的问题其中有比较复杂的问题也有疏忽导致的比较简单的bug 记录下来希望有所帮助错误 A model can t have more than one AutoField Asse
Unity3D方向键控制人物移动的代码

代码 var v Input GetAxis Vertical var h Input GetAxis Horizontal transform Translate transform forward Time deltaTime move
有人用ChatGPT月入十万了！我们整理了70+款可以免费使用的AI工具

策划丨KK 制图丨邬海雯 ChatGPT风靡全球人人可用小红书上有关ChatGPT的笔记已有10w 篇相关话题浏览量也达到了1 12亿次其中讨论最为热烈的要数 ChatGPT使用教程当然类似的话题还包括教你如何使用Midjo
docker部署mall商城

文章目录一学习网址二 mall的docker部署 1 docker环境安装 2 部署harbor 3 Mysql安装 4 部署redis 5 nginx安装 6 RabbitMQ安装 7 Elasticsearch安装 8 Logst
[Python人工智能] 二十.基于Keras+RNN的文本分类vs基于传统机器学习的文本分类

从本专栏开始作者正式研究Python深度学习神经网络及人工智能相关知识前一篇文章分享了循环神经网络RNN的原理知识并采用Keras实现手写数字识别的RNN分类案例及可视化呈现这篇文章作者将带领大家用Keras实现RNN和LSTM的
LeetCode 125. Valid Palindrome

class Solution object def isPalindrome self s type s str rtype bool intable string punctuation outtable len intable s s
【Python】用Python写MT4的自动交易脚本

原理使用MQL4原生库调用ZERO MQ作为消息服务端使用其它语言如Python作为客户端调用接口 Github地址 https github com ns2250225 py mt4
spring IoC容器初始化简单分析

首先分享一篇文章对于IoC思想的理解主题我对IoC DI的理解 http www iteye com topic 1122310 我认为里面最重要的一段话如下理解IoC容器问题关键控制的哪些方面被反转了 1 谁控制谁为什么叫反
查看Windows以及linux操作系统的CPU核数、位数、内存大小

win7系统开始就分为64位和32位什么位的操作系统一般是由用户的硬件配置决定 32位系统最大只能支持3 5GB内存如果在32位系统中使用的是4GB或者更大容量内存电脑只可以识别到3 4GB可用而64位系统最大可以支持128GB大
校园无线网络服务器,某校园无线网络覆盖设计方案.doc

PAGE PAGE 43 无线局域网技术建议书 2009年9月目录 TOC o 1 3 h z u HYPERLINK l Toc240424971 1概述 PAGEREF Toc240424971 h 3 HYPERLINK l T
在jupyter中操作matplotlib的相关操作（一）

一什么是GUI 图形用户界面 Graphical User Interface 简称 GUI 又称图形用户接口是指采用图形方式显示的计算机操作用户界面二今天学习了matplotlib工具的绘图功能具体包括导入matplotlib
目标服务器无响应,Android：org.apache.http.NoHttpResponseException：目标服务器无法响应...

我的Android应用使用HttpClient HttpGet来访问REST API 我也设定了 httpGet addHeader Authorization Basic basicAuth 将Base64编码的用户名密码发送到服务
推荐系统（四）——因果效应uplift model系列模型S-Learner，T-Learner，X-Learner

在之前的文章中我们介绍了使用因果推断中的去除混杂和反事实的相关理论来纠正推荐系统中的偏差问题在这篇文章中主要和大家分享uplift model相关知识和方法例子小夏的商铺在上次请了明星代言后销量有所上升但是他不清楚是不是每个人都对