数据分析36计(九):倾向得分匹配法(PSM)量化评估效果分析

2023-11-06

1. 因果推断介绍

如今量化策略实施的效果评估变得越来越重要,数据驱动产品和运营、业务等各方的理念越来越受到重视。如今这方面流行的方法除了实验方法AB testing外,就是因果推断中的各种观察研究方法。

“统计相关性并不意味着因果关系”,数据分析工作经常遇到归因分析问题,又因为种种原因而无法进行AB testing直接随机分组实验比较结果。举一些例子:

  • 在 feeds 流里刷到一个新推荐策略的内容的用户留存更高,他们的高留存是因为这个推荐策略导致的吗,这个策略究竟对留存的提升有多大效果?

  • 上周投放了某游戏广告的用户登录率更高,他们的高登录率有多大程度是由广告带来的,有多大程度是由于他们本身就是高潜力用户?

在以上这类案例中,我们需要分析某个策略(干预treatment)对结果的影响情况,从而探究其因果效应。那么可以利用已有的用户行为数据来进行观察研究分析。而观察研究中最重要的一个理念是:反事实框架,即和我们能够观测到的现实情况相反的一种状态。在于反事实框架下进行因果推断的原理是这样的:变量 X 对变量 Y 变化的因果效应可以表达为,当 X 成立时 Y 的结果与 X 不成立时 Y 的反事实结果之间的差异,如果这种差异存在且在统计上显著,则称变量 X 对变量 Y 是有因果效应的,否则二者之间就不存在因果关系。因此因果推断的难点在于我们无法对每个用户同时观测到两个状态下的结果。

一个粗暴的思路是将实验组和对照组的样本做一下 “匹配”。例如,对于实验组的每一个样本,我们都去对照组里找一个一模一样的样本。当样本属性全部都是离散的,并且属性的维度(个数)很小的时候,这么做也许是可以的。当样本属性里有一些连续变量或者当样本属性的维度很高时,这么做太粗暴了,大部分人是找不到匹配对象的。因此“倾向得分匹配”可以用来解决寻找匹配对象的难点问题。

倾向得分匹配PSM是因果推断中的一种统计学方法,用于处理观察研究的数据。在观察研究中,由于种种原因,数据偏差和混杂变量较多。倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。PSM是处理观察性研究(observational study)的经典方法。

2. PSM原理

“倾向性得分” 的定义很直观,是一个用户属于实验组的 “倾向性”:e(x)=Pr[T=1|X]=Pr[T=1]。具有不同特征(Corvariates)的用户被干预(treatment)的概率应该相等。直观来说,对于倾向性得分相同的一群用户,treatment 和特征是独立的,treatment 和潜在结果也是独立的,即做到实验中的随机性要求。理论上,如果我们对每一个实验组用户都在对照组里匹配一个得分相等(要求有点严苛)的用户,我们就能得到同质的实验组和对照组,就可以假装我们做了一个 A/B Test 了,接着就可以随意地进行组间比较了。倾向得分法(PS)主要有分层、匹配和加权三种方法。这里倾向得分匹配法属于匹配方法。

上面这段话具体实施起来,可以分为以下几个步骤。

1、倾向性得分估算:倾向性得分怎么估算?

2、倾向性得分匹配:怎么用得分完成匹配?

3、平衡性检查:怎么知道匹配效果?

4、因果效应估算:匹配后,怎么从匹配后的两组用户中得到因果效应?

5、敏感度分析:混淆变量的选择等主观的一些分析是否会得到一致的分析结论?

Step 1: 倾向性得分估算

这一步直接就是建模问题,因变量为是否被干预Treatment,自变量为用户特征变量。套用LR或者其他更复杂的模型,如LR + LightGBM等模型估算倾向性得分。

Step 2: 倾向性得分匹配

有了每个用户的倾向性得分,针对目前的实验组用户,匹配得到一个接近相同的对照组。

1、匹配用的得分:可选原始倾向性得分 e(x) 或者得分的 logit,ln(e(x)/(1−e(x)))。

2、修剪(trimming):先筛选掉倾向性得分比较 “极端” 的用户。常见的做法是保留得分在 [a,b]这个区间的用户,关于区间选择,实验组和对照组用户得分区间的交集,只保留区间中部 90% 或者 95%,如取原始得分在 [0.05,0.95]的用户。

3、匹配(matching):实验组对对照组根据得分进行匹配的时候,比较常见的有以下两种方法。nearest neighbors: 进行 1 对 K 有放回或无放回匹配。

radius: 对每个实验组用户,匹配上所有得分差异小于指定 radius 的用户。

4、得分差异上限:当我们匹配用户的时候,我们要求每一对用户的得分差异不超过指定的上限。

Step 3: 平衡性检查

怎么衡量 “配平效果 “呢?比较直观的是看倾向性得分在匹配前后的分布、以及特征在匹配前后的 QQ-Plot。匹配后的实验组和对照组的倾向性得分分布更加接近,变量分布也更接近。量化指标 Standarized Mean Difference (SMD)。SMD 的一种计算方式为:(实验组均值 - 对照组均值)/ 实验组标准差。一般如果一个变量的 SMD 不超过 0.2,一般就可以认为这个变量的配平质量可以接受。当一个变量的 SMD 超过 0.2 的时候,需要凭经验确认一下那个变量是不是没有那么重要。

Step 4: 因果效应推断

我们的目标是推断实验组的平均干预效应 ATT (Average Treatment Effect on the Treated)。ATT 的定义为 ATT=E[Y1−Y0|T=1]。现在我们已经有一对接近同质的实验组和对照组了,有很多方法可以用来估算 ATT 。可以直接比较匹配后的实验组和对照组,也可拟合一个由干预和用户特征预测观察结果的线形模型,看看干预 T 的系数是多少。

Step 5: 敏感性检查

敏感性分析主要的目标是衡量当混淆变量(特征)不满足非混淆假设(unconfoundedness )时,分析结论是不是稳健的。简单的做法是去掉一个或者多个混淆变量重复上面的过程。

3. PSM方法使用实例,附R代码

产品经理在会上展示新加了某功能后的用户复购数据。其中使用新功能的用户群复购率比未使用的用户群高20%。于是认为该功能提高了用户复购率,想在产品上全面推广该功能。作为数据分析师如何去评估分析该效果?

数据描述:

数据主要包括三方面:用户的特征变量、是否使用功能,是否发生复购。(这里不直接把数据给到大家,可以尝试用自己工作的数据。)

结果展示:

匹配数量
1116
处理组(使用功能)复购率
0.24
对照组(未使用功能)复购率 0.13
均值差异
0.11***

结果描述:

按照1:1的匹配比例,最终匹配上1116对用户数据。其中处理组中的用户复购率为24%,对照组为13%,两组的差距显著。因此从数据角度证明该功能确实能提高复购率。但是归因为功能提高的复购率应该为11%,而不是20%。

R语言参考代码链接:

https://github.com/Serena-TT/PSM/blob/master/PSM/propensity_score_matching.R

4. 学习资料

一般在工作中应用场景比较复杂,涉及多分组情况,倾向得分法主要有分层、匹配和加权三种方法。而加权方法中的逆概率加权处理方法(IPTW)更适用于多分组的情况。以下为学习中用到的参考资料。

PSM和IPTW的教学视频:

《A Crash Course in Causality: Inferring Causal Effects from Observational Data》链接地址:https://www.coursera.org/learn/crash-course-in-causality

论文:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3710547/

R分析包:

https://cran.r-project.org/web/packages/twang/vignettes/mnps.pdf

数据分析付费社群现优惠进入。

长按图片扫描二维码直接查看内容

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据分析36计(九):倾向得分匹配法(PSM)量化评估效果分析 的相关文章

  • Django计算机毕业设计个性化大学生图书推荐系统(程序+LW)Python

    该项目含有源码 文档 程序 数据库 配套开发软件 软件安装教程 项目运行 环境配置 Pychram社区版 python3 7 7 Mysql5 7 HBuilderX list pip Navicat11 Django nodejs 项目技
  • Linux进行AES加密每次结果都不一致并且解密失败报错

    1 现象 windows操作系统下进行 123456 的AES加密 encrypted message is below QLNYZyjRnKF zxAjzDt lw decrypted message is below 123456 阿里
  • [数值分析拟合]Matlab三次样条插值拟合数据

    三次样条插值是一种运用极为广泛的工程插值算法 本文章编写的函数默认使用端点处的导数值代替给定的两端点的导数值使用三转角构造法进行插值 该函数也可传入端点导数数值进行分析 对数据进行方便而迅速的拟合 但是目前没有三弯矩构造法 一 三次样条插值
  • Qt信号槽——传递自定义数据类型

    Qt信号槽 传递自定义数据类型 Qt的信号槽机制支持传递int short double等C语言的基本类型的变量 也可以传递Qt自己的数据类型 但是在传递用户自己定义的数据类型 或其他数据类型是需要进行注册的 原因 当一个signal被放到
  • 解决python打包的exe程序运行报错闪退不留痕迹问题

    打了exe 运行的时候往往会因为找不到文件而报错闪退 此时根本不知道程序问题出在哪里 也因为程序执行太快而抓不到屏 最简单的方法如下 1 打开已打包好的exe文件目录 2 资源管理器输入cmd 运行命令行程序 3 命令行窗口内运行exe程序
  • JDBC与Mybitabs实习笔记

    JDBC与mybatis学习 JDBC的使用 1 导入依赖jar包 2 加载驱动类 3 创建连接对象 4 创建传输对象 SQL的执行器 将SQL语句传输给SQL服务器 5 执行SQL语句 6 关闭资源 1 导入依赖jar包 去mvnreoi
  • oracle存储过程----mybatis传入参数调用存储过程查询

    上一篇的链接是 oracle存储过程 异常的写法介绍 有这样的需求 比如共有表B1 B17 17张表 现在要求传入年度 行政区划 查询出所有符合条件的B1 B17的所有记录 当然 仅查询这些表中共同有的字段 因为这算是跨表查询了 一般我们写
  • vue基础入门

    1 vue简介 1 1 什么是vue 官方概念 Vue 读音 vju 类似于view 是一套用于构建用户界面的前端框架 1 2 vue 的特性 vue 框架的特性 主要体现在如下两方面 数据驱动视图 双向数据绑定 数据驱动视图 在使用了 v
  • 用 卡莱特A35播放盒子 在局域网内更新单行文本

    将播放盒和led正常连接之后 1 到官方网下载配套软件PlayerMaster 下载开发文档 2 使用配套软件 PlayerMaster 找到并查看目标设备的ip 3 在开发文档中找到 ColorlightRESTfulAPI V1 9 中
  • hive分桶表详解

    为什么要用分桶表 单个分区或者表中的数据量越来越大 当分区不能更细粒的划分数据时 所以会采用分桶技术将数据更细粒度的划分和管理 分区提供了一个隔离数据和优化查询的便利的方式 但是当分区的数量过多时 会产生过多的小分区 这样会给namenod
  • RedisTemplate集合使用说明-opsForList(二)

    1 leftPush K key V value 在变量左边添加元素值 Java代码 redisTemplate opsForList leftPush list a redisTemplate opsForList leftPush li
  • centos安装openssl

    安装环境 操作系统 CentOs6 3 OpenSSL Version openssl 1 0 0e tar gz 目前版本最新的SSL地址为http www openssl org source openssl 1 0 0e tar gz
  • IDEA Artifacts:Error during artifact deployment的问题:

    在本地启动tomact服务器的时候 总会出现这样的问题 我的这个项目的多工程 一个工程下面有好多依赖工程 首先确保项目是有这个蓝色图标 如果没有 如果没有在project strucure Modules 点击 导入module 然后下一步
  • 一句话木马、security_file_priv、into outfile、my.ini、sqli-labs-Less7

    sqli labs Less7闯关会用到一句话木马 http 127 0 0 1 Less 7 id 1 union select 1 2 into outfile C hackfiles sqli labs master Less 7 m
  • typec转usb不识别u盘_U盘插入电脑没反应?只需一招,教你轻松解决USB无法识别的问题!...

    说到U盘大家会想到什么呢 其实U盘作为我们日常生活中最为常用的USB设备 用处十分的多 除了日常的资料的存储 转移之外 它还可以作为系统重装的重要工具 是不是没想到它那么厉害呢 不过呢 意外的事情 说来就来 也没法挡住 U盘作为经常使用的工
  • java中json字符串移除指定属性

    java中json字符串移除指定属性 选择正确的jar包 刚开始下载了json lib 2 2 jdk15 jar包 但是程序报找不JSONObject JSONArray类 在网上找json移除属性时找不到对应的方法 网上头说使用json
  • 2020蓝桥杯模拟——长草

    1 题目描述 小明有一块空地 他将这块空地划分为 n 行 m 列的小块 每行和每列的长度都为 1 小明选了其中的一些小块空地 种上了草 其他小块仍然保持是空地 这些草长得很快 每个月 草都会向外长出一些 如果一个小块种了草 则它将向自己的上
  • win10远程连接win7连接不上去的处理办法 发布时间:2020-04-15

    win10远程连接win7连接不上去的处理办法 发布时间 2020 04 15 12 39发布者 系统城 lufang浏览数 1227 很多用户在使用win10远程桌面的时候 想要去连接win7系统的电脑 却发现自己电脑出现了连接不上的问题
  • Android Studio中的SDK Manager使用

    前言 网上的开源项目中使用的Build Tools的版本可能和自己本地的版本不一致 如果本地没有对应的版本 可能会出现编译报错的问题 关于项目的BuildTools的版本设置在build gradle中 便已报错如下图 解决BuildToo
  • php接入企业微信

    企业微信 现在来讲应该是一个很常见了的功能了 下面 我就以tp6来给大讲下接入企业微信的小demo吧 首先 在common php的公共方法里面写入下面两段代码 function sendRequest url 用curl请求获取acces

随机推荐

  • java图片验证码在服务器上返回乱码问题

    本机上没有问题 部署在阿里云服务器上都几个月了都没有问题 上传过一次代码后突然验证码就显示为看不懂的符号了 然而代码对此并没有影响的 打印生成的验证码 String word vcu produceNumAndChar length LOG
  • ES集群节点宕机导致shard unassigned解决方案

    ES集群概况 1台master节点 4台data节点 9个shards 问题 一台data节点宕机 导致5个分片处于unassigned状态 集群状态变为red 无法自动rerouting 解决步骤 1 查看所有节点的日志信息 通过日志 我
  • 开源数据目录管理工具_Java开发中用到的数据库迁移工具(flyway)

    什么是数据库版本管理 任何web软件和应用程序都需要强大的数据库管理工具 因此开发者选择一款合适的数据库管理工具尤为重要 本文列出了几款好用的数据库管理工具 有些并非开源或免费 以供开发者们参考选择 做过开发的小伙伴们都知道 实现一个需求时
  • ***没有规则可以创建“XXX”需要的目标“XXX”问题的解决方案

    在第4季 上学期 专题2 U Boot新手入门中 1 在Linux中解压uboot tq2440 tar gz 2 tar xvzf uboot tq2440 tar gz 3 进入 uboot tq2440 4 make TQ2440 c
  • 软件加密系统Themida常见问题集锦—Themida是否支持命令行保护?

    Themida是先进的Windows软件保护系统 它被用于满足软件开发人员对于所开发应用程序安全保护的需求 使其远离被先进的逆向工程和软件破解的危险 通过下载Themida 我们集中在软件保护器所具有的主要弱点 从而提供了解决这些问题的完整
  • jdbc oracle多数据源,JdbcTemplate 配置多数据源

    有时候需要对接第三方厂商的数据库或者视图 我们不想让多数据源入侵我们现有的项目 那么可以试下JdbcTemplate 这里以Oracle视图为例 先确定下对方Oracle版本 然后引入对应版本的pom org springframework
  • SNKr:创造新的潮圈文化 将区块链与时尚潮流结合

    直播内容整理 关于SNKr SNKr以 Real Recognize Real 为核心愿景 是一个由区块链赋能的潮流文化生态社区项目 由SWELL公司发起 SNKr致力于连接潮流文化中的 真 玩家与 真 产品 通过loT和区块链技术帮助品牌
  • AcWing110. 防晒

    输入样例 3 2 3 10 2 5 1 5 6 2 4 1 输出样例 2 解析 按照右区间排序 优先满足小的 include
  • python读取图片的几种方式

    opencv的像素值在 0 1 0 1 show的时候转换到 0 255 import cv2 img cv2 imread imgfile cv2 imshow img win name img cv2 waitKey 0 无限期等待输入
  • 不要自称为程序员

    如果有我可以添加到每个工程教育的一门课程 它不涉及编译器或门或时间复杂度 这将是您工业101的现实 因为我们不教他们和许多不必要的痛苦和折磨这个结果 这后立志要为你作为一个年轻的工程师的职业生涯中的自我介绍 填写在您的教育差距 就如何在 现
  • TMPGEnc 4.0 XPress(小日本4)优化安装教程

    小日本4 TMPGEnc 4 0 XPress 是小日本2 54的升级版本 与小日本2 54之间本来还有一个3 0 版本 不过3 0 没有产生太大影响即升级到4 0 版本 尽管是小日本2 54的升级版本 但3 0 以后此软件便属于全新开发
  • VirtualBox安装OpenWRT虚拟机,及Kernel panic - not syncing: Attempted to kill init故障排除

    编译或下载镜像文件 openwrt x86 generic Generic combined ext4 img gz 解压 gunzip d openwrt x86 generic Generic combined ext4 img gz
  • c++构建正态分布的随机数

    最近编程的时候遇到一个问题 需要用c 来产生一个满足正态分布的的随机数 用c 产生一个均匀分布的随机数很容易 但是满足正态分布还是有点懵逼的 然后就在网上搜一些资料 发现有三种方法可以产生正态分布的随机数 但是看别人从理论上的推导 感觉还是
  • node——使用Nginx + Node.js部署你的网站

    Nginx是一个高性能的HTTP和反向代理服务器 反向代理就是通常所说的web服务器加速 它是一种通过在繁忙的web服务器和internet之间增加一个高速的web缓冲服务器来降低实际的web服务器的负载 Nginx由俄罗斯程序员利用C语言
  • python的动态加载的一个注意地方

    先描述一下我的问题背景 然后给出错误发现 最终给出解决办法 1 我有很多python文件 并且这些文件内容会按照一定周期被更新但是文件名字不变 并且每个文件内都有一个一样的class的名字 需要我去动态调用 我的调用方法是使用的python
  • Spring-03 Aop简介,实现原理,基于ProxyFactoryBean实现Aop,基于AspectJ开发的实现

    Spring 03 1 SpringAop简介 AOP的全称是Aspect Oriented Programming 即面向切面编程 也称面向方面编程 它是面向对象编程 OOP 的一种补充 目前已成为一种比较成熟的编程方式 aop 解决的问
  • C语言——白盒测试

    深入理解白盒测试的基本方法 运用基本路径测试法设计测试用例 1 掌握白盒测试技术中基本路径测试法的基本步骤 2 训练针对具体程序运用基本路径测试法设计测试用例的能力 测试代码 DEVcpp 源代码 点击此处可下载 include
  • Android 自动化触发GC

    问题 最近有个小需求 能通过自动化对app进行GC回收 对于app的处理无外乎主动调用System gc 或者使用adb命令直接进行GC回收 解决方法 方法一 在代码里的某个方法调用System gc 如我申明一个receiver 然后通过
  • linux:SecureCRT SSH连接报错 Key exchange failed. No compatible key exchange method

    问题 配置ssh后提示 Key exchange failed No compatible key exchange method The server supports these methods curve25519 sha256 cu
  • 数据分析36计(九):倾向得分匹配法(PSM)量化评估效果分析

    1 因果推断介绍 如今量化策略实施的效果评估变得越来越重要 数据驱动产品和运营 业务等各方的理念越来越受到重视 如今这方面流行的方法除了实验方法AB testing外 就是因果推断中的各种观察研究方法 统计相关性并不意味着因果关系 数据分析