2017 Uri Shalit & Fredrik D. Johansson：Jobs

2023-11-08

1986年，Lalonde公开的一个数据集，被因果推理社区作为了基准数据集。在该数据集中，干预(即Treatment)为是否接受就业培训，结果(Outcomes)是收入和就业状况。2005年，Smith & Todd结合了国家对工作工程统计的观测性数据，扩展成了一个更大的数据集——随机分组使得因果效应的ground truth可以被估计。这项数据集共包含8个协变量，比如说年龄、教育程度、先前收入…本文在此基础上，采用2002年Dehejia & Wahba提出的特征集，构建了一个二元分类任务，Jobs，其目标是去预测是否未来失业。基于2005年Smith & Todd的研究工作，本文用到的数据样本来自LaLonde数据集(干预组：297；控制组：425)和PSID对比组(控制组：2490)。截至研究结束，共有482名受试者(约15%)失业。我们按比例56/24/20随机划分train/validation/test数据集，并做了10次实验，然后将其结果平均。

因为所有干预组成员(297)都是原始随机样本E(LaLonde数据集)的一部分，因此我们可以估计干预组的平均干预效应： A T T = ∣ T ∣ − 1 ∑ i ∈ T y i − ∣ C ∩ E ∣ − 1 ∑ i ∈ C ∩ E y i \mathrm{ATT}=|T|^{-1} \sum_{i \in T} y_{i}-|C \cap E|^{-1} \sum_{i \in C \cap E} y_{i} ATT=∣T∣−1∑i∈Tyi−∣C∩E∣−1∑i∈C∩Eyi，其中 C C C代表控制组。估计误差即为： ϵ A T T = ∣ A T T − 1 ∣ T ∣ ∑ i ∈ T ( f ( x i , 1 ) − f ( x i , 0 ) ) ∣ \epsilon_{\mathrm{ATT}}=| \mathrm{ATT}-\frac{1}{|T|} \sum_{i \in T}\left(f\left(x_{i}, 1\right)-\right.\left.f\left(x_{i}, 0\right)\right)| ϵATT=∣ATT−∣T∣1∑i∈T(f(xi,1)−f(xi,0))∣。在这个数据集上我们无法评估 ϵ P E H E \epsilon_{\mathrm{PEHE}} ϵPEHE，因为我们没有可用于 I T E ITE ITE评估的 g r o u n d ground ground t r u t h truth truth。因此，为了评估模型 I T E ITE ITE估计的性能，我们选取的指标为：策略风险。 I T E ITE ITE估计器采用策略在训练时的策略风险被视为平均损失(loss)。在本文设计中，对于模型函数 f f f，我们的干预策略为： π f ( x ) = 1 ， f ( x , 1 ) − f ( x , 0 ) > λ \pi_{f}(x)=1，f(x, 1)-f(x, 0)>\lambda πf(x)=1，f(x,1)−f(x,0)>λ；我们的控制策略为： π f ( x ) = 1 ， o t h e r w i s e \pi_{f}(x)=1，otherwise πf(x)=1，otherwise。该策略风险即为： R P o l ( π f ) = 1 − ( E [ Y 1 ∣ π f ( x ) = 1 ] ⋅ p ( π f = 1 ) + E [ Y 0 ∣ π f ( x ) = 0 ] ⋅ p ( π f = 0 ) ) R_{\mathrm{Pol}}\left(\pi_{f}\right)=1-\left(\mathbb{E}\left[Y_{1} | \pi_{f}(x)=1\right] \cdot p\left(\pi_{f}=1\right) +\mathbb{E}\left[Y_{0} | \pi_{f}(x)=0\right] \cdot p\left(\pi_{f}=0\right)\right) RPol(πf)=1−(E[Y1∣πf(x)=1]⋅p(πf=1)+E[Y0∣πf(x)=0]⋅p(πf=0))。我们可以采用下式估计随机试验子集的策略风险值 R ^ P o l ( π f = 1 − ( E [ Y 1 ∣ π f ( x ) = 1 , t = 1 ] ⋅ p ( π f = 1 ) + E [ Y 0 ∣ π f ( x ) = 0 , t = 0 ] ⋅ p ( π f = 0 ) ) \hat{R}_{\mathrm{Pol}}\left(\pi_{f}=1-\left(\mathbb{E}\left[Y_{1} | \pi_{f}(x)=1, t=1\right] \cdot p\left(\pi_{f}=1\right)+\mathbb{E}\left[Y_{0} | \pi_{f}(x)=0, t=0\right] \cdot p\left(\pi_{f}=0\right)\right)\right. R^Pol(πf=1−(E[Y1∣πf(x)=1,t=1]⋅p(πf=1)+E[Y0∣πf(x)=0,t=0]⋅p(πf=0)) 干预阈值 λ λ λ的函数风险如下图所示，按干预比例排列。
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

2017 Uri Shalit & Fredrik D. Johansson：Jobs 的相关文章

【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
利用CHAT写实验结论

问CHAT 通过观察放置在玻璃表面上的单个水滴人们可以观察到水滴充当成像系统探究这样一个透镜的放大倍数和分辨率 CHAT回复实验报告标题利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率一实验目的通过对比和测量研究和探索玻
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
利用CHAT上传文件的操作

问CHAT autox js ui 上传框 CHAT回复上传文件的操作如果是在应用界面中的话由于Android对于文件权限的限制你可能不能直接模拟点击选择文件一般来说有两种常见的解决方案一种是使用intent来模拟发送一个文件路径
打造完美人像，PixCake像素蛋糕助您一键修图

您是否曾经为自己的人像照片需要进行繁琐的修图而感到困扰是否曾经想要打造出完美的自拍照却不知道该如何下手现在我们为您推荐一款强大的人像处理技术修图软件 PixCake像素蛋糕 PixCake像素蛋糕是一款基于AI人像处理技术的修图软件
动物姿态识别＋数据集＋代码

目录一级目录二级目录三级目录介绍关键点定义背景环境安装安装
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
AI在保护环境、应对气候变化中的作用

对于AI生命周期数据领域的全球领导者而言暂时搁置我们惯常的AI见解和AI生命周期数据内容产出来认识诸如世界地球日这样的自然环境类活动日似乎是个奇怪的事情我们想要知道数据是否真的会影响我们的地球环境简而言之是确实如此但作为一
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
AI 赋能绿色制冷，香港岭南大学开发 DEMMFL 模型进行建筑冷负荷预测

近年来城市化进程加速所带来的碳排放量骤增已经严重威胁到了全球环境多个国家均已给出了碳达峰碳中和的明确时间点一场覆盖全球全行业的绿色革命已经拉开序幕在一众行业中建筑是当之无愧的能耗大户其中又以暖通空调 Heating

随机推荐

47 最佳实践-性能最佳实践-PV-qspinlock

文章目录 47 最佳实践性能最佳实践 PV qspinlock 47 1 概述 47 2 操作指导 47 最佳实践性能最佳实践 PV qspinlock 47 1 概述 PV qspinlock主要是针对虚拟化CPU超分场景自旋锁的优化
R语言3.13 绘图

plot函数 plot 可绘制数据的散点图曲线图等 plot x y 其中x和y是向量生成x和y的散点图 plot x 其中x是一时间序列生成时间序列图形如果x是向量则产生x关于下标的散点图如果x是复向量则绘出复数的实部与虚部
C/C++/QT中的字符串

目录 C语言中的字符串 C 语言中的字符串 Qt中的字符串 C语言str系列库函数 sizeof strlen length 和size 字符串中含有 r n 打印时不换行问题 C语言中的字符串 C语言不存在字符串数据类型其通过一个以 0
Xilinx FPGA未使用管脚上下拉状态配置（ISE和Vivado环境）

文章目录 ISE开发环境 Vivado开发环境方式1 XDC文件约束方式2 生成选项配置 ISE开发环境 ISE开发环境可在如下Bit流文件生成选项中配置右键点击Generate Programming File 选择Process
windows虚拟机安装Mac OS系统（操作图解）

背景因为工作需要学习ios开发但是苹果电脑申请了还没审批下来所以想着先搭建一个虚拟机来熟悉开发环境安装环境 windows vmware 16 Pro 一准备工作 1 vmware 16 Pro 下载 2 unlocker 下载地址
隐藏WiFi信号的小技巧

隐藏WiFi信号方法首先用手机或电脑连上路由器的WiFi网络在浏览器地址栏输入路由器登陆地址并打开地址一般在路由器的底部都有标注的输入用户名与密码很多路由器默认的账号密码都是admin 进入路由器管理界面找到无线设置然后找到
java版本微信机器人使用教程V1.0

大家好我是雄雄欢迎关注微信公众号雄雄的小课堂现在是 2023年5月10日17 57 02 免费的云桌面每个人都能领三个月用来跑机器人还是很不错的领取连接前言历经好多天 java版本的微信机器人终于写完了初版了接下来开放注册
面向对象课程学习

设计一般流程黑盒 1用例分析白盒 2 识别类分析阶段只identify 问题领域的类设计阶段可能添加软件世界特有的类或者 3 识别类之间的关系关联泛化聚合组合依赖 4 画顺序图结合用例图完善类图类图是结构设计顺序
工具使用：ImageTools图片处理（ImageMagick）

需要注意的是在mac和linux上不要添加imageMagickPath 和设置 convert setSearchPath imageMagickPath public class ImageTools ImageMagick的路径 p
python实验1

在pycharm中编写一个Python程序导入数学模块math 从键盘输入一个整数然后调用Math中的数学函数sqrt 计算该数的平方根输出结果第一种 a float input 请输入一个整数 x a 0 5 print x 运行
Vulkan是什么？和我一起完成一个简单的Vulkan应用程序

Vulkan是什么和我一起完成一个简单的Vulkan应用程序在本章你将学到 Vulkan以及它背后的基本原理如何创建一个最简单的Vulkan应用程序在本书其余部分将使用到的术语和概念本章将介绍并解释Vulkan是什么我们会介绍
敲七游戏-java

题目描述写程序无聊玩个游戏从1开始喊数数到含7或者是7的倍数的要拍键盘那么问题来了请你输出7和7的倍数还有包含7的数字例如 17 27 37 70 71 72 73 输入一个整数N N不大于30000 输出统计出不大于N
蓝库云｜一文搞懂什么是MES（制造执行系统），制造业该如何选择

MES Manufacturing Execution System 是一种将制造过程可视化并为工人提供指导和支持的系统它的优势在于可以优化人员机器和设备等资源消除制造对个人技能的依赖在本文中蓝库云将以通俗易懂的方式说明MES的概
【CV】扩散模型（Diffusion Models）

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
Apple（苹果）忘记安全问题答案怎么办？

方法一通过救援电子邮件找回其实针对忘记Apple ID安全提示问题的答案这个问题苹果官方有一个专门的指导页面 http support apple com kb HT6170 viewlocale zh CN 里面有非常详细
buuctf-misc(部分)

爱因斯坦附件下载下来是一张图片先用winhex看下典型的压缩文件形式 binwalk 分离前先把上次的output文件夹删除老一套加密的文件但这次题目没有给我们具体的提示先猜测一手题目名爱因斯坦是4位先尝试一下4位数纯数字密
java基础01：==与equals

Java数据类型在执行过程中存储在两种不同形式的内存中栈和堆它们通常由运行Java虚拟机 JVM 的底层平台维护基础类型是直接在栈中分配的引用类型是引用了堆中的内存地址对比的是栈中的值基本数据类型是变量值引用类型是堆中内存对象
@ControllerAdvice注解的使用

系列文章目录 SpringBoot框架实现邮件发送上 SpringBoot框架实现邮件发送下 Java中获取控制台输出的数据 Spring Cache的详细使用 Redis 文章目录系列文章目录前言一 ControllerAdvi
Idea｜Failed to configure a DataSource: ‘url‘ attribute is not specified and no embedded datasource c

问题排查 1 问题背景 2 问题截图 3 问题分析 4 问题解决号外后续补充的解决办法 5 一句话复盘 1 问题背景从仓库拉去代码以后通过idea进行import 往事俱备启动服务然后出现了一个错误提示信息 Descripti
2017 Uri Shalit & Fredrik D. Johansson：Jobs

1986年 Lalonde公开的一个数据集被因果推理社区作为了基准数据集在该数据集中干预即Treatment 为是否接受就业培训结果 Outcomes 是收入和就业状况 2005年 Smith Todd结合了国家对工作工程统计的观

2017 Uri Shalit & Fredrik D. Johansson：Jobs

2017 Uri Shalit & Fredrik D. Johansson：Jobs 的相关文章

随机推荐

热门标签