信贷风控中Vintage、滚动率、迁移率的理解

2023-11-04

风控业务背景

信贷风险管理是一门艺术,更是一门科学。资产质量分析中常会涉及到三个理论:

  • 账龄分析(Vintage Analysis):用以分析账户成熟期、变化规律等。
  • 滚动率分析(Roll Rate Analysis):用以定义账户好坏程度。
  • 迁移率分析(Flow Rate Analysis):用以分析不同逾期状态之间的转化率。

本文吸收了一些前人的优秀成果,力求系统介绍这三者的概念、计算逻辑和业务应用,希望能对大家有所帮助。

目录
Part 1. 基础风控指标概念
Part 2. Vintage Analysis
Part 3. Roll Rate Analysis
Part 4. 如何确定目标变量Y
Part 5. Flow Rate Analysis
Part 6. 坏账准备金的计算
Part 7. 总结
致谢
版权声明
参考资料

Part 1. 基础风控指标概念

为了更容易理解后续内容,我们先介绍一些基础的风控指标概念。

定义一:账龄(Month of Book,MOB)

资产放款月份。类似于婴孩一出生就有了年龄,一旦申贷订单被放款,也便拥有了账龄和生命周期。

  • MOB0:放款日至当月月底
  • MOB1:放款后第二个完整的月份
  • MOB2:放款后第三个完整的月份

MOB的最大值取决于信贷产品期限。如果是12期产品,那么该资产的生命周期是12期,MOB最大到MOB12。

例如,2019年11月13日放款的订单,2019年11月是MOB0,2019年12月是MOB1,以此类推。

定义二:逾期天数(Days Past Due,DPD)

逾期天数 = 实际还款日 - 应还款日。

DPDN+表示逾期天数 >= N天,如DPD30+表逾期天数 >=30天的资产

例如,若还款日是每月8号,那么9号就是逾期第一天。如果客户在10号还款,那么逾期2天。

定义三:逾期期数(M)

实际还款日与应坏款日之间的逾期天数,并按区间划分后的逾期状态。M取自Month on Book的第一个单词。(注:不同机构所定义的区间划分可能存在差异)

  • M0:当前未逾期(或用C表示,取自Current)
  • M1: 逾期1-30日
  • M2:逾期31-60日
  • M3:逾期61-90日
  • M4:逾期91-120日
  • M5:逾期121-150日
  • M6:逾期151-180日
  • M7:逾期180日以上。此时也被称为呆账(Bad Debts),会予以注销账户(write-off)

Part 2. Vintage Analysis

Vintage一词最初来源于葡萄酒业 。由于每年采摘的葡萄会受到日照、气温、降水等因素的影响,最终酿造的葡萄酒品质会存在差异。在窖藏一定年份后,葡萄酒的品质将趋于稳定,也就是品质成熟,这段年份数被称为成熟期(maturity)。

简便起见,我们以酒精浓度作为衡量葡萄酒品质的标准,约定:浓度越高,品质越好。首先,记录入窖年份作为该批次葡萄酒的标签,这也被称为Vintage或者Cohort。之后,我们将每年定期抽样测量酒精浓度,保存记录数据,如图1所示。

经过几年的数据积累,我们就可以绘制出酒精浓度随时间变化的Vintage曲线。俗话说,酒越酿越醇,Vintage曲线通常是单调递增的,如图1所示。

图 1 - 葡萄酒的Vintage曲线

我们可以利用Vintage曲线做什么呢?如图2所示,主要用途包括:

  1. 分析变化规律:评估不同年份的葡萄酒的品质随着窖藏时间推移的变化规律。某些年份的葡萄酒浓度在入窖第1年就能达到较高的水平,但上升缓慢;有些起点低,但上升快 。
  2. 确定最终品质:Vintage曲线最终稳定值,表明了这批葡萄酒的最终酒精浓度 。
  3. 确定成熟期:由图1可知,在入窖第6年后,酒精浓度稳定不变,可以确定成熟期是6年,我们最早在第6年就可以开桶品尝 。
  4. 分析影响因素:根据Vintage曲线特征,我们可以分析某个年份的葡萄所受到的环境影响因素,从而改善生产工艺。比如,由于某一年的光照不充分,糖分积累少,酒精浓度可能最终就比较低。我们就可以人工增加光照强度 。

图 2 - 葡萄酒的Vintage分析

在信贷领域中,我们也可以用Vintage曲线分析资产(portfolio)质量的成熟过程变化规律。为更容易理解,在此列举了Vintage分析过程中两个领域的对应关系,如图3所示。

图 3 - 葡萄酒和信贷行业的Vintage对比

遵循同样的分析思路,按账龄(MOB)长短对齐后比较,我们可以了解同一产品不同时期放款的资产质量。

  1. 确定资产质量:一般以逾期率来定义资产质量,也就是曲线平缓后对应的逾期率。
  2. 分析变化规律:资产质量(例如逾期率指标)的变化情况,如果前几期逾期率上升很快,那么说明短期风险没有捕捉住,欺诈风险较高;反之,如果曲线一直在上升,说明信用风险识别能力不佳。
  3. 确定账户成熟期:用来判断客户展现好坏的时间因素,从而帮助定义表现期。
  4. 分析影响因素:风控策略收紧或放松、客群变化、市场环境、政策法规等都会影响资产质量。分析影响因素,可以用来指导风控策略的调整。

求知的你肯定会疑惑,如果以逾期率来定义资产质量,那么逾期风险(目标变量Y)是如何定义的?如何确定M3,还是M6? 稍安勿躁,后续将会结合滚动率分析来揭晓谜底。

首先,我们来分析为什么要确定账户的表现期?在《风控特征—时间滑窗统计特征体系》一文中,我们提到过:

表现期越长,信用风险暴露将越彻底,但意味着观察期离当前越远,用以提取样本特征的历史数据将越陈旧,建模样本和未来样本的差异也越大。反之,表现期越短,风险还未暴露完全,但好处是能用到更近的样本。

图 4 - 观察点、观察期与表现期

例如,对于一个12期分期还款的信贷产品,理论上当用户在12期结束,并还清所有的钱后,我们才能定义为绝对的好客户;反之,我们只能说到目前为止是一个好客户,但并不能知道未来几期用户会不会逾期不还钱。

因此,我们需要确定一个合适的表现期能覆盖足够多的坏客户即可。

图 5 - 某12期信贷产品2018年的Vintage曲线

根据图5的信贷产品Vintage曲线,我们可以得到哪些信息呢?

  1. 账龄最长为12个月,代表产品期限为12期。随着12期结束,账户的生命周期走到尽头。
  2. 根据2018年5月放贷的订单完全走完账龄生命周期,而2018年6月却没走完,说明数据统计时间为2019年6月初
  3. 账龄MOB1、MOB2、MOB3的逾期率都为0,说明逾期指标为M4+(逾期超过90天)风险。
  4. 由放贷月份从2018年1月~12月的账户的最终逾期率都在降低,说明资产质量在不断提升,可能是因为风控水平在不断提升。
  5. 2018年5月相对于2018年1~4月的逾期率大幅度下降,说明该阶段风控策略提升明显。
  6. 不同月份放款的M4+在经过9个MOB后开始趋于稳定,说明账户成熟期是9个月

绘制Vintage曲线时,就不得不提到纵坐标中逾期率的定义。通常有两种计算口径:

  • 第一种,订单口径,逾期率 = 逾期订单数 / 总放贷订单数
  • 第二种,金额口径,逾期率 = 逾期金额 / 总放贷金额

目前互联网金融各家机构的口径定义存在差异,因此仅仅根据各家发布的Vintage曲线,有时并不能客观分析资产质量和风控水平。

Part 3. Roll Rate Analysis

滚动率分析就是从某个观察点之前的一段时间(观察期)最坏的状态,向观察点之后的一段时间(表现期)最坏的状态的发展变化情况,如图6所示。

⚠️注意:一般大家也习惯把vintage中的成熟期叫做表现期,因此出现一定的混淆。但意思是都是未来的一段时间窗。

图 6 - 客户逾期状态转化

滚动率分析的具体操作步骤为:

  • step 1. 确定数据源。一般利用客户还款计划表(repayment schedule)。
  • step 2. 选择观察点,以观察点为截止时间,统计客户在观察期(如过去6个月)的最长逾期期数,按最坏逾期状态将用户分为几个层次,如C、M1、M2、M3、M4+。
  • step 3. 以观察点为起始时间,统计客户在表现期(如未来6个月)的最长逾期期数,按最坏逾期状态将用户分为几个层次,如C、M1、M2、M3、M4+。
  • step 4. 交叉统计每个格子里的客户数,如图6中表1所示。
  • step 5. 统计每个格子里的客户占比,如图6中表2所示。
  • step 6. 为了排除观察点选择时的随机影响,一般会选择多个观察点。重复step1 ~5。

例如,选择观察点为2018年6月30日,我们取10,000个客户作为研究对象,统计该10,000个客户从观察期到表现期的最大逾期状态的变化情况,如图7所示。

图 7 - 滚动率分析矩阵

观察图7,我们可以发现以下规律:

  1. 逾期状态为M0的客户,在未来6个月里,有96%会继续保持正常状态,4%会恶化为M1和M2;
  2. 逾期状态为M1的客户,未来有81%会回到正常状态,即从良率为81%,有7%会恶化,13%会保持M1状态;
  3. 逾期状态为M2的客户,从良率为23%,有39%会恶化为M3和M4+;
  4. 逾期状态为M3的客户,从良率为14.7%,有60.7%会恶化为M4+;
  5. 逾期状态为M4+的客户,从良率仅为4%,有80%会继续保持此状态。

因此,我们认为历史逾期状态为M4+的客户已经坏透了,几乎不会从良。为了让风控模型有更好的区分能力,需要将客户好坏界限尽可能清晰,可以定义:

坏用户(bad)= 逾期状态为M4+(逾期超过90天)

Part 4. 如何确定目标变量Y

在风控建模中,由于是有监督学习,我们非常关心如何定义合适的目标变量Y?这就需要结合滚动率分析和Vintage分析,两者的分工在于:

  • 滚动率分析用于定义客户的好坏程度
  • Vintage分析用于确定合适的表现期

定义目标变量Y的具体操作步骤为:

  • step 1. 利用滚动率分析定义坏客户,例如上文案例中定义:M4+为坏客户
  • step 2. 以M4+作为资产质量指标,统计Vintage数据表,绘制Vintage曲线。目的是分析账户成熟期,例如上文案例确定:账户成熟期是9个月。

你可能还是会比较疑惑,为什么还需要通过Vintage分析来确定表现期?

这是因为:虽然滚动率分析确定了M4+作为坏的程度,但是对于12期的产品,有些账户是在前4期MOB(也就是MOB1 ~ MOB4,经过4个表现期)就达到M4+,有些是在后几期才达到M4+。

对于这个Vintage里所有的账户,我们的目的是抓住尽可能多的坏客户。

现在进一步补充Vintage曲线的绘制过程:如图8所示,对于这10,000个账户,以MOB1为起点,把前N个MOB作为一个窗口,滑窗统计坏客户率,得到图5-表1中的Vintage数据,并绘制Vintage曲线。我们可以发现:经过9期,我们几乎能够抓住所有的坏客户。

图 8 - 不同客户的逾期状态(红=逾期,绿=正常)

因此,我们将两者结合起来,定义:

  • Bad = 账户经过9期表现期后,逾期状态为M4+(逾期超过90天)。此时 [公式] 。
  • Good = 经过9期表现期,但未达到M4+逾期状态。此时 [公式] 。
  • Intermediate = 未进入9期表现期,账户还未成熟,无法定义好坏,也就是不定样本。

Part 5. Flow Rate Analysis

迁移率分析法(Flow Rate)也叫做净流量滚动比例法(Net Flow Rate),能形象展示客户贷款账户在整个生命周期中的变化轨迹,也是预测未来坏账损失的最常用的方法。

核心假设为:处于某一逾期状态(如M2)的账户,一个月后,要么从良为M0账户,要么恶化为更坏的下一个逾期状态(如M3)。

迁移率 = 前一期逾期金额到下一期逾期金额的转化率

一般缩写为M0-M1、M4-M5等形式,例如:

  • M0-M1 = 当月进入M1的贷款余额 / 上月末M0的贷款余额
  • M2-M3 = 当月进入M3的贷款余额 / 上月末M2的贷款余额

迁移率分析的具体操作步骤为:

  • step 1. 定义逾期状态,如前文所述的M0、M1、M2等。
  • step 2. 计算各逾期状态之间的迁移率,如M0-M1、M2-M3等。
  • step 3. 计算不同月份(也可称为Vintage)的平均迁移率。目的是对本平台在不同时期的资产的迁移率有整体的认知。
  • step 4. 根据平均迁移率和不良资产回收率,计算净坏账损失率。

接下来,我们以数值案例(非真实业务数据)展示上述过程。

图 9 - 迁移率分析

图9-表2中,2月份的逾期M1资产只能从1月份的正常M0资产滚动而来,因此从逾期M0资产向M1的转化率为 [公式] 。

以此类推,我们可以计算所有月份的资产恶化率。黄色部分为不良资产的恶化迁移路径,其计算口径为:

  • 截止1月末,正常M0资产为 [公式] 元,这是起点。
  • 截止2月末,1月末的正常M0资产中有 [公式] 恶化为逾期M1资产。
  • 截止3月末,2月末的逾期M1资产中有 [公式] 恶化为逾期M2资产。
  • 截止4月末,3月末的逾期M2资产中有 [公式] 恶化为逾期M3资产。
  • 截止5月末,4月末的逾期M4资产中有 [公式] 恶化为逾期M5资产。此时已过催收黄金期(90天以内)。
  • 截止6月末,5月末的逾期M5资产中有 [公式] 恶化为逾期M6资产。这可能采用了委外催收、司法手段等催收策略,效果显著。
  • 截止7月末,6月末的逾期M5资产中有 [公式] 恶化为逾期M7资产。此时将视为不良资产,打包转卖给第三方公司,这样就能回收部分不良资产,减少损失。

通过迁移率,我们可以清晰观察到每个Vintage的资产在各逾期状态的演变规律。

图9-表2中,我们从横向比较每个月的迁移率,发现不完全一样。这是因为随着时间推移、外在宏观经济环境、内部政策等变化而产生一定的波动。我们可以利用这些数据:

  1. 观察迁移率的发展轨迹,监控坏账的发展倾向和催收效果。
  2. 通过对多个月份的迁移率计算平均值,从而使迁移率更加稳定。

Part 6. 坏账准备金的计算

呆帐风险是信贷机构必须面对的风险,主要来源于信用风险和欺诈风险等。为了应对未来呆帐的可能,信贷机构一般都会设定一个储备资金,这就是坏账准备金(Bad Debt Reserve)。那么我们该如何计算坏账准备金?

一般做法是,把未清偿贷款余额乘以一定的准备金比例(Reserve Ratio)所得。可以理解,资产逾期等级越高(越差),准备金比例也应该越高,因为恶化为呆帐的可能性也更高。如图10所示,正常M0资产恶化为呆帐的可能性最低,因此我们预留的准备金比例也就最少。

我们总结下计算坏账准备金的步骤为:

  • step 1. 统计未清偿贷款金额的分布,也就是M0~M6状态分别对应的资产余额。
  • step 2. 为每个逾期状态的资产分配一个准备金比例。
  • step 3. 每个子项目的准备金金额 = 未清偿贷款余额 x 准备金比例。
  • step 4. 每个子项目的准备金金额相加,得到最终的准备金。

图 10 - 坏账准备金计算示例

你或许会问,这里最关键的准备金比例是如何给出的?

由于坏账准备金是用来覆盖预期的未来呆帐损失的,准备金比例必须等于处于各个逾期状态的资产未来演变为呆帐的比例

回到迁移率分析中,我们发现从正常M0资产迁移至逾期M7资产(呆帐)需经过7次迁移,如图11所示。那么,我们只要把各个状态之间的转化率相乘,不就得到准备金比例了?

图 11 - 各逾期状态的迁移率和毛坏账率计算

因此,我们定义正常M0资产对应的毛坏账损失率,也就是迁移到呆帐的转化率为

毛坏账损失率 =  [公式]

在本案例中,正常M0资产对应的毛坏账损失率为:

[公式]

在实际中,信贷机构会将不良资产打包转卖给第三方公司,这样就能回收部分不良资产,减少损失。因此,我们定义净坏账损失率为:

净坏账损失率 = 毛坏账损失率 - 不良资产外卖回收率

由于M7不良资产的平均回收率为 [公式] ,则可计算净坏账损失率为:

[公式]

同理,我们可以计算正常资产到不同逾期状态资产的毛损失率和净损失率如下:

图 12 - 毛损失率和净损失率

根据图12所示的损失率表,我们定义:

  • 当月应计拨备额 = SUM(净坏账损失率 * 月末应收账款余额)
  • 拨备率 = 当月应计拨备额 / 总资产金额

其中,拨备率是用来预防不良资产的发生而准备的金额的比例。拨备率应越低越好。拨备率越高说明风险越大,损失越大,利润越小。

图 13 - 2018年7月的资产预计期望损失计算

在本案例中,当月应计拨备额为65421元,如图13所示。拨备率为:[公式]

Part 7. 总结

本文所整理的主要知识点包括:

  1. Vintage、滚动率、迁移率的概念和区别。
  2. 如何根据数据分析来确定风控建模中的好坏定义。
  3. 拨备率的概念,以及如何根据迁移率来计算拨备率。

致谢

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

信贷风控中Vintage、滚动率、迁移率的理解 的相关文章

随机推荐

  • windows环境源码编译VLC2.2.1

    VLC是一款开源的跨平台的多媒体音频 视频播放器 支持多种格式 提供多种解码器 插件 有时候我们需要修改某些功能 插件不满足 那只能修改源码并重新编译了 在linux平台的编译相对简单 windows环境下编译相对就繁琐些了 本文就已成功编
  • 实用调试技巧【下篇】

    本文章是在 Visual Studio 2022 VS2022 编译环境下进行操作讲解 文章目录 3 2 调试的时候查看程序当前信息 3 2 1 查看临时变量的值 3 2 2 查看内存信息 3 2 3 查看调用堆栈 3 2 4 查看汇编信息
  • springboot整合jpa,步骤详细(图文结合讲解)

    编译器Intellij IDEA 关系型数据库MySql 5 7 对象关系映射框架JPA jpa可以通过实体类生成数据库的表 同时自带很多增删改查方法 大部分sql语句不需要我们自己写 配置完成后直接调用方法即可 很方便 1 首先新建spr
  • 索引与存储过程

    1 索引 1 概念 索引 是针对数据所建立的目录 作用 可以加快查询速度 负面影响 降低了增删改的速度 2 案例 设有新闻表15列 10列上有索引 共500W行数据 如何快速导入 1 把空表的索引全部删除 2 导入数据 3 数据导入完毕后
  • 03.模块一 前端基础html、css、js

    文章目录 HTML 详解 1 HTML介绍 规范 1 1 介绍 1 2 使用记事本开发第一个网页 1 3 下载和安装 VSCode 1 3 1 下载地址 1 3 2 初始中文设置 1 3 3 创建项目 1 3 4 运行页面 1 3 5 修改
  • 简要概述Spring中注解@Autowired和@Resource的区别

    在了解注解之前 首先需要明白什么是Bean 凡是子类及带有方法或属性的类 都要加注册Bean到Spring Ioc的注解 如 Component Repository Controller Service 在Spring中 标识一个 符号
  • ChatGPT的出现会不会导致底层程序员失业?我问了下多御ChatGPT

    它是这样说的
  • 1.2【Mask-RCNN训练自己的数据集】---- Part Two: 模型训练(全部流程总结+部分释义)

    二 编写模型训练代码 打开MaskRCNN文件夹下的samples文件夹 存在以下四个文件夹 下述模型训练代码将对shapes文件夹下的train shapes ipnyb 进行修改 这里是jupyter的文本格式 笔者不太习惯使用这种格式
  • Linux input 子系统详解

    1 模块概述 1 1 相关资料和代码研究 drivers input include uapi linux input event codes h 2 模块功能 linux核心的输入框架 3 模块学习 3 1 概述 Linux输入设备种类繁
  • [转] DSP缓存机制

    本文主要以DSP讲解cache原理 但原理与CPU是相通的 故转载 原文地址 DSP 缓存机制 桑迪亚哥的博客 CSDN博客 dsp的cache DSP 缓存机制 注 本文说明的DSP基于TI c6000系列的C66x DSP 目录 DSP
  • 分类模型之职员离职分析

    今天要带来的是机器学习中几种重要的分类模型 分别是 逻辑回归 支持向量机 决策树 随机森林这四种算法模型 这里就不主要介绍模型背后的理论知识了 直接上数据 在数据分析中再来谈这些算法模型 今天要讨论的是Kaggle上的公司职员离职数据集 这
  • JS 简单实现电子时钟

    时钟的确是非常简单的一个功能 我们只需要通过js编写一个方法来获取时间的时分秒 再用定时器每隔一秒进行刷新即可 注意 通过Date类拿到的时分秒直接拼接起来可能是这样的 8 2 3 而我们想看到的效果应该是 08 02 03 所以这里我们会
  • 对于区块链,各个国家对它又是一种什么态度呢?

    在这场席卷全球的区块链技术 数字资产变革中 区块链作为一种颠覆性的技术 它的出现对各国政府提出了新的问题 对于这个问题 各国政府给出了怎样的答复 区块链在各国发展的政策环境又如何 并且我们除了要了解本国的立场之外 也需要掌握其他国家的态度
  • 谁发明了区块链?谁是中本聪?

    区块链技术首次在由中本聪 Satoshi Nakamoto 撰写的题为 比特币 对等电子现金系统 的论文中介绍 在这篇文章中 中本聪描述了区块链技术的基础 所有区块链创新都可以追溯到中本聪 他是区块链和比特币的发明者 但是 谁是中本聪 没人
  • 使用vscode搭建vue项目并引用element-ui

    1 环境准备 Visual studio code nodejs vue cli yarn 2 新建项目 1 打开Visual studio code 打开一个你想要创建项目的文件夹 2 打开集成终端如下图所示或者使用快捷键 3 在终端中输
  • LevelDB.NET 使用

    LevelDB是google实现的非常高效的kv数据库 多数是和redis比较 这里记录下如何使用 新建项目 Nuget添加类库 通过反编译发现运行时是 NET 4 0 这里我用4 5测试需要选择64位平台 代码 写数据 db Put Wr
  • python3排序 sorted(key=lambda)

    python3排序sorted key lambda 当待排序列表的元素由多字段构成时 我们可以通过sorted iterable key reverse 的参数key来制定我们根据那个字段对列表元素进行排序 key lambda 元素 元
  • 【华为OD统一考试B卷

    华为OD统一考试A卷 B卷 新题库说明 2023年5月份 华为官方已经将的 2022 0223Q 1 2 3 4 统一修改为OD统一考试 A卷 和OD统一考试 B卷 你收到的链接上面会标注A卷还是B卷 请注意 根据反馈 目前大部分收到的都是
  • StringBuilder.append()与String的"+"的效率PK

    如果String通过 来拼接 如果拼接的字符串是常量 则效率会非常高 因为会进行编译时优化 这个时候StringBuilder的append 是达不到的 如果将String的 放在循环中 会创建很多的StringBuilder对象 并且执行
  • 信贷风控中Vintage、滚动率、迁移率的理解

    风控业务背景 信贷风险管理是一门艺术 更是一门科学 资产质量分析中常会涉及到三个理论 账龄分析 Vintage Analysis 用以分析账户成熟期 变化规律等 滚动率分析 Roll Rate Analysis 用以定义账户好坏程度 迁移率