番茄风控第二期《风控数字化全流程训练营》学员课后分享:
大家好我是L,刚刚从事量化风控的时间不久,很高兴参与了番茄风控前两期的训练营,特别是策略跟模型方面,颇有收获,今天借这个机会跟大家分享下相关的风控知识,如文中有不妥的请大家指教
一.滚动率分析
滚动率分析–找出坏客户的定义。
1.1 实现详细过程
滚动率:表示客户从A时间点到B时间点,还款状态从a到还款状态b的转化比率;是两个快照数据之间还款状态的变化情况。
滚动率有两个方向,向前滚和向后滚;
向后滚是指客户逾期等级更高了(即客户继续逾期),
向前滚是指客户逾期等级变低了或者变成正常客户了(即逾期客户有还款行为)。
计算步骤:(比如计算月底下月月底的滚动率)3月31日4月30日滚动率。
Step1 :在3月31日,判断所以资产<记做资产集A>的还款状态;(C/M1/M2……)
Step2: 在4月30日,判断所以资产<记做资产集A>的还款状态;(C/M1/M2……)
Step3: 计算各个迁徙率的值;
计算公式:
(例如c~m1):3月31日C的客户且在4月30日处于M1状态的客户数/3月31日C的客户数。其他指标以此类推。
在3月31日C状态的客户有5个;这5个客户中,4月31日M1状态客户有2个,因此C~M1滚动率为40%;
(例如m2~m1):3月31日m2的客户且在4月30日处于M1状态的客户数/3月31日m2的客户数。其他指标以此类推。
Ø 在3月31日M1状态的客户有2个;这2个客户中,4月31日M1状态客户有1个,M2状态客户有1个,因此M1M2滚动率为50%,M1M1滚动率为50%;
Ø 在3月31日M2状态的客户有2个;这2个客户中,4月31日M1状态客户有1个,M3状态客户有1个,因此M2M1滚动率为50%,M2M3滚动率为50%;
平均滚动率:
在实际应用中,经常使用滚动率来判断在哪个逾期阶段的客户是“坏客户”,以确定建模时,怎么定义y=1的目标变量。这里就需要求出一段时间内各个还款状态之间的平均转化率。
步骤如下:
首选,需要定义客户范围,比如2018年1月~2018年6月放款的A产品用户;
其次,定义一个统计周期范围,比如2018年6月~2018年12月;(统计这半年内,上述客户范围各个状态之间的平均滚动率);
再次,计算每个月月底至下一个月月底的各个状态之间转化的客户数量;(有6个如下的表)
然后,将客户数据叠加起来,也就是将6张表格里面对应位置的数据求和。意味着所有客户被重复利用计算6次(平均化)。
最后,利用最后生成的交叉表格,计算各个迁徙率的值;
1.2 结果解读:
滚动率结果分析:上一期滚动到下一期更坏的比例
横轴:本期逾期情况,分别为逾期0期、逾期1期、一直到逾期8期
纵轴:上月逾期情况,分别为逾期0期、逾期1期、一直到逾期8期
红线:上月逾期0期,滚动至下月逾期0期的比例99.52%,但是有0.41%的人群下一期还不上钱了。
上月逾期1期,滚动至下月逾期2期的比例51.54%
上月逾期2期,滚动至下月逾期3期的比例79.16%
上月逾期6期,滚动至下月逾期7期的比例32.12%
建模的目的:
1.样本量充足:选择M3+作为标准,确定Y=1占比10%左右
2.找到足够坏的客群
选择M3+的客群作为坏定义,有90.12%的人不会变的更好。如果选择M2作为定义,有20%还会变好。
2.账龄分析
账龄分析作用:根据滚动率分析已经确定坏客户定义为M3+。那么选择多久时间作为坏客户的风险暴露期呢?这个问题大家可以思考下,老师在课程中也有回答~
建立模型目的:
1.样本要足够充足
2.要有足够的风险暴露期。让坏的彻底的客户充分暴露出来纳入建模样本中,因此做滚动率分析和账龄分析。
选择多长时间做为判断M3的风险暴露期,如果有100万客户,有50万客户作为建模样本,不知道风险情况怎么样。有的3个月达到M3,有的12个月达到M3。
折线图横纵坐标含义:
横坐标:账期,MOB:我们把放款的月份叫做基准月,之后追踪的每个月称为Month on Book (MOB)
纵坐标:M3+客群在各个账期的占比。
结果分析:
选择两个时间段2014年、2015年的客群的表现情况。
从2014年1月开始,M3+客群占比逐渐增高。达到一定时间点后逐渐平稳。在MOB12已经放缓了增速,到MOB18逐渐平缓。
2015年时间点的样本也是在MOB12已经放缓了增速。到MOB18逐渐平缓。
观察不同时间点客群在未来风险暴露情况作为预测周期。政策和人群是在不断变化的,要选择不同时间点的人群观察。
不完全收敛情况:每个月都有风险暴露出来,参考巴赛尔协议。
建模,观察点
问题:一般几万到十几万的建模样本中,Y=1占比需要达到多少合适?
答:最理想情况10%-13%。占比<1%,KS值跳动会很大,会影响整体模型评估的。
不建议建模型,不稳定:
Y=1的人群占比很少,可以用不平衡处理方法。达到1%-2%。
三.课堂问题
另外,老师也对以下问题做了解答,不知道大家对以下问题都是否熟悉掌握?
A. 不同还款方式计算逾期天数的方法?
B. 截止到月末的逾期天数和某一期的逾期天数是一个概念吗?比如分析时点是4.30号,3.20和4.20的还款计划都没还,3.20账期逾期天数是4.30-3.20=41天,那么,4.20账期逾期天数是4.30-4.20=10天,还是41天?计算滚动率用借据的逾期天数还是账期的逾期天数?
C. 为什么会有上月M1下月M3的情况呢?上一期逾期30天内下一期经过30天,为什么会出现逾期60天以上呢?
D. 上月逾期6期本月逾期7期比例32.12%,向下滚动突然降低,可能是什么原因?
E. 红线:2014年1月份的客群是指什么?是2014年1月份发放贷款的客群吗?跟踪这部分客群未来几年的表现。
~原创文章
…
end