首页  

风控的一些经验     所属分类 risk 浏览量 174
风控的底层逻辑在于有效地衡量用户的还款能力、还款意愿和多头借贷。
多头数据之所以如此重要,是因为某种层面上它能修正还款能力和还款意愿的计算。
真的有钱和借来的钱,在能力和意愿上是不一样的。

大数据风控怎么做,本质就是大数据怎么用的问题。两个用法。简单地用,是策略规则;复杂地用,是模型。

风控之道在于前中后的用户生命周期管理。贷前管理避免损失,贷中管理减少损失,贷后管理回收损失。

风控之术是什么呢?就相当于问风险管理部门每天的工作本质上是在做什么,当然是做策略和模型。
注意,策略做策略的事情,模型做模型的事情,切不可该通过策略做的事情硬要通过模型去做。

业务和风控的关系,就跟策略和模型类似,初期都是原则经验至上。经验的效益触顶,就要开始做精细化运营,这时候最需要大数据模型方案。


用户画像简单来说,就是用户信息的标签化。一个是基础属性,一个是风控属性。
基础属性的画像,重在了解你的客户;风控属性的画像,重在理解你的业务。

风控决策引擎本质上是一系列规则的集合,决策流程有两要素,一是规则清单,二是规则被执行的顺序。

模型也可以理解成一条规则,只不过它是将许许多多的弱变量组合成一个强评分。强变量用于规则,弱变量用于模型。
他们的本质都是对用户分层,方便将用户一分为二,使其通过或拒绝。

业务总会不断对策略进行迭代优化,这往往导致策略体系过于庞杂,怎么样从庞杂的体系中分清轻重是策略同学的核心能力。
平衡决策对通过率的影响和对风险的影响,对成本的影响和对收益的影响,是风控策略从业者需要培养的职业嗅觉。

我们无法说模型重要还是策略重要,这两者都很重要,没有必要分什么高下。但如果说模型思维和策略思维呢?一定是策略思维更重要,因为策略是更贴近业务的。


策略的三板斧总结起来就是分群、触达、额度定价。
年龄是分群,收入是分群,多头是分群,模型也是分群,是风险的分群。分群又是额度定价的关键。
别忘了触达,你还要做投放、做产品优化、做用户体验。关注转化的同时还要关注风险。

模型开发是为业务需求服务的,高效解决业务的难点和痛点,就是模型开发的护城河,而不是所谓的算法。如何对遇到的问题设计合理的解决方案,比模型本身重要的多得多。

如果你只会对确定的样本、确定的特征、确定的标签,建一个所谓的大数据模型,不管这个模型是LR,是XGB,还是神经网络,还是图算法,其实都是不够的。
风控是一个业务经验很重要的领域。

样本选择是最能体现模型开发定位和目标的,也是最吃功夫的部分。不同模型的开发,其他的有迹可循,唯有样本的选择是各有各的不同。

模型开发时我们总是在关心模型效果,但当模型开发完后,最重要的是稳定性。没有策略会盯着模型分的变动反复调整阈值的。有问题的信息千万不要用。



策略和模型之上,要做好监控。使用没有监控的模型,就像使用没有指针的钟表,它可能在工作,但你怎么知道呢?另外,监控一切容易,响应一切困难。

数据分析的三板斧,看趋势、看对比、看细分。解读监控报表亦如是。
光有一个数据是无意义的,比较才能使其有洞见。
怎么比?和过去比,和其他的比,分开了自己比。

线上如果出现问题,很难直接指向模型,因为复杂性其解释权都在模型同学手上。策略同学不要听他们的解释。
问题容易出在模型上面,但不是说“锅”都是模型同学的。如果模型和策略是分开的,还是配置个模型验证团队吧。

风控中,做一个新模型,或者一条新策略,都是要充分评估更优的。
迭代的模型要跟很多东西对比,首要对比的就是想要替换的模型。
策略的优化第一个要比的也是原策略。真正意义的ABTest在风控里不存在。

工作中,风控的节奏不如营销增长那边那么快,因为风险是后置的,无法去快速又高频地测试。


有征信数据和借款人的借贷历史数据,它就是判断一个借款人还款能力和还款意愿的强数据。
这些强数据就是反映一个人未来还款与否的最重要的指标,其他的大数据只能是一个补充。

因果关系很难,但相关关系很容易。我们从来不能很好地解释,这群人逾期的原因是什么。我们擅长计算,这群人具备这些特性,他们的逾期水平比较高。

模型是对简化目标的学习,简化目标就要符合你的业务目标,这跟产品的第一层是用户体验本质上是一样的。
真正的模型迭代有两种,一种是在简化目标下不断提升效果,另一种是让目标简化地更精准。


在信贷业务中,用到的黑名单也容易越积越多,这容易导致其失效,尤其在场景非常丰富的大厂。
我们可以对其中低风险的人群清退,就像失信被执行人履约完毕后也会被退出一样。
但归根结底,黑名单清退的价值没那么大。另外,黑名单清退的逻辑在于六个字的思想:不要轻视敌人。

对于一般公司而言,联合建模太麻烦了,往往不如直接接入标准产品。标准产品省去了联合建模的麻烦,同时还避免了建模中样本过少以及后续客群迁移导致过早失效的问题。

小贷公司的风控问题是,缺少自有数据,必须依靠三方数据源。
结果,绝大多数小贷公司都会陷入一个困境,就是引入一个新的数据源,测试效果好好的,一上线对通过率、坏账率一点提升都没有,甚至常常出现负面影响。
这是因为建模不能简单地圈定一个样本,一个数据源一个数据源往里面加去计算增益。
要与时俱进,用上最新的样本,迭代整个策略,如有必要下线有问题的数据源。

上一篇     下一篇
numpy 实用代码

信贷风控业务知识-001-信贷业务介绍-信贷基础指标和风险指标

信贷风控业务知识002-信贷风控架构简介

kafka-eagle 简介

信贷智能风控体系建设简介

信贷风控系统介绍