欢迎光临散文网 会员登陆 & 注册

人行征信2.0介绍与特征开发-长达15页新版个人征信报告完整版曝光

2022-05-26 18:03 作者:python风控模型  | 我要投稿

自从2020年1月20号征信1.0下线之后,之前的各个使用客户征信的机构纷纷将自己的征信特征系统切换到征信2.0。还有很多家是使用的征信指标做的模型,因为这次征信版本升级很多内容作了更新和完善,逻辑上也产生了很大的出入,因此导致之前的特征库无法使用,要对征信2.0重新开发指标。本人在疫情期间完成了征信2.0特征的开发,最近有时间整理了一下发出来大致思路希望可以帮助正在做或者使用征信2.0的各位同行。

本文可分为一下几个部分:

  1. 征信2.0相对于征信1.0的内容的新增及优化

  2. 征信2.0结构解读

  3. 征信2.0特征开发

一,征信2.0相对于征信1.0的内容的新增及优化

1.增加反欺诈警示,异议信息提示和其他证件标识信息 。人行汇总主体人的金融行为习惯(主要是借款,还款,申请的习惯),得出反欺诈警示,给征信使用方一个汇总类的提示,主要包括防欺诈警示信息,预留的防欺诈联系电话,和防欺诈信息的有效时间。异议提示信息用来提示征信报告使用者或者阅读者报告存在异议的条数。新版支持使用身份证、护照和军官证查询。旧版个人征信报告支持身份证查询。

2.征信2.0报告优化了报告的数字组织结构,2.0版本相对1.0版本重点聚焦在信息内容本身,强调信用报告本质上是一个数据集,而不是1.0简单的按照页面展示形式描述报告的组成结构。

3.基本信息部分新增【就业状况】,【电子邮箱】,【国籍】等数据项。将手机号由一条加至五条,并且有添加时间。

4.共同还款人信息也会在征信报告上体现出来;在信贷交易明细中,增加授信协议信息、担保信息、以及其他相关还款责任等信息。对于销户/结清账户,增加账户关闭日期。如果主体人最近或者某个时期频繁更换手机号,也能反映当时的原因。

5.增加征信报告“数字解读模块”,这个模块包含报告主体人人行征信评分,也就是人行根据主体人的行为给出的个人信用得分;相对位置是指主体人在人行库里面的位置情况;说明是人行给的对于得分和相对位置的解释。

6.对于信用款及其贷款的还款记录时间拉长为5年,征信1.0为两年。征信里面的呆账与逾期等会在征信里面呆五年,即使你销户这些逾期状态也会在明细里面体现出来。这样可以让黑产或者老赖们没有办法在短期内‘洗白’自己的征信。在征信1.0版本中有了严重逾期行为,只要能够凑到钱将账户欠款还清再将账户注销掉,就可以得到一份“干净”的征信报告。

7.信用卡的大额专项分期也会体现在征信上,在很多车贷、装修贷等消费类型的贷款都会以信用卡大额分期的方式贷出,在征信1.0不会体现分期还款金额,而在征信2.0中会体现还款时间和还款金额。也就是说这部分金额会加入到月待还款金额里面去,主体人再申请贷款就要提供更多的流水来覆盖负债。

8.删除了未销户贷记卡信息汇总中的‘发卡机构数’、‘未结清贷款信息汇总中的’贷款机构数等数据;删除了公共信息明细里面‘车辆交易和抵押记录’和‘养老保险缴存/发放记录’等信息。

9.除了借贷、电信和自来水缴费情况,还记录欠税、民事裁决、强制执行、行政处罚、低保救助、执业资格和行政奖励等信息。进一步完善了主题人金融行为与资产情况。

10.根据央行要求新版征信,各数据采集机构T+1上报更新征信报告,这样可以解决很多借款人和黑产利用上报时间差向多家银行和机构同时申请贷款的可能性,降低了银行审批的风险,以及主体人负债太高带来的逾期风险。

二,征信2.0解读

征信报告共有24个模块,包括婚姻信息、职业信息、信贷交易信息概要、公共信息概要、借贷账户信息等。为了数据管理以及后边征信特征衍生的方便,把这24个模块划分为8大类。以下是展示分类的细则,后边特征衍生的过程中也是按照下表的思路进行的。

以上信息中一般对贷款比较实用且有区分度的模块主要集中在信息概要,信贷交易信息明细,查询记录模块,其中查询记录模块对于大额贷款作用非常大,因为一个人的查询情况可以代表主体人在时间跨度内的资金需求情况和其他机构审批情况,可以做一个很好的参考维度。具体的特征衍生见下一部分。

三,征信2.0特征衍生

特征衍生部分主要涉及一些开发思路,因征信特征作为风控部门的核心管控资产,所以以下内容将会涉及的开发仅是思路上的分享。

征信2.0中会有一个征信分的字段,这个字段是根据征信报告里面的内容得出的一个分数,如果自己的业务和这个分相关性很高(比如IV值0.5),可以用这个分数做个规则出来。但是我在很多场景中发现这个分数的IV值其实最多不到0.2。

征信2.0特征在我遇到的场景中有用的变量主要是来自于信用卡,贷款,查询三类信息中,其中信用卡和贷款这两个大模块的特征衍生一般分为概要类,明细类两种情况,其中概要类产生的变量几乎不用做其他的处理可以直接使用;明细类可以按照时间维度做切片处理;查询类的变量可以做近期查询统计以及基于不同类别的机构的统计,然后再做时间切片的统计。以下会列举几个特征名称希望可以给你思路。

以上就是对征信2.0的解读及其特征开发上的一些心得,后边也会写一篇基于征信特征的风控信用模型开发,目前正在整理稿件,敬请期待~

参考文献

https://zhuanlan.zhihu.com/p/53208816

https://zhuanlan.zhihu.com/p/361972314



人行征信2.0介绍与特征开发-长达15页新版个人征信报告完整版曝光的评论 (共 条)

分享到微博请遵守国家法律