在上一篇文章我们已经获取了每个变量值的分箱数据和woe值,现在我们用woe值替换各变量数据的分箱号,也就是原来的分箱数据是表示各个数值对应箱子号,现在替换成对应woe值。
实现代码如下
这样替换后的df_new数据看一下
这样看的话是不是有点感觉了。我们通过woe变换后,把这个建模问题变成实数域的逻辑回归模型。
具体逻辑回归的原理这里不展开了,我们直接调用statsmodels包来实现逻辑回归:
最后打印出结果