欢迎光临散文网 会员登陆 & 注册

深度学习【DataCastle】第三届厦门国际银行数创金融杯金融营销建模大赛(结构化数据挖

2023-02-25 17:30 作者:喵唔aa  | 我要投稿

Lasso

接下来回顾的三个模型,Lasso、Ridge 和 ElasticNet,都使用 MLR 的相同基础函数进行预测,但系数的估计方式不同。有 L1 和 L2 正则化参数,用于减小系数的大小,从而减少过度拟合,并可导致更好的异常值的预测。在我们的案例中,这可能是一种很好的尝试方法,因为 MLR 的样本内 R2 得分为 95%,显著大于样本外 R2 的 76%,表明过度拟合。

有一个参数可以用套 Lasso 估计——L1 惩罚参数的大小,或alpha。我们可以通过对验证数据集进行100个 alpha 值的网格搜索来实现这一点。看起来是这样的:

f.add_sklearn_estimator(Lasso,'lasso')f.set_estimator('lasso')lasso_grid = {'alpha':np.linspace(0,2,100)}f.ingest_grid(lasso_grid)f.tune()f.auto_forecast()


深度学习【DataCastle】第三届厦门国际银行数创金融杯金融营销建模大赛(结构化数据挖的评论 (共 条)

分享到微博请遵守国家法律