欢迎光临散文网 会员登陆 & 注册

【R 机器学习案例】Titanic 数据 Logistic 回归建模

2022-12-24 06:25 作者:张敬信老师  | 我要投稿

来自知乎 @Mr数据杨 :

Python机器学习如何正确评估分类模型的准确性?

https://www.zhihu.com/question/573591611/answer/2810483759

他自己发个问题就邀请我回答,我一般是懒得回答,真要回答的话,各位看官自己看, 不是看不起 R 机器学习吗?我把 Python sklearn 案例改用 R mlr3verse 实现,到底哪个更简洁、优雅?说吊打,夸张吗?

准备数据:

图片

删除 deck 和 alive 列,忽略缺失值,将目标变量转化为因子型:


创建任务:

划分训练集、测试集:

选择学习器:

Logistic 回归,超参数 maxit 指定 1000 次迭代训练

设置 predict_type="prob" 得到预测概率,以便绘制 ROC 曲线等

在训练集上训练模型,在测试集上做预测

图片

评估模型性能

图片
图片
图片


ROC 曲线

autoplot(predictions, type = "roc")

图片
图片

PR 曲线

图片

更多 mlr3verse 机器学习框架学习内容,参阅我的知乎专栏:

https://www.zhihu.com/column/c_1450969849791479809


【R 机器学习案例】Titanic 数据 Logistic 回归建模的评论 (共 条)

分享到微博请遵守国家法律