【R 机器学习案例】Titanic 数据 Logistic 回归建模

来自知乎 @Mr数据杨 :
Python机器学习如何正确评估分类模型的准确性?
https://www.zhihu.com/question/573591611/answer/2810483759
他自己发个问题就邀请我回答,我一般是懒得回答,真要回答的话,各位看官自己看, 不是看不起 R 机器学习吗?我把 Python sklearn 案例改用 R mlr3verse 实现,到底哪个更简洁、优雅?说吊打,夸张吗?
准备数据:

删除 deck
和 alive
列,忽略缺失值,将目标变量转化为因子型:

创建任务:
划分训练集、测试集:
选择学习器:
Logistic 回归,超参数 maxit
指定 1000 次迭代训练
设置 predict_type="prob"
得到预测概率,以便绘制 ROC 曲线等
在训练集上训练模型,在测试集上做预测

评估模型性能






ROC 曲线
autoplot(predictions, type = "roc")


PR 曲线

更多 mlr3verse
机器学习框架学习内容,参阅我的知乎专栏:
https://www.zhihu.com/column/c_1450969849791479809