【R 机器学习案例】Titanic 数据 Logistic 回归建模

2022-12-24 06:25 作者:张敬信老师 0人读过 | 我要投稿

来自知乎 @Mr数据杨：

Python机器学习如何正确评估分类模型的准确性？

https://www.zhihu.com/question/573591611/answer/2810483759

他自己发个问题就邀请我回答，我一般是懒得回答，真要回答的话，各位看官自己看，不是看不起 R 机器学习吗？我把 Python sklearn 案例改用 R mlr3verse 实现，到底哪个更简洁、优雅？说吊打，夸张吗？

删除 deck 和 alive 列，忽略缺失值，将目标变量转化为因子型：

划分训练集、测试集：

选择学习器：

Logistic 回归，超参数 maxit 指定 1000 次迭代训练

设置 predict_type="prob" 得到预测概率，以便绘制 ROC 曲线等

在训练集上训练模型，在测试集上做预测

autoplot(predictions, type = "roc")

更多 mlr3verse 机器学习框架学习内容，参阅我的知乎专栏：

https://www.zhihu.com/column/c_1450969849791479809

标签：