如何用SPSS做ROC曲线,检测预测模型的准确性
我们今天就用一套基因表达数据集。这是小编之前在做关于酒精性脂肪肝相关研究时从GEO数据库下载的数据。我们通过前期的分析最终筛选得到了五个基因来构建模型预测患者的预后。今天就用这五个基因的表达值来做一个ROC曲线来看看模型的预测价值吧。
一、数据的输入
首先还是数据的输入:在变量视图里面输入各项数据的基因参数,其中我们将Group疾病组赋值为1,将正常组赋值为2。

二、数据录入
数据录入:在数据视图中录入各项数据

三、做logistic回归
做logistic回归,保存预测值(这个在上期我们讲解过,不会的小伙伴可以查看开头的连接查看)。针对今天的数据,小薇再给大家演示一遍:

将Group选入因变量,其他基因选入协变量。之后点击保存,勾选概率,点击继续,点击确定。

之后我们就会发现多了一列数据,即预测概率:

四、做ROC曲线
制作ROC曲线:点击分析,随后点击ROC曲线:

五、最后操作
5.点击ROC曲线后会出现如下页面,我们将:基因以及新出现的预测概率选入控制变量中,将 Group选入状态变量中,状态变量的值填入2,并勾选下面所有选项,最后点击确定。

六、结果解读
结果解读:ROC曲线一共给出七条线,其中五条是单个基因的预测线,一条是基因构建的综合模型的预测曲线,最后一条是AUC为0.5的参考线。再看下面具体的数据我们可以发现,预测概率的AUC值最高,为0.942最高,即模型的预测性能最好。

七、图形美化
如果觉得SPSS输出的图形不好看,可以双击图片,然后就会出现编辑页面,可对图中线条的颜色和粗细等进行编辑:

