混淆矩阵与模型评估指标

日前,跨象乘云™ 发布了《汽车出厂前测试时间数据分析 - 人工智能垂直领域工程项目案例分享》。本案例为机器学习与人工智能技术应用前导课程,开展工业、智能制造领域的大数据分析,以汽车制造企业的出厂部件测试为教学对象,介绍在汽车出厂前如何进行故障检查,故障识别以及质量检测。本实验主要内容包括:基于包含 171 个匿名功能特征的 7,6000 条汽车部件样本数据,实现数据的整理提炼,特征提取、特征工程、故障诊断、部件性能诊断分析。通过深入浅出的方式会介绍各种大数据分析技术在智能制造业领域的应用。

不同的模型对应着不同的评估指标,不同的评估指标,选择出来的最优模型都是不一样的,所以还是需要根据具体的业务需求来选择适合自己模型的评估指标。而评估指标的关键,便是混淆矩阵。混淆矩阵是用来总结一个分类器结果的矩阵。对于 K 元分类,其实它就是一个 KxK 的表格,用来记录分类器的预测结果。对于最常见的二元分类来说,它的混淆矩阵是 2x2 的,如下:

关键概念
TP(True Positive - 真阳性):真实为 0,预测为 0
FN(False Negative - 假阴性):真实为 0,预测为 1
FP(False Positive - 假阳性):真实为 1,预测为 0
TN(True Negative - 真阴性):真实为 1,预测为 1
关键指标







部分内容摘录自 SAMshare 微信号:gh_8528ce7b7e80