{ 评估 }

  • 客户端码农学习ML —— 分类评估(准确率_精确率和召回率_ROC和曲线下面积)

    |

    判断各种机器学习方法训练而成的模型输出结果的好坏,需要一些评估方法,本文简单介绍二分类算法的几种评估方法,做个总结。

    首先需要有一些基本概念:对于样本来说,通常有两种类型,一种是正类别、一种是负类别,正负类别本身没有褒义贬义的含义,纯粹为了区分二分类两种不同情况。

    如“有没有狼的问题”,可以认为狼来了是正类别,没有狼是负类别;再比如“肿瘤是恶性还是良性”,恶性可以作为正类型,良性作为负类别。

    对于模型的预测,可以用2x2混淆矩阵来总结,该矩阵描述了所有可能出现的结果,共4种,以肿瘤问题为例: