检测分类问题中的ROC曲线

评价检测分类算法性能的时候所采用的ROC曲线是神马?

检测分类问题中的ROC曲线

ROC是Receiver Operating Characteristic的缩写。根据Wikipedia[1]的描述,统计学中使用ROC曲线来表示可变阈值二分类器的判别能力。它大概长这个样子:

Roccurves

ROC曲线的横轴与纵轴分别为不同阈值情形下的True Postive Rate (TPR)与False Positive Rate (FPR)。其中的TPR在机器学习中也常被称为sensitivity、recall或者probability of detection;FPR也被称为fall-out或者probability of false alarm(误报)。ROC曲线可以用在决策时的“成本/收益”分析。

ROC曲线最初是在二战时期由电子工程师与雷达工程师发明的,它被用来在战场上检测敌方目标。很快心理学也开始使用它来描述对刺激的感知。ROC分析已经在医药、射线、生物、预测自然灾害和测量的模型表现评估中应用了数十年,并且在机器学习与数据挖掘中获得了越来越多的应用。


  1. https://en.wikipedia.org/wiki/Receiver_operating_characteristic ↩︎