基礎知識
學習的ROC和AUC介紹以及如何計算AUC這篇博客,講的很清晰,推薦給大家。
個人理解
- precision recall F1適用於預測結果是確定的情況,auc適用於預測結果是有概率的;
- 要畫roc,首先得把 將所有樣本預測爲正例的概率值 排序,依次從小到大選取概率值作爲正例閾值,然後計算FPR、TPR作爲橫縱座標描點,進而將點連接起來畫出roc曲線;
- 之所以要畫roc或者說需要roc,是因爲概率閾值取的不同會得到很多組TP和FP,所以auc是把很多組 [tpr fpr] 綜合起來用一個指標評價分類效果,而f1只是綜合一組pr;
- 測試集需要既有正例也有反例,否則auc爲零;
- TPR的分子是預測爲正例的樣本中預測正確的個數,可以理解爲預測爲正例的樣本中預測正確的比例,FPR的分子爲預測爲正例的樣本中預測錯誤的個數,可以理解爲預測爲正例的樣本中預測錯誤的比例;所以TPR越大FPR越小越好,進而是auc越大越好,可以結合下圖理解。