理解ROC與AUC

基礎知識

學習的ROC和AUC介紹以及如何計算AUC這篇博客,講的很清晰,推薦給大家。

個人理解

  1. precision recall F1適用於預測結果是確定的情況,auc適用於預測結果是有概率的;
  2. 要畫roc,首先得把 將所有樣本預測爲正例的概率值 排序,依次從小到大選取概率值作爲正例閾值,然後計算FPR、TPR作爲橫縱座標描點,進而將點連接起來畫出roc曲線;
  3. 之所以要畫roc或者說需要roc,是因爲概率閾值取的不同會得到很多組TP和FP,所以auc是把很多組 [tpr fpr] 綜合起來用一個指標評價分類效果,而f1只是綜合一組pr;
  4. 測試集需要既有正例也有反例,否則auc爲零;
  5. TPR的分子是預測爲正例的樣本中預測正確的個數,可以理解爲預測爲正例的樣本中預測正確的比例,FPR的分子爲預測爲正例的樣本中預測錯誤的個數,可以理解爲預測爲正例的樣本中預測錯誤的比例;所以TPR越大FPR越小越好,進而是auc越大越好,可以結合下圖理解。
    這裏寫圖片描述