2 指標
2.1 TNR
True Negative Rate(真陰性率或特指度(specificity))
TNR = TN /(TN + FP)
負樣本正確判斷爲負樣本結果數 / 負樣本實際數
2.2 FPR
False Positive Rate (假陽性率, 可以稱作誤報率)
FPR = FP /(FP + TN)
負樣本被判別爲正樣本的錯誤結果數 / 負樣本實際數
2.3 FNR
False Negative Rate(假陰性率 , FNR) 可以稱作漏報率
FNR = FN /(TP + FN)
正樣本被判決爲負樣本的錯誤結果數 / 正樣本實際數
另外在醫學上FNR和FPR定義如下:
假陰性率(false negative rate,FNR),又稱漏診率或第Ⅱ類錯誤。指實際有病,但根據篩檢試驗被定爲無病的百分比。它反映的是篩檢試驗漏診病人的情況。
假陽性率(false positive rate,FPR),又稱誤診率或第Ⅰ類錯誤的。指實際無病或陰性,但被判爲有病或陽性的百分比。在科學實驗或檢測當中,出現假陽性結果的機率。無病但根據篩檢被判爲有病的百分比。
2.4 召回率(recall)
True Positive Rate(召回率、真陽性率或靈敏度(sensitivity))
計算公式是
recall-precision-false-positive-false-negative-2
它計算的是 正樣本正確判斷正樣本的結果數 / 正樣本實際數。
在開始介紹的例子中就是希望知道,得到的女生佔本班中所有女生的比例,所以其recall也就是100%,即20女生/(20女生+ 0 誤判爲男生的女生)。
2.5 精確率(precision)
公式是recall-precision-false-positive-false-negative-3
它計算的是所有被檢索到的個數(TP+FP)中」應該被檢索到的個數(TP)」佔的比例。
在開始介紹的例子中就是希望知道,正確的人(也就是女生)佔有的比例。所以其precision也就是40%,即20女生/(20女生+30誤判爲女生的男生)。
2.6 F-Measure
定義:
recall-precision-false-positive-false-negative-4
定義recall-precision-false-positive-false-negative-6爲P和 R 的調和平均數。
可得:
recall-precision-false-positive-false-negative-5
F-Measure又稱爲F-Score,是IR(信息檢索)領域的常用的一個評價標準,計算公式爲:其中β 是參數,P是精確率(Precision),R是召回率(Recall)。
當參數β=1時,就是最常見的F1-Measure了:
recall-precision-false-positive-false-negative-7
「召回率」與「準確率」雖然沒有必然的關係(從上面公式中可以看到),然而在大規模數據集合中,這兩個指標卻是相互制約的。
PR曲線即查準率(Precision)與查全率(Recall),以查全率爲座標x軸,查準率爲座標y軸,從而畫出了一條曲線。
P-R圖直觀地顯示出學習器在樣本總體上的查全率和查準率。在進行比較時,若一個學習器的P-R曲線完全被另一個學習器的曲線完全「包住」,則我們就可以斷言後者的性能優於前者。
ROC曲線表示的是TPR(真陽率)和FPR(假陽率)的關係,PR去向表示的是precision和recall的關係。
AUC(Area Under Curve)即爲ROC曲線下的面積。
既然已經這麼多評價標準,爲什麼還要使用ROC和AUC呢?因爲ROC曲線有個很好的特性:當測試集中的正負樣本的分佈變化的時候,ROC曲線能夠保持不變。在實際的數據集中經常會出現類不平衡(class imbalance)現象,即負樣本比正樣本多很多(或者相反),而且測試數據中的正負樣本的分佈也可能隨着時間變化。下圖是ROC曲線和Precision-Recall曲線5的對比
在目標檢測的評價體系中,有一個參數叫做 IoU,簡單來講就是模型產生的目標窗口和原來標記窗口的交疊率。在Pascal VOC中,這個值爲0.5。而2014年以來出現的MS COCO競賽規則把這個IoU變成了0.5-1.0之間的綜合評價值,也就是說,定位越準確,其得分越高,這也側面反映了目標檢測在評價指標方面的不斷進步。
傳統的目標檢測方法,這篇 overview [1] 裏總結的比較全面,而且都給了性能和時間複雜度的比較,對傳統方法比較感興趣的建議可以精讀一下。考慮到 detection 的精度與時間複雜度問題,就介紹下 SelectiveSearch [2] 和 Edgeboxes [3]。
R-CNN Fast-R-CNN Faster-R-CNN YOLO SSD