小試牛刀:貓狗識別 Cat VS Dog

  • 從一開始的只有 70% -> 使用數據增強,添加 Dropout 減少過擬合達到 82 %,比未正則化的模型提高了 12% -> 使用預訓練網絡 vgg16 快速特徵提取,然後訓練自己的分類器,驗證精度達到了約 90% -> 使用預訓練網絡,端到端的訓練,並凍結卷積基,只訓練自己加入的 Decnce 層的權重,驗證精度約爲 91% -> 微調模型,驗證精度達到了 94.7%
    一開始
  • 通過進一步使用正則化方法以及調節網絡參數(比如每個卷積層的過濾器個數或網絡中的層數),你可以得到更高的精度,可以達到 86% 或 87%。但只靠從頭開始訓練自己的卷積神經網絡,再想提高精度就十分困難,因爲可用的數據太少。想要在這個問題上進一步提高精度,下一步需要使用預訓練的模型
    在這裏插入圖片描述數據增強

  • 使用預訓練網絡有兩種方法:特徵提取(feature extraction)和微調模型(fine-tuning)

  • 使用預訓練網絡,不使用數據增強的快速特徵提取,驗證精度達到了約 90%,比從頭開始訓練的小型模型效果要好得多。但從圖中也可以看出,雖然 dropout 比率相當大,但模型幾乎從一開始就過擬合。這是因爲本方法沒有使用數據增強,而數據增強對防止小型圖像數據集的過擬合非常重要
    在這裏插入圖片描述

  • 最終我們得到了 93.79% 的測試精度,注意我們只用一小部分訓練數據(約 10%), 訓練 20 000 個樣本與訓練 2000 個樣本是有很大差別的