可變形卷積在視頻學習中的應用:如何利用帶有稀疏標記數據的視頻幀

卷積層是卷積神經網絡的基本層。雖然它在計算機視覺和深度學習中得到了廣泛的應用,但也存在一些不足。例如,對於某些輸入特徵圖,核權值是固定的,不能 適應局部特徵的變化,因此需要更多的核來建模複雜的特徵圖幅,這是多餘的,效率不高。體積膨脹,由於輸出轉換的接受野始終是矩形的,作爲層疊卷積的累積 效應,接受野會越來越大,接受野中會包含一些與輸出轉換無關的背景。不相關的背景會給輸出位移的訓練帶來噪聲。 爲了克
相關文章
相關標籤/搜索