《Self-Guided Network for Fast Image Denoising》閱讀筆記

論文題目:Self-Guided Network for Fast Image Denoising

發表時間:ICCV 2019

作者及其背景:Shuhang Gu1, Yawei Li1, Luc Van Gool1,2, Radu Timofte1 (1Computer Vision Lab, ETH Zurich, Switzerland, 2KU Leuven, Belgium )

Contributions

  • 提出了一種快速且高效的內存網絡SGN來處理圖像去噪任務。通過採用自頂向下的自導體系結構,SGN在降噪性能,速度和內存效率方面均優於當前算法。
  • 我們提供詳細的消融研究,以分析和驗證所提出的自我指導策略的優勢。
  • 提供了關於合成和真實數據集的定量和定性實驗結果,以將SGN與最新算法進行比較。

Motivation

隨着各種消費相機的廣泛普及,對高精度和高效圖像降噪算法的需求比以往任何時候都更加強大。

爲了追求更準確的去噪結果,現在有一些複雜的網絡。儘管在一些數據集上這些方法的效果很有競爭力,但是它們繁重的計算和內存佔用量阻礙了它們在硬件受限的設備(例如智能電話或消費電子產品)上的應用。

Algorithm

Overall strucure of SGN

給定輸入圖片 I 0 I^0 維度爲 M × N × C M\times N \times C ,SGN首先對 I 0 I^0 進行suffle操作,得到 I K I^K ,維度爲 { M / 2 k × N / 2 k × 4 k C } k = 1 , . . . , K \{M /2^k\times N/2^k\times 4^kC\}_{k=1,...,K} ,然後對 I k I^k 在第 K K 層利用 f K ( ) f^K(\cdot) 進行特徵提取。得到低 K K 層的信息之後,我們將其傳播至 K 1 K-1 層。通過中間層網絡 { f k ( ) } k = 1 , . . . , K 1 \{f^k(\cdot)\}_{k=1,...,K-1} ,多尺度上下文信息逐漸移向全分辨率並且指導最底層的子網絡 { f 0 ( ) } \{f^0(\cdot)\} 生成最終的估計。

Details

在這裏插入圖片描述
圖中右下角Shuffle/2與X2的箭頭畫反了。

在藍色框中卷積層的數目爲3。

在第k層中,通道數是第0層的 4 k 4^k 倍,在這一層我們使子網絡 f k ( ) f^k(\cdot) 得到的特徵矩陣數爲 c k = 2 k × c 0 c^k=2^k\times c^0 ,其中 c 0 c^0 爲第0層的特徵矩陣數。由於輸入的矩陣尺寸是原來的 1 / 4 k 1/4^k ,所以比在原圖直接進行卷積要快。

在第 k + 1 k+1 層得到的特徵矩陣先進行shufflex2操作,通道數變爲了 c k + 1 / 4 c^{k+1}/4 ,之後與第 k k 層的特徵矩陣進行拼接,得到的通道數爲 c k + c k + 1 / 4 c^k+c^{k+1}/4 ,之後經過卷積層降維得到的矩陣通道數爲 c K c^K

注意在最底層不包含殘差模塊(藍色)。

Experiment

Setting

訓練集:DIV2K中的800張 2040 x 1550 + (2040x1550+) 。採用隨機翻轉和旋轉操作的數據增強功能增加訓練數據。

測試集:DIV2K中的100張。

爲了與其他方法比較,選取了Berkeley segmentation數據集中的68張圖片。

添加的高斯噪聲的方差 σ \sigma 爲30,50,70.

tation數據集中的68張圖片。

添加的高斯噪聲的方差 σ \sigma 爲30,50,70.

使用 β 1 = 0.9 \beta_1=0.9 的Adam優化器,在每一次迭代過程中,我們從訓練集中隨機裁剪了8個大小爲256×256的子圖像。前500K次迭代學習率爲 1 × 1 0 4 1\times 10^{-4} ,之後的500K次迭代衰減爲 1 × 1 0 5 1\times 10^{-5}