深層学習(画像認識編)

まずは基本用語を理解しましょう。

畳み込み層(Convolution Layer)

  • 畳み込みフィルター:畳み込みするためのフィルター
  • ストライド:
  • パディング

$$ W_{\text{out}} = \left\lfloor \frac{{W_{\text{in}} – F + 2P}}{{S}} \right\rfloor + 1 $$

$$ H_{\text{out}} = \left\lfloor \frac{{H_{\text{in}} – F + 2P}}{{S}} \right\rfloor + 1 $$

重要:F=3, P=1, S=1の場合、出力サイズと入力サイズは同じとなる!
重要:F=3, P=1, S=2の場合、出力サイズは入力サイズの半分となる!

よければSNSをフォローしてあげてください!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です