深層学習(画像認識編)
まずは基本用語を理解しましょう。
畳み込み層(Convolution Layer)
- 畳み込みフィルター:畳み込みするためのフィルター
- ストライド:
- パディング
$$ W_{\text{out}} = \left\lfloor \frac{{W_{\text{in}} – F + 2P}}{{S}} \right\rfloor + 1 $$
$$ H_{\text{out}} = \left\lfloor \frac{{H_{\text{in}} – F + 2P}}{{S}} \right\rfloor + 1 $$
重要:F=3, P=1, S=1の場合、出力サイズと入力サイズは同じとなる!
重要:F=3, P=1, S=2の場合、出力サイズは入力サイズの半分となる!