【CNN】畳み込み演算・パディング・ストライドについて分かりやすく解説

データサイエンス
スポンサーリンク

スポンサーリンク

初めに

こんにちは。将棋と筋トレが好きな、情報系大学生のゆうき(@engieerblog_Yu)です。

今回から、畳み込みニューラルネットワーク(CNN)の畳み込み演算・パディング・ストライドについてまとめていきたいと思います。

畳み込みニューラルネットワークについて

前回の記事で、畳み込みニューラルネットワーク(CNN)は、Convolution層とPooling層を用いることで、入力データが一次元でなくても対応することができるという内容がありました。

今回は、Convolution層でどのような処理が行われているのかについて、まとめていきたいと思います。

Convolution層で行われている処理

Convolution層で行われている処理は大きく分けて三つあります。

畳み込み演算

パディング

ストライド

の三つです。

一つ一つ解説していきたいと思います。

畳み込み演算

畳み込み演算では、ニューラルネットワークでいうところの重みを掛け合わせてバイアスを足すという処理が行われています。

0~255の値で表される画像データが入力データであったとします。

入力データに、カーネルという重みに相当する値を掛け合わせて、最後にバイアスを足し合わせたものを出力データとします。

具体的な計算についてです。

上記の青く囲った部分とカーネルを掛け合わせます。

(2×2)+(3×4)+(12×3)+(4×8)+(2×6)+(16×5)+(1×3)+(16×9)+(1×2)=325

のようにそれぞれの値を掛け合わせて足します。

最後にバイアスを足して、327が出力データの左上の値になります。

同様の処理を行っていきます。

このようにして入力データに重みとバイアスを掛け合わせたものが、畳み込み演算です。

畳み込み演算は、ニューラルネットワークの重みとバイアスの演算を多次元に置き換えたようなもの

パディング

パディングとは、入力データの周りを一定の値で埋める操作です。

例えば0で埋めた場合はこのようになります。

パディングを行うことで出力データのサイズを大きくすることができます。

これは畳み込み層を繰り返し通すことで、出力データのサイズが小さくなりすぎてしまうことを防ぐことができます。

パディングとは入力データの周りを一定の値で埋める操作

出力データのサイズが小さくなりすぎてしまうことを防ぐ

ストライド

ストライドとは、カーネルと掛け合わせる青枠の部分の間隔のことです。

今回は間隔が1なのでストライドは1となります。

パディングとは反対に、ストライドは大きくなればなるほど、データサイズが小さくなります。

データサイズを小さくしたい場合はストライドの間隔を大きくして、データサイズを大きくしたい場合にはパディングの幅を大きくすることが有効的です。

ストライドとはカーネルを掛け合わせる部分の間隔のこと

ストライドを大きくすればするほど出力データサイズが小さくなる

まとめ

畳み込み演算は、ニューラルネットワークの重みとバイアスの演算を多次元に置き換えたようなもの

パディングとは入力データの周りを一定の値で埋める操作

ストライドとはカーネルを掛け合わせる部分の間隔のこと

今回は畳み込みニューラルネットワーク(CNN)の畳み込み演算・パディング・ストライドについてまとめました。

機械学習、ディープラーニングを学びたい方におすすめの入門書籍です。

ディープラーニングの理論が分かりやすくまとめられていて、力を身につけたい方におすすめです。

ゆうき
ゆうき

最後まで読んでいただきありがとうございました。

ねこすけ
ねこすけ

他にもいろんな記事があるにゃ。

コメント

タイトルとURLをコピーしました