【VAE】変分自己符号化器について分かりやすくまとめました(深層生成モデル)

データサイエンス
スポンサーリンク

スポンサーリンク

初めに

こんにちは。将棋と筋トレが好きな学生エンジニアのゆうき(@engieerblog_Yu)です。

今回は、深層生成モデルに含まれるVAE(変分オートエンコーダ)についてまとめていきたいと思います。

生成モデルとは?

生成モデルとは、その名の通りデータを生成することができるモデルです。

例えば、学習用に猫の画像が与えられた時に、生成モデルは猫の画像を生成できるように学習します。

このように生成モデルは対象のドメインのデータを生成できるようなモデルになります。

生成モデルの用途

生成モデルの用途は主に三つあります。

対象のドメインのデータを新しく生成する

データをより詳細に解析できる

データのもっともらしさを評価する

生成モデルを作成することで、データを生成できるだけでなく、その過程からデータが何によって構成されているのかを分析することができます。

VAEとは?

生成モデルの中でも、深層学習を用いた深層生成モデルとして、一般的なものの中に、VAE(変文自己符号化器)があります。

VAEは潜在変数モデルと呼ばれ、観測データを潜在変数に圧縮します。

潜在変数とは、観測データの特徴を抽出して、コンパクトに表すことができる変数です。

VAEでは、モデル学習とデータ生成の二つのステップがあります。

それぞれについてまとめていきます。

VAEのモデル学習

VAEのモデル学習は、以下のように行われます。

符号化器によって潜在変数を推定することができ、複合化器によってデータを生成することができるようになります。

符号化器と複合化器は、ニューラルネットワークによって構成されています。

モデル学習時には、観測データと符号化器から生成されたデータの誤差が小さくなるように、符号化器と複合化器を学習していきます。

μとσはそれぞれ平均と分散を表す数で、分布を表すことができます。

VAEでのデータ生成

次にそのように学習された複合化器のみを使って、データを生成していきます。

そのように生成されたデータは、学習する際に用いられたデータと近しいものになります。

まとめ

生成モデルは、対象ドメインのデータが生成されるようなモデル

生成モデルを作成することで、データを生成できるだけでなく、その過程からデータが何によって構成されているのかを分析することができる

VAEはモデル学習、データ生成の二つのステップに分けられる

今回は深層生成モデルの一つである、VAE(変分自己符号化器)についてまとめました。

ディープラーニングの基礎を抑えた方向けのおすすめ書籍です。

ゆうき
ゆうき

最後まで読んでいただきありがとうございました。

ねこすけ
ねこすけ

他にもおすすめ記事があるにゃ。

コメント

タイトルとURLをコピーしました