初めに
こんにちは。将棋と筋トレが好きな学生エンジニアのゆうき(@engieerblog_Yu)です。
今回は、深層生成モデルに含まれるVAE(変分オートエンコーダ)についてまとめていきたいと思います。
生成モデルとは?
生成モデルとは、その名の通りデータを生成することができるモデルです。
例えば、学習用に猫の画像が与えられた時に、生成モデルは猫の画像を生成できるように学習します。
このように生成モデルは対象のドメインのデータを生成できるようなモデルになります。
生成モデルの用途
生成モデルの用途は主に三つあります。
対象のドメインのデータを新しく生成する
データをより詳細に解析できる
データのもっともらしさを評価する
生成モデルを作成することで、データを生成できるだけでなく、その過程からデータが何によって構成されているのかを分析することができます。
VAEとは?
生成モデルの中でも、深層学習を用いた深層生成モデルとして、一般的なものの中に、VAE(変文自己符号化器)があります。
VAEは潜在変数モデルと呼ばれ、観測データを潜在変数に圧縮します。
潜在変数とは、観測データの特徴を抽出して、コンパクトに表すことができる変数です。
VAEでは、モデル学習とデータ生成の二つのステップがあります。
それぞれについてまとめていきます。
VAEのモデル学習
VAEのモデル学習は、以下のように行われます。
符号化器によって潜在変数を推定することができ、複合化器によってデータを生成することができるようになります。
符号化器と複合化器は、ニューラルネットワークによって構成されています。
モデル学習時には、観測データと符号化器から生成されたデータの誤差が小さくなるように、符号化器と複合化器を学習していきます。
μとσはそれぞれ平均と分散を表す数で、分布を表すことができます。
VAEでのデータ生成
次にそのように学習された複合化器のみを使って、データを生成していきます。
そのように生成されたデータは、学習する際に用いられたデータと近しいものになります。
まとめ
生成モデルは、対象ドメインのデータが生成されるようなモデル
生成モデルを作成することで、データを生成できるだけでなく、その過程からデータが何によって構成されているのかを分析することができる
VAEはモデル学習、データ生成の二つのステップに分けられる
今回は深層生成モデルの一つである、VAE(変分自己符号化器)についてまとめました。
ディープラーニングの基礎を抑えた方向けのおすすめ書籍です。
最後まで読んでいただきありがとうございました。
他にもおすすめ記事があるにゃ。
コメント