【学習率・正則化・アーキテクチャ】ハイパーパラメータについて(ニューラルネットワーク)

データサイエンス

2022.09.15 2022.09.02

スポンサーリンク

目次

1 はじめに
2 ハイパーパラメータとは？
3 ハイパーパラメータは大きく三つに分けられる
4 学習の進み方を決定するパラメータ
5 正則化の強さを決定するパラメータ
6 ネットワークアーキテクチャを決定するパラメータ
7 ハイパーパラメータの調整方法
8 まとめ

スポンサーリンク

目次

はじめに
ハイパーパラメータとは？
ハイパーパラメータは大きく三つに分けられる
学習の進み方を決定するパラメータ
正則化の強さを決定するパラメータ
ネットワークアーキテクチャを決定するパラメータ
ハイパーパラメータの調整方法
まとめ

はじめに

こんにちは。将棋と筋トレが好きな、学生エンジニアのゆうき(@engieerblog_Yu)です。

今回はニューラルネットワークのモデルのハイパーパラメータについてまとめていきたいと思います。

ハイパーパラメータとは？

ニューラルネットワークの重みやバイアスなどのパラメータは、誤差逆伝播法や勾配降下法を用いて計算されます。

それらのパラメータは、誤差逆伝播法で勾配を計算し、勾配降下法で決定することができます。

しかし、誤差逆伝播法と勾配降下法で決めることができないパラメータもあります。

【機械学習】勾配降下法による重みとバイアスの最適化(損失関数・学習率)

こんにちは。将棋と筋トレが好きな、学生エンジニアのゆうき( @engieerblog_Yu )です。今回はニューラルネットワークのモデルの学習に使われる勾配降下法についてまとめていきたいと思います。勾配降下法についてニューラルネットワークのモデル学習では、重みとバイアスを最適化していきます。重みとバイアス…

そのようなパラメータを、ハイパーパラメータと言います。

ハイパーパラメータは人間が手動で決定する必要があり、適切なパラメータをどのように探索するかが重要です。

今回はハイパーパラメータに、どのようなものがあるのかまとめていきたいと思います。

ハイパーパラメータとは、ニューラルネットワークが自動で決めることができず、手動で決定しなければならないパラメータ

ハイパーパラメータは大きく三つに分けられる

ハイパーパラメータは三つに分けることができます。

学習の進み方を決定するもの

正則化の強さを決定するもの

ネットワークアーキテクチャを決定するもの

それぞれ解説していきます。

学習の進み方を決定するパラメータ

学習率やモーメンタム法で使われる係数が、これに該当します。

【物理量を使った最適化手法】Momentum法をPythonで実装する

はじめにこんにちは。将棋と筋トレが好きな、情報系大学生のゆうき(@engieerblog_Yu)です。今回はニューラルネットワークの最適化問題を解く手法である、モーメンタム法についてまとめていきたいと思います。Mo...

例えば勾配降下法で用いられる式が以下です。

\(t_{next}=t_{previous} – \eta\frac{\partial E}{\partial t}\)

学習率ηが、ハイパーパラメータになります。

ηの値は大きすぎても小さすぎても良くなく、モデルに応じた適切な値を設定する必要があります。

正則化の強さを決定するパラメータ

正則化の強さを決定するパラメータはWeight Decay、ドロップアウトの係数などが挙げられます。

正則化とは、訓練誤差を小さくしたモデルの汎化誤差も小さくするためにモデルを複雑化しすぎないようにするための操作です。

正則化の強さを決めるのは手動であるのでハイパーパラメータを用いるというわけです。

具体的なWeight Decay、ドロップアウトの操作についてはまた別の記事でまとめたいと思います。

ネットワークアーキテクチャを決定するパラメータ

どのようなネットワークアーキティクチャにするのかということも、ハイパーパラメータにあたります。

ネットワークアーキテクチャとはニューラルネットワークの構造です。

ネットワーク層の数を何層にするのか、幅をどれくらいにするのか、活性化関数に何を使うのかでニューラルネットワークの構造が変わります。

活性化関数(ステップ・シグモイド・ReLU)をPythonで実装

はじめに今回は前回のパーセプトロンから、ニューラルネットワークを考えるために、活性化関数について触れていきたいと思います。パーセプトロンとニューラルネットワークの違いパーセプトロンは前回の記事で、以下のように表されると学びました。 (今回θの…

余談ですが、幅を広くすると計算量は指数関数的に増え、層数を増やすと計算量は線形的に増えます。

大きいニューラルネットワークと言われた場合、層が深いのか、幅が広いのかということに着目することも大切です。

ニューラルネットワークのアーキテクチャはハイパーパラメータである

ハイパーパラメータの調整方法

ハイパーパラメータは人力で決定するのはあまりにも大変です。

効率よく調整する方法として、グリット探索、ランダム探索、ベイズ最適化などが知られています。

これらの方法はまた後ほど、別の記事で投稿していきたいと思います。

まとめ

ハイパーパラメータとは、ニューラルネットワークが自動で決めることができず、手動で決定しなければならないパラメータ

ハイパーパラメータには学習の進み方を決定するもの、正則化の強さを決定するもの、ネットワークアーキテクチャを決めるものの三つがある

ハイパーパラメータを調整する方法としてグリット探索、ランダム探索、ベイズ最適化などが知られている

今回はニューラルネットワークのハイパーパラメータについてまとめました。

機械学習、ディープラーニングを学びたい方におすすめの入門書籍です。

ディープラーニングの理論が分かりやすくまとめられていて、コーディングしながら力を身につけることができると思います。

リンク

ゆうき

ゆうき

最後まで読んでいただきありがとうございました。

ねこすけ

ねこすけ

他にもいろんな投稿があるにゃ。

勾配降下法で使われる損失関数(二乗和誤差・交差エントロピー誤差)をPythonで実装する

はじめにこんにちは。将棋と筋トレが好きな、学生エンジニアのゆうき( @engieerblog_Yu )です。今回はニューラルネットワークのモデルの学習に使われる損失関数についてまとめていきたいと思います。前回の記事です。 https://prog-you.com/perceptron/ https://…

２入力単純パーセプトロンをPythonを使って実装してみる

こんにちは。将棋と筋トレが好きな、情報系大学生のゆうき( @engieerblog_Yu )です。今回はディープラーニングを学ぶ上で必須の知識となる、パーセプトロンについてまとめていきたいと思います。パーセプトロンとは？パーセプトロンは複数の入力に対して、一つの信号を出力します。入力:x、出力:yとする…

コメント

タイトルとURLをコピーしました