勾配降下法で使われる損失関数(二乗和誤差・交差エントロピー誤差)をPythonで実装する

プログラミング

2022.09.15 2022.08.30

スポンサーリンク

目次

1 はじめに
2 ニューラルネットワークの学習について
3 二乗和誤差
4 交差エントロピー誤差
5 訓練データとテストデータについて
6 まとめ

スポンサーリンク

目次

はじめに
ニューラルネットワークの学習について
二乗和誤差
交差エントロピー誤差
訓練データとテストデータについて
まとめ

はじめに

こんにちは。将棋と筋トレが好きな、学生エンジニアのゆうき(@engieerblog_Yu)です。

今回はニューラルネットワークのモデルの学習に使われる損失関数についてまとめていきたいと思います。

前回の記事です。

２入力単純パーセプトロンをPythonを使って実装してみる

こんにちは。将棋と筋トレが好きな、情報系大学生のゆうき( @engieerblog_Yu )です。今回はディープラーニングを学ぶ上で必須の知識となる、パーセプトロンについてまとめていきたいと思います。パーセプトロンとは？パーセプトロンは複数の入力に対して、一つの信号を出力します。入力:x、出力:yとする…

活性化関数(ステップ・シグモイド・ReLU)をPythonで実装

はじめに今回は前回のパーセプトロンから、ニューラルネットワークを考えるために、活性化関数について触れていきたいと思います。パーセプトロンとニューラルネットワークの違いパーセプトロンは前回の記事で、以下のように表されると学びました。 (今回θの…

ニューラルネットワークの学習について

ニューラルネットワークと前回紹介したパーセプトロンでは、重みを自動で学習できるか、できないかといった違いがありました。

パーセプトロンは手作業で重みを決めなければならない

ニューラルネットワークは重みを自動で学習できる

どのように学習していくのかというと、数値微分を行い、重みの値を適切な値に少しずつ近づけていきます。

そのような方法を勾配降下法といいます。

勾配降下法については、また別の記事でまとめていきたいと思います。

【機械学習】勾配降下法による重みとバイアスの最適化(損失関数・学習率)

こんにちは。将棋と筋トレが好きな、学生エンジニアのゆうき( @engieerblog_Yu )です。今回はニューラルネットワークのモデルの学習に使われる勾配降下法についてまとめていきたいと思います。勾配降下法についてニューラルネットワークのモデル学習では、重みとバイアスを最適化していきます。重みとバイアス…

今回まとめる損失関数は、勾配降下法で重みパラメータを更新するために使われます。

損失関数は、勾配降下法で重みパラメータを更新するときに使われるもの

イメージとしては誤差が小さくなるように重みを調整していくといった感じです。

二乗和誤差

モデルの学習を行う際の正解データをy、予想データをtとします。

二乗和誤差はその名の通り、データの誤差の二乗和をとったものです。

\(E=\frac{1}{2}\sum_{k}(y_k-t_k)^2\)

yとt以下のように設定して、二乗和誤差を求めます。

y = [0,0,1,0]
t = [0.05,0.2,0.7,0.05]

def sum_squared_error(y,t):
    return (np.sum(y-t)**2)/2

print(sum_squared_error(np.array(y),np.array(t)))

二乗和誤差は以下のようになりました。

0.06750000000000002

当たり前ですが、誤差は必ず正の値を取ります。

交差エントロピー誤差

\(E=-\sum_{k}t_klogy_k\)

マイナス無限大の値が発生してしまうと、プログラミングできなくなってしまうので、deltaを導入しています。

def cross_entropy(y,t):
    delta = 1e-10
    return -np.sum(t * np.log(y + delta))

print(cross_entropy(np.array(y),np.array(t)))

6.907755278912138

交差エントロピー誤差は二乗和誤差と比べて、正解yと予測tの値が離れるほど、誤差の値が大きくなる傾向があります。

訓練データとテストデータについて

機械学習では、訓練データとテストデータに分けて学習と検証を行うのが主流となっています。

データが100あったとしたら70のデータを訓練データとし、30のデータをテストデータとするようなことです。

訓練データを使ってニューラルネットワークの学習を行い、テストデータを使ってモデルの精度がどのくらいなのか検証します。

機械学習ではデータを二つに分ける必要がある

訓練データを使ってモデルの学習を行い、テストデータを使ってモデルの精度を検証する

まとめ

パーセプトロンは手作業で重みを決めなければならない

ニューラルネットワークは重みを自動で学習できる

損失関数は、勾配降下法で重みパラメータを更新するときに使われるもの

機械学習ではデータを二つに分ける必要がある

訓練データを使ってモデルの学習を行い、テストデータを使ってモデルの精度を検証する

今回はニューラルネットワークの勾配降下法に用いられる損失関数についてまとめました。

機械学習、ディープラーニングを学びたい方におすすめの入門書籍です。

ディープラーニングの理論が分かりやすくまとめられていて、力が身につくと思います。

リンク

ゆうき

ゆうき

最後まで読んでいただきありがとうございました。

ねこすけ

ねこすけ

他にもいろんな記事があるにゃ。

ランダムフォレストを使ってタイタニック号の生存者を予測してみよう【kaggle入門】

こんにちは。学生エンジニアのゆうき( @engieerblog_Yu )です。今回はscikit-learnというデータ分析のライブラリのランダムフォレストを用いてタイタニック号の生存者予測を行っていこうと思います。データサイエンスに興味がある人におすすめの記事です。

【機械学習入門に適したライブラリ】Scikit-learnでできること【記事まとめ】

はじめにゆうきこんにちは。学生エンジニアのゆうき(@engieerblog_Yu)です。今回は、データサイエンス入門ということでscikit-learnというデータ分析のライブラリについて紹介していきたいと思い...

コメント

タイトルとURLをコピーしました