【回帰分析】連立方程式の解とLpノルムの関係を線形回帰を使って解説(データサイエンス)

データサイエンス

2022.07.06

1 はじめに
2 連立方程式と解の数について
3 回帰について
4 Lpノルムについて
5 まとめ

はじめに
連立方程式と解の数について
回帰について
Lpノルムについて
まとめ

はじめに

こんにちは。将棋と筋トレが好きな、学生エンジニアのゆうき(@engieerblog_Yu)です。

今回はscikit-learnなどのライブラリの中で、何が起こっているのかを理解するために、連立方程式とLpノルムの関係について数学的に解説していきたいと思います。

連立方程式と解の数について

回帰分析とは、あるデータの集合から、データに最も当てはまりがよさそうな関数を探すことです。

その関数を探すためには、方程式の解を考えることが必要です。

関数を探すための解を見つける手段として、まずは連立方程式を考えます。

連立方程式は一般に以下のように表すことができます。

\(Ax = b \)

(A：行列　x：ベクトル　b：ベクトル)

具体例で表すと

\(3x_1+2x_2+x_3=1\)

\(x_1+2x_2-x_3=3\)

\(2x_1-x_2+4x_3=5\)

という連立方程式を、行列とベクトルを使って表したものが以下です。

\(\left(\begin{array}{rr}3&2&1 \\1 & 2 & -1 \\2 & -1 & 4 \\\end{array}\right)\left(\begin{array}{rr} x_1 \\x_2 \\x_3\\\end{array}\right)=\left(\begin{array}{rr} 1 \\3 \\5\\\end{array}\right)\)

\(A=\left(\begin{array}{rr}3&2&1 \\1 & 2 & -1 \\2 & -1 & 4 \\\end{array}\right)　x=\left(\begin{array}{rr} x_1 \\x_2 \\x_3\\\end{array}\right)\)

\(b=\left(\begin{array}{rr} 1 \\3 \\5\\\end{array}\right)\)

この時3つの式に対して３つの変数があり、解の組が一つに定まる問題を中学校あたりで解いていた人が多いんじゃないでしょうか。

例えば(x1,x2,x3)=(1,2,3)など。

しかし、一般に方程式の数と変数の数が変わってくると、解の組を決めることができません。

方程式よりも未知数の変数の数が多いものを劣決定系、方程式よりも未知数の変数の数が多いものを過決定系と言います。

例えば

以下は劣決定系の例です。

\(\left(\begin{array}{rr}3&2&1 \\1 & 2 & -1 \\\end{array}\right)\left(\begin{array}{rr} x_1 \\x_2 \\x_3\\\end{array}\right)=\left(\begin{array}{rr} 1 \\3 \\\end{array}\right)\)

以下が過決定系です。

\(\left(\begin{array}{rr}3&2&1 \\1 & 2 & -1 \\2 & -1 & 4 \\3&2&6\end{array}\right)\left(\begin{array}{rr} x_1 \\x_2 \\x_3\\\end{array}\right)=\left(\begin{array}{rr} 1 \\3 \\5\\4\end{array}\right)\)

劣決定系では解が無限に存在し、過決定系では解を決めることができません。

回帰分析ではそのような解が定まらないような問題を考えます。

そのためにノルムを使った、制約やペナルティを考える必要があります。