定義
Ridge回帰は多重回帰の損失関数に罰則項としてL2正則化項を加味する。正則化の意味についてはこちらに詳しくまとめている。
L2ノルムは原点からのユークリッド距離。
(1)
ただしリッジ回帰では、根号の中の二乗項で計算する。
(2)
定式化
最小化すべき関数は、
(3)
重み係数を計算するために、それぞれで偏微分してゼロとする。
(4)
その結果得られる連立方程式は以下の通り。
(5)
ここでそれぞれの和を記号Sと添字で表し、さらに行列表示すると以下の通り。
(6)
ここでを消去して、以下の連立方程式を得る。
(7)
これを分散・共分散で表すと、
(8)
ここで仮に、xjiとxkiが完全な線形関係にある場合を考えてみる。とすると、分散・共分散の性質より、
(9)
このような場合、通常の線形回帰は多重共線性により解を持たないが、式(8)に適用すると係数行列は以下のようになる。
(10)
対角要素にαが加わることで、多重共線性が強い場合でも係数行列の行列式は正則となり、方程式は解を持つ。また正則化の効果より、αを大きな値とすることによって係数の値が小さく抑えられる。
行列による表示
式(3)の損失関数を、n個のデータに対する行列で表示すると以下の通り(重回帰の行列表現はこちらを参照)。
(11)
これをwで微分してLを最小とする値を求める。
(12)