手帳と試行

学んだことをアウトプットしていきます。 日々、ノートあるのみ。

カーネルリッジ回帰

カーネル法を用いてリッジ回帰を行なう。

カーネルリッジ回帰

カーネル法を用いた場合の尤度関数は次のように書ける。

p(yX,u)=Nd(yKu,σ2Id)\begin{aligned} p(\bm y | \bm X, \bm u) &= \mathcal N_d (\bm y | \bm K \bm u, \sigma^2 \bm I_d) \\ \end{aligned}

回帰問題についてカーネル法を論じる場合、Ridge回帰を取り上げて導入することが多いようなので、ここでもそれに倣ってRidge回帰を見ていく。

まず事前分布に独立正規分布を仮定する。

p(w)=Np(w0,s2Id)\begin{aligned} p(\bm w) = \mathcal N_p (\bm w | \bm 0, s^2 \bm I_d) \end{aligned}

ここで w=ΦTu\bm w = \bm \Phi^\mathsf{T} \bm u を用いると次のようになる。

p(w)=Np(w0,s2Id)exp(12s2w22)=exp(12s2ΦTu22)=exp(12s2uTΦΦTu)=exp(12s2uTKu)Nd(u0,s2K1)\begin{aligned} p(\bm w) ={}& \mathcal N_p (\bm w | \bm 0, s^2 \bm I_d) \\ \propto{}& \exp \left( - \frac{1}{2s^2} \| \bm w \|_2^2 \right) \\ ={}& \exp \left( - \frac{1}{2s^2} \| \bm \Phi^\mathsf{T} \bm u \|_2^2 \right) \\ ={}& \exp \left( - \frac{1}{2s^2} \bm u^\mathsf{T} \bm \Phi \bm \Phi^\mathsf{T} \bm u \right) \\ ={}& \exp \left( - \frac{1}{2s^2} \bm u^\mathsf{T} \bm K \bm u \right) \\ \propto{}& \mathcal N_d (\bm u | \bm 0, s^2 \bm K^{-1}) \end{aligned}
i.e.p(u)=Nd(u0,s2K1)\begin{aligned} \text{i.e.} \quad p(\bm u) = \mathcal N_d (\bm u | \bm 0, s^2 \bm K^{-1}) \end{aligned}

事後分布の計算

ベイズの定理を用いて事後分布を計算する。ここで KT=K\bm K^\mathsf{T} = \bm K であることに注意しよう。

p(uX,y)p(yX,u)p(u)=Nd(yKu,σ2Id)Nd(u0,s2K1)exp(12σ2yKu22)exp(12s2uTKu)=exp(12(1σ2yKu22+1s2uTKu)(1))(1)=1σ2yKu22+1s2uTKu=uT1σ2KKu+uT1σ2σ2s2λKu2uTKy+const.=uT1σ2K(K+λId)Vd1u2uTKyVd1md+const.=uTVd1u2uTVd1md+const.=(umd)TVd1(umd)+const.exp(12(umd)TVd1(umd))Nd(umd,Vd)\begin{aligned} &\hspace{-1pc} p(\bm u | \bm X, \bm y) \\ \propto{}& p(\bm y | \bm X, \bm u) p(\bm u) \\ ={}& \mathcal N_d (\bm y | \bm K \bm u, \sigma^2 \bm I_d) \mathcal N_d (\bm u | \bm 0, s^2 \bm K^{-1}) \\ \propto{}& \exp \left( - \frac{1}{2 \sigma^2} \| \bm y - \bm K \bm u \|_2^2 \right) \exp \left( - \frac{1}{2 s^2} \bm u^\mathsf{T} \bm K \bm u \right) \\ ={}& \exp \left( - \frac{1}{2} \underbrace{\left( \frac{1}{\sigma^2} \| \bm y - \bm K \bm u \|_2^2 + \frac{1}{s^2} \bm u^\mathsf{T} \bm K \bm u \right)}_{(1)}\right) \\ &\left|\small\quad\begin{aligned} (1) ={}& \frac{1}{\sigma^2} \| \bm y - \bm K \bm u \|_2^2 + \frac{1}{s^2} \bm u^\mathsf{T} \bm K \bm u \\ ={}& \bm u^\mathsf{T} \frac{1}{\sigma^2} \bm K \bm K \bm u + \bm u^\mathsf{T} \frac{1}{\sigma^2} \underbrace{ \frac{\sigma^2}{s^2} }_{\lambda} \bm K \bm u - 2 \bm u^\mathsf{T} \bm K \bm y + \mathrm{const.} \\ ={}& \bm u^\mathsf{T} \underbrace{\frac{1}{\sigma^2} \bm K ( \bm K + \lambda \bm I_d )}_{\bm V_d^{-1}} \bm u - 2 \bm u^\mathsf{T} \underbrace{ \bm K \bm y }_{ \bm V_d^{-1} \bm m_d } + \mathrm{const.} \\ ={}& \bm u^\mathsf{T} \bm V_d^{-1} \bm u - 2 \bm u^\mathsf{T} \bm V_d^{-1} \bm m_d + \mathrm{const.} \\ ={}& (\bm u - \bm m_d)^\mathsf{T} \bm V_d^{-1} (\bm u - \bm m_d) + \mathrm{const.} \end{aligned}\right. \\ \propto{}& \exp \left( -\frac{1}{2} (\bm u - \bm m_d)^\mathsf{T} \bm V_d^{-1} (\bm u - \bm m_d) \right) \\ \propto{}& \mathcal N_d (\bm u | \bm m_d, \bm V_d) \end{aligned}

よって事後分布は次のようになる。

p(uX,y)=Nd(umd,Vd)p(\bm u | \bm X, \bm y) = \mathcal N_d (\bm u | \bm m_d, \bm V_d)
{md=(K+λId)1yVd1=1σ2K(K+λId)\left\lbrace\begin{aligned} \bm m_d &= (\bm K + \lambda \bm I_d)^{-1} \bm y \\ \bm V_d^{-1} &= \frac{1}{\sigma^2} \bm K (\bm K + \lambda \bm I_d) \end{aligned}\right.

MAP推定

これにより u\bm u のMAP推定量は次のようになる。

u^=(K+λId)1y\begin{aligned} \hat{\bm u} &= (\bm K + \lambda \bm I_d)^{-1} \bm y \end{aligned}