事前分布を定数と仮定してMAP推定を行なうと、最尤推定になる。
事後分布の計算
正規分布に従うノイズを仮定した線形回帰モデルの尤度関数は次式で与えられる。
p(y∣X,w)=Nd(y∣Xw,σ2Id)
事前分布が定数であるような場合、事後分布は事前分布の定数倍になる。このことに注意して事後分布を導出する。
∝∝===∝∝p(w∣X,y)p(y∣X,w)p(w)p(y∣X,w)Nd(y∣Xw,σ2Id)exp(−2σ21∥y−Xw∥22)exp−21(1)σ21∥y−Xw∥22(1)====σ21∥y−Xw∥2wTVd−1σ21XTXw−2wTVd−1mdσ21XTy+const.wTVd−1w−2wTVd−1md+const.(w−md)TV−1(w−md)+const.exp(−21(w−md)TVd−1(w−md))Nn(w∣md,Vd)
よって事後分布は次のようになる。
p(w∣X,y)=Nn(w∣md,Vd) ⎩⎨⎧mdVd−1=(XTX)−1XTy=σ21XTX
最尤法
事後分布が最大となるのは、w が平均ベクトル md に一致する場合である。よって w のMAP推定量は md である。
w^=wargmaxNn(w∣md,Vd)=md=(XTX)−1XTy
今回の場合は事後分布が尤度関数の定数倍であるから、この推定量は尤度関数を最大化するものに一致する。
w^=wargmaxNd(y∣Xw,σ2Id)
このような尤度関数を最大化する推定量を最尤推定量といい、最尤推定量を推定量とするようなパラメータの推定方法を最尤推定 (maximun likelihood estimation; MLE) という。
最小二乗法
最尤推定量は次式で表すこともできる。
w^=wargmaxNd(y∣Xw,σ2Id)=wargmin∥y−Xw∥22=wargmini=1∑d(yi−xiTw)2
これは、残差平方和 (residual sum of squares; RSS) を最小化するフィッティング方法、すなわち最小二乗法 (least squares method) による回帰と等価である。
一般に、データ D が各回独立な試行から得られたと仮定し、ノイズとして正規分布に独立同分布で従う確率変数 ε∼N(ε∣0,σ2) を仮定して最尤推定を行なうことは、次式で表される最小二乗法と等価になる。
wminimizei=1∑d(yi−xiTw)2