標本統計量を関数に入力したときの誤差伝播の考え方を導入する。
関数への入力
とある実験を N 回行なってサイズ N の標本 {xi}i=1N を得たとき、「中心極限定理」が成り立つ場合には標本平均 x は 68 % の頻度で E[x]±V[x] の範囲に入る。
x68 %∼E[x]±V[x] ⎩⎨⎧E[x]V[x]=E[x]=NV[x]=N−1E[sx2]
ここで標本平均 x を何らかの関数に入力して、出力 f(x) を得る場合を考える。標本平均 x は確率変数とみなしているため、f(x) もまた確率的な値となる。よって、単なる出力値 f(x) ではなく、その期待値 E[f(x)] と分散 V[f(x)] に興味がある。
→xf(x)∼E[x]∼E[f(x)]±V[x]±V[f(x)]
誤差伝播
関数 f がよほど「都合の良い」関数でもない限り、期待値に対する関数値 f(E[x]) と、関数値に対する期待値 E[f(x)] は異なった値となる。それらの両者の差分をバイアス (bias) などという。わかりやすさのためにバイアスを fbias と書くことにすれば、次のようになる。
E[f(x)]=f(E[x])+fbias
以降、期待値 E[x]=E[x] を μx と表すことにする。
E[f(x)]=f(μx)+fbias
この fbias という量を意識し、f(x) が f(μx) からどれほどずれているかという観点で計算しよう。すなわち f を点 E[x] の周りでテイラー展開する。
f(x)≈f(μx)+dμxdf(x−μx)+21dμx2d2f(x−μx)2+…
このような「ずれ」が伝播するという観点での推定方法を誤差伝播 (error propagation) などという。
期待値の推定量
関数 f のテイラー展開の2次の項までを取り込む。
f(x)≈f(μx)+dμxdf(x−μx)+21dμx2d2f(x−μx)2
さらに期待値を計算する。
E[f(x)]=≈===⟨f(x)⟩⟨f(μx)+dμxdf0(x−μx)+21dμx2d2fvariance(x−μx)2⟩f(μx)+21dμx2d2fV[x]f(μx)+21dμx2d2fNV[x]f(μx)+21dμx2d2fN−1E[sx2]
分散の推定量
今度は f を1次まで展開する。
f(x)≈f(μx)+dμxdf(x−μx)
すると分散は次のようになる。
V[f(x)]=≈==(1)⟨f(x)⟩2−(2)⟨f2(x)⟩(1)≈=(2)≈=⟨f(μx)+dμxdf0(x−μx)⟩2f2(μx),⟨(f(μx)+dμxdf(x−μx))2⟩⟨f2(μx)+2f2(μx)dμxdf0(x−μx)+(dμxdf)2variance(x−μx)2⟩=f2(μx)+(dμxdf)2V[x](dμxdf)2V[x](dμxdf)2NV[x](dμxdf)2N−1E[sx2]
この推定量の平方根をとったものを標準偏差の推定量として採用することで、標準偏差の推定量を得ることができる。ただし分散の不偏推定量の平方根は標準偏差の不偏推定量ではない問題が生じるので、これを使うかどうかは少し慎重になったほうがいいかもしれない。
V[f(x)]=dμxdfN−1E[sx2]
まとめ
以上をまとめると次のとおりである。
E[f(x)]=V[f(x)]=f(μx)+21dμx2d2fN−1E[sx2](dμxdf)2N−1E[sx2]
バイアスをはっきり書くと
E[f(x)]=V[f(x)]=fbias=f(μx)+fbias(dμxdf)2N−1E[sx2]21dμx2d2fN−1E[sx2]
と書くこともできる。
信頼区間
以上の結果を利用すれば、f(μx) の信頼区間も計算できる。f(x) の期待値±1標準偏差の区間を考えよう。
f(x)∼≈E[f(x)]±V[f(x)]f(μx)+fbias±V[f(x)]
ここから f(μx) を抜き出してくる。
f(μx)∼f(x)−fbias±V[f(x)] fbias=V[f(x)]=21dμx2d2fN−1E[sx2](dμxdf)2N−1E[sx2]