手帳と試行

学んだことをアウトプットしていきます。 日々、ノートあるのみ。

ジャックナイフ法

誤差伝播による推定を自動化する方法の1つであるジャックナイフ法を導入する。

誤差伝播

サイズ NN の標本 {xi}i=1N\{x_i\}_{i=1}^N について、期待値が μx\mu_x で、標本平均が x\overline x であるとき、標本平均を関数に入力したときの出力値 f(x)f(\overline x) については、テイラー展開により期待値と分散を

E[f(x)]f(μx)+121Nd2fdμx2Vx]V[f(x)]1N(dfdμx)2V[x]\begin{aligned} \mathop{\rm E}[f(\overline x)] &\approx f(\mu_x) + \frac{1}{2} \frac{1}{N} \frac{d^2 f}{d \mu_x^2} \mathop{\rm V}x] \\ \mathop{\rm V}[f(\overline x)] &\approx \frac{1}{N} \left(\frac{df}{d \mu_x}\right)^2 \mathop{\rm V}[x] \end{aligned}

で求めることができ、これによって f(μx)f(\mu_x) の信頼区間を次式で計算することができる。

f(μx)=E[f(x)]fbias±V[f(μx)]\begin{aligned} f(\mu_x) = \mathop{\rm E}[f(\overline x)] - f_\text{bias} \pm \mathop{\rm V}[f(\mu_x)] \end{aligned}
fbias=121Nd2fdμx2V[x]V[f(μx)]1N(dfdμx)2V[x]\begin{aligned} f_\text{bias} &= \frac{1}{2} \frac{1}{N} \frac{d^2 f}{d \mu_x^2} \mathop{\rm V}[x] \\ \sqrt{\mathbb V[f(\mu_x)]} &\approx \frac{1}{N} \left(\frac{df}{d \mu_x}\right)^2 \mathop{\rm V}[x] \end{aligned}

これを使用するとき、次の量については手計算が必須となる。

dfdμx,d2fdμx2\begin{aligned} \frac{df}{d\mu_x}, \quad \frac{d^2f}{d\mu_x^2} \end{aligned}

これは面倒なので、自動的にバイアス fbiasf_\text{bias} および標準偏差 V[f(μx)]\sqrt{\mathop{\rm V}[f(\mu_x)]} を計算する方法が開発されている。ここではそのうちジャックナイフ法 (jackknife resampling) と呼ばれる方法を導入する。

ジャックナイフ標本

次式のように ii 番目のジャックナイフ標本 xijackx_i^{\rm jack} を定義する。

xijack1N1jixj=x1N1(xxi)\begin{aligned} x_i^{\rm jack} \coloneqq \frac{1}{N-1} \sum_{j \ne i} x_j = \overline x - \frac{1}{N-1} (\overline x - x_i) \end{aligned}

ジャックナイフ標本の標本平均 xjack\overline{x^{\rm jack}}x\overline x に一致する。

xjack=x1N1(xxi)=x1N1(xx)=x\begin{aligned} \overline{x^{\rm jack}} &= \overline x - \frac{1}{N-1} \overline{(\overline x - x_i)} \\ &= \overline x - \frac{1}{N-1} (\overline x - \overline x) \\ &= \overline x \end{aligned}

また標本分散 sxjack2s_{x^{\rm jack}}^2sx2s_x^21(N1)2\dfrac{1}{(N-1)^2} 倍に一致する。

sxjack2=(xjack)2(1)(xjack)2(2)(1)=(x1N1(xx))2=x22N1x(xx)0+1(N1)2(xx)2sample variance=x2+1(N1)2sx2(2)=x2=1(N1)2sx2\begin{aligned} s_{x^{\rm jack}}^2 ={}& \underbrace{ \overline{ (x^{\rm jack})^2 } }_{(1)} - \underbrace{ (\overline{ x^{\rm jack} })^2 }_{(2)} \\ &\left\|\small\quad\begin{aligned} (1) &= \overline{\left( \overline{x} - \frac{1}{N-1}(\overline x - x) \right)^2} \\ &= \overline{ \overline{x}^2 - \frac{2}{N-1} \overline x \underbrace{(\overline x - x)}_{0} + \frac{1}{(N-1)^2} \underbrace{(\overline x - x)^2}_{\text{sample variance}} } \\ &= \overline{x}^2 + \frac{1}{(N-1)^2} s_x^2 \\ (2) ={}& \overline{x}^2 \end{aligned}\right. \\ ={}& \frac{1}{(N-1)^2} s_x^2 \end{aligned}