標本統計量から推定された母数の信頼区間を求める。
推定量の分布
何らかの実験を N N N 回行なって、データ { x i } i = 1 N \{ x_i \}_{i=1}^N { x i } i = 1 N を採取するという操作が、次のように書けると仮定する。
x i ∼ i . i . d . p ( x ) x_i \mathop{\sim}\limits_{\rm i.i.d.} p(x) x i i.i.d. ∼ p ( x )
こうして得られたサイズ N N N の標本 { x i } i = 1 N \{x_i\}_{i=1}^N { x i } i = 1 N から期待値 E [ x ] \mathop{\rm E}[x] E [ x ] を推定するには、不偏推定量である標本平均 x ‾ \overline x x を用いればよい。
E [ x ] = E [ x ‾ ] ≃ x ‾ \mathop{\rm E}[x] = \mathop{\rm E}[\overline x] \simeq \overline x E [ x ] = E [ x ] ≃ x
ただし、計算された標本平均 x ‾ \overline x x は「N N N 回の実験を行なう」という操作を行なうたびに変動する。そこで x ‾ \overline x x もまた確率分布 p ~ ( x ‾ ) \tilde p(\overline x) p ~ ( x ) からサンプルされたものとして取り扱う。
x ‾ ∼ p ~ ( x ‾ ) \overline x \sim \tilde p(\overline x) x ∼ p ~ ( x )
中心極限定理
「中心極限定理」によれば、「標本 { x i } i = 1 N \{ x_i \}_{i=1}^N { x i } i = 1 N を採取して標本平均 x ‾ \overline x x を得る」という操作を何度も繰り返すと、次第に標本平均 x ‾ \overline x x は正規分布に従うようになる。
p ~ ( x ‾ ) ≈ N ( E [ x ‾ ] , V [ x ‾ ] ) \tilde p(\overline x) \approx \mathcal N(\mathop{\rm E} [\overline x], \mathop{\rm V} [\overline x]) p ~ ( x ) ≈ N ( E [ x ] , V [ x ])
すると、正規分布の性質により、68 % 68~\% 68 % の頻度で標本平均 x ‾ \overline x x が E [ x ‾ ] ± V [ x ‾ ] \mathrm E[\overline x] \pm \sqrt{\mathrm V[\overline x]} E [ x ] ± V [ x ] の範囲に入っている ことになる。これは「N N N 個のデータを得て標本平均 x ‾ \overline x x を計算する」という操作を 10 , 000 10,\!000 10 , 000 回繰り返した場合、標本平均 x ‾ \overline x x が区間 E [ x ‾ ] ± V [ x ‾ ] \mathrm E[\overline x] \pm \sqrt{\mathrm V[\overline x]} E [ x ] ± V [ x ] に含まれているという事象がだいたい6,800回くらい生じるということを意味している。以降ではこのことを次のように表すことにしよう。
x ‾ ∼ 68 % E [ x ‾ ] ± V [ x ‾ ] \overline x \mathop{\sim}\limits_{68~\%} \mathop{\rm E}[\overline x] \pm \sqrt{\mathop{\rm V}[\overline x]} x 68 % ∼ E [ x ] ± V [ x ]
区間推定
図1: エラーバーの例 (エラーバーは68%信頼区間)
これらの関係は次のように変形することができる。
E [ x ] ∼ 68 % x ‾ ± V [ x ‾ ] \begin{aligned}
\mathrm E[x]
\mathop{\sim}\limits_{68~\%}
\overline x \pm \sqrt{\mathrm V[\overline x]} \\
\end{aligned} E [ x ] 68 % ∼ x ± V [ x ]
期待値 E [ x ] \mathrm E[x] E [ x ] が 68 % 68~\% 68 % の頻度で x ‾ ± V [ x ‾ ] \overline x \pm \sqrt{\mathrm V[\overline x]} x ± V [ x ] の範囲に入っている のである。このとき、推定された区間 x ‾ ± V [ x ‾ ] \overline x \pm \sqrt{\mathrm V[\overline x]} x ± V [ x ] を期待値 E [ x ] \mathrm E[x] E [ x ] の 68 % 68~\% 68 % 信頼区間 (68% confidence interval; CI) という。
まとめ
標本平均は 68 % 68 ~ \% 68 % の頻度で E [ x ‾ ] ± V [ x ‾ ] \mathrm E[\overline x] \pm \sqrt{\mathrm V[\overline x]} E [ x ] ± V [ x ] の範囲に入る
x ‾ ∼ 68 % E [ x ‾ ] ± V [ x ‾ ] \begin{aligned}
\overline x \mathop{\sim}\limits_{68~\%} \mathop{\rm E}[\overline x] \pm \sqrt{\mathop{\rm V}[\overline x]}
\end{aligned} x 68 % ∼ E [ x ] ± V [ x ]
期待値 E [ x ] \mathop{\rm E}[x] E [ x ] は 68 % 68~\% 68 % の頻度で x ‾ ± V [ x ‾ ] \overline x \pm \sqrt{\mathrm V[\overline x]} x ± V [ x ] の範囲に入る
E [ x ] ∼ 68 % x ‾ ± V [ x ‾ ] \begin{aligned}
\mathrm E[x]
\mathop{\sim}\limits_{68~\%}
\overline x \pm \sqrt{\mathrm V[\overline x]} \\
\end{aligned} E [ x ] 68 % ∼ x ± V [ x ]