手帳と試行

学んだことをアウトプットしていきます。 日々、ノートあるのみ。

標準誤差

標本統計量の標準偏差、すなわち標準誤差について触れる。

標準誤差

標本平均の標準偏差 V[x]\sqrt{\mathrm V[\overline x]} を標本平均の標準誤差 (standard error) という。

より一般に、何らかの標本統計量 w^\hat w の標準偏差 V[w^]\sqrt{\mathrm V[\hat w]} を「w^\hat w の標準誤差」というが、単に「標準誤差」といった場合は「標本平均 x\overline x の標準誤差 V[x]\sqrt{\mathrm V[\overline x]}」を表す。

standard deviation of x:V[x]standard error of x:V[x]\begin{aligned} & \text{standard deviation of }x: & \sqrt{\mathrm V[x]} \\ & \text{standard error of }\overline x: & \sqrt{\mathrm V[\overline x]} \end{aligned}

標準誤差の計算

標本平均の分散 V[x]\mathrm V[\overline x] は次式のように計算できる。

V[x]=x2(1)x2(2)(1)=1Ni=1Nxi×1Nj=1Nxj=1N2i=jxixj+1N2ijxixj=1Nx2+N1Nx2,(2)=x2=1Nx2+N1Nx2x2=1N(x2x2)=1NV[x]\begin{aligned} \mathrm V[\overline x] ={}& \underbrace{\langle \overline x^2 \rangle}_{(1)} - \underbrace{\langle \overline x \rangle^2}_{(2)} \\ &\left| \small \quad \begin{aligned} (1) ={}& \left\langle \frac{1}{N} \sum_{i=1}^N x_i \times \frac{1}{N} \sum_{j=1}^N x_j \right\rangle \\ ={}& \frac{1}{N^2} \sum_{i = j} \langle x_i x_j \rangle + \frac{1}{N^2} \sum_{i \ne j} \langle x_i \rangle \langle x_j \rangle \\ ={}& \frac{1}{N} \langle x^2 \rangle + \frac{N-1}{N} \langle x \rangle^2, \\ (2) ={}& \langle x \rangle^2 \end{aligned} \right. \\ ={}& \frac{1}{N} \langle x^2 \rangle + \frac{N-1}{N} \langle x \rangle^2 - \langle x \rangle^2 \\ ={}& \frac{1}{N} \left( \langle x^2 \rangle - \langle x \rangle^2 \right) \\ ={}& \frac{1}{N} \mathrm V[x] \end{aligned}

ゆえに標準誤差は次式で与えられる。

V[x]=V[x]N\begin{aligned} \sqrt{\mathrm V[\overline x]} = \sqrt{\frac{\mathrm V[x]}{N}} \end{aligned}

標準誤差の推定

V[x]=NN1E[sx2]\begin{aligned} \mathrm V[x] = \frac{N}{N-1} \mathrm E[s_x^2] \end{aligned}

なる関係を用いれば、標本平均の分散の不偏推定量を得ることができる。

V[x]=1N1E[sx2]1N1sx2\begin{aligned} \mathrm V[\overline x] = \frac{1}{N-1} \mathrm E[s_x^2] \simeq \frac{1}{N-1} s_x^2 \end{aligned}

さらにこれの平方根をとれば、バイアス付きではあるが標準誤差が推定できる。

V[x]1N1sx2\begin{aligned} \sqrt{\mathrm V[\overline x]} \simeq \sqrt{\frac{1}{N-1} s_x^2} \end{aligned}

ただし、分散の不偏推定量の平方根が標準偏差の不偏推定量ではないのと同様に、この量は不偏推定量ではないことに注意が必要である

まとめ

  • 標本平均の分散は標本分散の 1N1\dfrac{1}{N-1}
    V[x]=V[x]N=1N1E[sx2]\begin{aligned} \mathrm V[\overline x] = \frac{\mathrm V[x]}{N} = \frac{1}{N-1} \mathrm E[s_x^2] \\ \end{aligned}
  • 標本平均の標準偏差は母集団の標本平均の 1N\sqrt\dfrac{1}{N}
    V[x]=V[x]N\begin{aligned} \sqrt{\mathrm V[\overline x]} = \sqrt{\frac{\mathrm V[x]}{N}} \end{aligned}