標本分布と誤差分散

標本分布と誤差分散

標本分布とは、標本の平均の誤差についての分布である。

標本誤差分布である。

この標本平均誤差分布の分散が誤差分散である。

標本平均誤差分布の標準偏差は、標準誤差と呼ばれる。

標本分布とは

不偏推定量は母集団の分散・標準偏差を推定するときだけ標本サイズを考慮する。

平均については、標本平均=不偏平均の関係になっている。

$$\bar{x} = \frac{\sum{x_i}}{n}$$
$$\hat{\mu} = \frac{\sum{x_i}}{n}$$

標本平均から、母平均を推定するときの誤差のことを標本誤差という。

この標本誤差の分布を、標本分布という。

標本分布は、標本サイズがある程度大きくなると正規分布に近づく(中心極限定理)。

誤差分散とは

誤差分散とは、標本分布の分散である。

つまり、どれぐらい誤差が散らばっているかを表している。

$$
\sigma_{\bar{x}}^2 = \frac{\sigma^2}{n}
$$

nは標本サイズである。
nの増加に従い、誤差分散が小さくなる。
つまり、標本サイズが大きければ、大きな誤差が出る確率は減少することを示唆する。

誤差分散の場合も、不偏分散同様に、標本サイズ等に考慮しなければならない。

  1. 母分散が既知・標本サイズが大きい場合
  2. 母分散が未知・標本サイズが小さい場合

以上の2つに場合分けされる。

母分散が既知


母分散\(\sigma^1\)が分かっている場合
標本サイズが大きい(30以上)の場合
誤差分散\(\sigma_{\bar{x}}^2\)は以下のように求める
$$
\sigma_{\bar{x}}^2 = \frac{\sigma^2}{n}
$$

母分散が未知

母分散が分かっていない場合
標本サイズが小さい場合(30未満)の場合

t検定で出てくる
回帰分析におけるt値の求め方

$$
\begin{eqnarray}
\sigma_{\bar{x}}^2 &=& \frac{\sigma^2}{n}\\
&=& \frac{\hat{\sigma^2}}{n}\\
&=& \frac{S^2}{n-1}
\end{eqnarray}
$$

$$
\sigma^2 \rightarrow \hat{\sigma^2} = \frac{1}{n-1}\sum{(x_i-\bar{x})^2}
$$
$$
\begin{eqnarray}
S^2 = \frac{1}{n}\sum{(x_i-\bar{x})^2}\\
\sum{(x_i-\bar{x})^2} = nS^2
\end{eqnarray}
$$
$$
\begin{eqnarray}
\hat{\sigma^2} &=& \frac{1}{n-1}\sum{(x_i-\bar{x})^2}\\
&=& \frac{nS^2}{n-1}
\end{eqnarray}
$$

$$
\begin{eqnarray}
\sigma_{\bar{x}}^2 &=& \frac{\sigma^2}{n}\\
&=& \frac{\hat{\sigma^2}}{n}\\
&=& \frac{1}{n}\frac{nS^2}{n-1}\\
&=& \frac{S^2}{n-1}
\end{eqnarray}
$$

標準誤差

標準誤差は、誤差分散のルートをとれば出てくる。

標本誤差

参考書