中心極限定理

概要

中心極限定理(central limit theorem: CLT)は、一言で言えば次のようになる。「母集団がどのような確率分布に従うとしても、標本の数を十分大きくしたときには、その合計値あるいは標本平均は、正規分布に従う」

具体的には、母集団の平均を\mu、標準偏差を\sigmaとし、nが十分に大きいとき、

  • 標本の合計S_n = \sum X_{i}は正規分布N(n \mu,n\sigma^2)に従う
  • 標本平均\overline{X}_n = \frac{1}{n} \sum X_{i}は正規分布N(\mu, \frac{\sigma^2}{n})に従う

 

表現

中心極限定理は、一般には以下のように表される。

(1)    \begin{equation*} \lim_{n \rightarrow \infty} \Pr \left( \frac{S_n - n \mu}{\sqrt{n} \sigma} \leq \alpha \right) = \int_{-\infty}^{\alpha} \frac{1}{\sqrt{2} \pi} e^{- \frac{x^2}{2}} dx \end{equation*}

これを少し変形すると、

(2)    \begin{equation*} \lim_{n \rightarrow \infty} \Pr \left( \frac{\overline{X}_n - \mu}{\sigma / \sqrt{n}} \leq \alpha \right) = \int_{-\infty}^{\alpha} \frac{1}{\sqrt{2} \pi} e^{- \frac{x^2}{2}} dx \end{equation*}

実用

たとえば、サイコロをn回振った目の合計を考える。全て1(合計がn)や全て6(合計が6n)というケースは稀なので、その間の値になりそうだと予想される。

中心極限定理を用いると、n個のサイコロの目の平均と分散より、n個のサイコロの目の合計は、N( \frac{7}{2} , \frac{35}{12n})に従うことになる。

これをRの下記コードで試してみた。一回の試行でサイコロを投げる回数をn.dicesに設定して、その平均を求める試行を1000回繰り返す。

n.dicesの回数を変化させた実行結果は以下の通りで、このケースの場合は、n=10程度でもかなり平均の周りに尖った分布となる。

CLT_dice_n=01CLT_dice_n=02n=5n=10

 

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です