概要
中心極限定理(central limit theorem: CLT)は、一言で言えば次のようになる。「母集団がどのような確率分布に従うとしても、標本の数を十分大きくしたときには、その合計値あるいは標本平均は、正規分布に従う」
具体的には、母集団の平均を、標準偏差をとし、が十分に大きいとき、
- 標本の合計は正規分布に従う
- 標本平均は正規分布に従う
表現
中心極限定理は、一般には以下のように表される。
(1)
これを少し変形すると、
(2)
実用
たとえば、サイコロを回振った目の合計を考える。全て1(合計が)や全て6(合計が6)というケースは稀なので、その間の値になりそうだと予想される。
中心極限定理を用いると、個のサイコロの目の平均と分散より、個のサイコロの目の合計は、に従うことになる。
これをRの下記コードで試してみた。一回の試行でサイコロを投げる回数をn.dicesに設定して、その平均を求める試行を1000回繰り返す。
1 2 3 4 5 6 7 8 9 10 11 12 |
n.dices <- 5 n.data <- 1000 num.data <- lambda * t.obs data <- c() for (i in 1:n.data) { data <- c(data, mean(as.integer(runif(n.dices, min=1, max=7)))) } ranks <- seq(0, 6, 0.5) hist(data, breaks=ranks, prob=T, main=paste("n =", n.dices)) curve(dnorm(x, 7/2, 35/12/n.dices), add=TRUE) |
n.dicesの回数を変化させた実行結果は以下の通りで、このケースの場合は、=10程度でもかなり平均の周りに尖った分布となる。