概要
中心極限定理(central limit theorem: CLT)は、一言で言えば次のようになる。「母集団がどのような確率分布に従うとしても、標本の数を十分大きくしたときには、その合計値あるいは標本平均は、正規分布に従う」
具体的には、母集団の平均を
、標準偏差を
とし、
が十分に大きいとき、
- 標本の合計
は正規分布
に従う
- 標本平均
は正規分布
に従う
表現
中心極限定理は、一般には以下のように表される。
(1) 
これを少し変形すると、
(2) 
実用
たとえば、サイコロを
回振った目の合計を考える。全て1(合計が
)や全て6(合計が6
)というケースは稀なので、その間の値になりそうだと予想される。
中心極限定理を用いると、
個のサイコロの目の平均と分散より、
個のサイコロの目の合計は、
に従うことになる。
これをRの下記コードで試してみた。一回の試行でサイコロを投げる回数をn.dicesに設定して、その平均を求める試行を1000回繰り返す。
|
n.dices <- 5 n.data <- 1000 num.data <- lambda * t.obs data <- c() for (i in 1:n.data) { data <- c(data, mean(as.integer(runif(n.dices, min=1, max=7)))) } ranks <- seq(0, 6, 0.5) hist(data, breaks=ranks, prob=T, main=paste("n =", n.dices)) curve(dnorm(x, 7/2, 35/12/n.dices), add=TRUE) |
n.dicesの回数を変化させた実行結果は以下の通りで、このケースの場合は、
=10程度でもかなり平均の周りに尖った分布となる。



