ポアソン分布

Poisson分布の標準形

ポアソン過程の到着数に現れる、離散確率分布。

(1)    \begin{equation*} P(k; \lambda) = \frac{\lambda ^ k}{k!} e^{- \lambda} \end{equation*}

全事象の確率が1となることの確認

(2)    \begin{equation*} \sum_{k=0}^{\infty} \frac{\lambda ^ k}{k!} e^{- \lambda} = e^{\lambda} e^{-\lambda} = 1 \end{equation*}

平均

(3)    \begin{eqnarray*} E(k) &=& \sum_{k=0}^{\infty} k \frac{\lambda ^ k}{k!} e^{- \lambda} = e^{-\lambda} \sum_{k=1}^{\infty} \frac{\lambda ^ k}{(k - 1)!} = e^{-\lambda} \sum_{k=0}^{\infty} \frac{\lambda ^ {k + 1}}{k!} = e^{-\lambda} \lambda \sum_{k=0}^{\infty} \frac{\lambda ^ {k}}{k!} \\ &=& \lambda e^{-\lambda} e^{\lambda} \\ &=& \lambda \end{eqnarray*}

この過程で以下のようになっていることに留意。

(4)    \begin{eqnarray*} \sum_{k=0}^{\infty} k \frac{\lambda ^ k}{k!} &=& 0\cdot \frac{\lambda ^0}{0!} + 1 \cdot \frac{\lambda ^1}{1!} + 2 \cdot \frac{\lambda ^2}{1 \cdot 2} + 3 \cdot \frac{\lambda ^3}{1 \cdot 2 \cdot 3} + \cdots + k\frac{\lambda ^k}{1 \cdots k} + \cdots \\ &=& \frac{\lambda ^1}{1} + \frac{\lambda ^2}{1} + \frac{\lambda ^3}{1 \cdot 2} + \cdots + \frac{\lambda ^k}{1 \cdots (k-1)} + \cdots \left( = \sum_{k=1}^{\infty} \frac{\lambda ^ k}{(k - 1)!} \right) \\ &=& \frac{\lambda ^1}{0!} + \frac{\lambda ^2}{1!} + \frac{\lambda ^3}{2!} + \cdots + \frac{\lambda ^{k}}{k-1} + \cdots \left( = \sum_{k=0}^{\infty} \frac{\lambda ^ {k + 1}}{k!} \right) \\ &=& \lambda \sum_{k=0}^{\infty} \frac{\lambda ^k}{k!} \end{eqnarray*}

分散

(5)    \begin{equation*} V(k) &=& \sum_{k=0}^{\infty} k^2 \frac{\lambda ^k}{k!} e^{- \lambda} - \lambda^2 = e^{- \lambda} \sum_{k=0}^{\infty} k^2 \frac{\lambda ^k}{k!} - {\lambda}^2 \end{equation*}

第一項の和の部分については、

(6)    \begin{eqnarray*} \sum_{k=0}^{\infty} k^2 \frac{\lambda ^k}{k!} &=& \sum_{k=1}^{\infty} k \frac{\lambda ^k}{(k - 1)!} =  \sum_{k=0}^{\infty} (k + 1) \frac{\lambda ^(k + 1)}{k!} \\ &=& \lambda \sum_{k=0}^{\infty} k \frac{\lambda ^k}{k!} +  \lambda \sum_{k=0}^{\infty} \frac{\lambda ^k}{k!} \\ &=& \lambda ^2 e^\lambda + \lambda e^\lambda \end{eqnarray*}

したがって分散は以下のように得られる。

(7)    \begin{equation*} V(k) = \lambda \end{equation*}

確率分布の形状と考察

Poisson分布の形状の特徴は以下の通り。

  • \lambda < 1のときは単調減少
  • \lambda = 1のときk = 0, 1に対する確率が等しく、約0.368
  • \lambda > 1でピークが現れる。

statistics-poisson-distribution

statistics-poisson-table

\lambda < 1は、その観測期間内に平均して1回も来ないようなケース。たとえば\lambda = 0.5だと、平均して20分に1度来訪者が来ているとき次の10分に何人来そうか?といったイメージで、全く来ない確率が約60%、1人来る確率が約30%、2人以上来る確率が1割程度となる。ランダム事象と仮定したときの、災害に当てはめても興味深い。

\lambda = 1は、単位時間あたりの到着率に観測時間を乗じた値が1ということであり、平均的にその観測時間内に1回到着しそうな状況にあたる。このような状況でも全く到着がない確率と1回到着する確率が等しく約37%、2回以上到着する確率が25%強となる。

\lambda > 1の場合、\lambdaの値に近いところで確率が最大となり、\lambdaの値が大きくなるにしたがって高さは低く、裾野が広くなり対称形に近くなる。

 

指数分布

標準形

ポアソン過程の到着時間間隔や信頼性の故障発生間隔に現れる連続確率分布。単位時間当たりの到着率や発生率を\lambdaとしたとき、時刻tを確率変数とした確率密度関数と確率分布関数は以下の形になる。

(1)    \begin{equation*} f(t) = \lambda e^{- \lambda t} \end{equation*}

(2)    \begin{equation*} F(t) = 1 - e^{- \lambda t} \end{equation*}

全事象の確率が1となることの確認

(3)    \begin{equation*} \int_0^\infty \lambda e^{- \lambda t} dt = \left[ e^{-\lambda t} \right]_0^\infty = 1 \end{equation*}

平均

(4)    \begin{eqnarray*} E(t) &=& \int_0^\infty t \lambda e^{- \lambda t} dt = \int_0^\infty x e^{-x} d \frac{x}{\lambda} \\ &=& \frac{1}{\lambda} \left( \int_0^\infty e^{-x} dx - \left[ x e^{-x} \right]_0^\infty \right) = \frac{1}{\lambda} \left[ - e^{-x} - x e^{-x} \right]_0^\infty \\ &=& \frac{1}{\lambda} \end{eqnarray*}

分散

(5)    \begin{eqnarray*} V(t) &=& \int_0^\infty t^2 \lambda e^{-\lambda t} dt - \left( \frac{1}{\lambda} \right)^2 = \frac{1}{\lambda^2} \int_0^\infty x^2 e^{-x} dx - \frac{1}{\lambda^2} \\ &=& \frac{1}{\lambda^2} \left( 2 \int_0^\infty x e^{-x} dx - \left[ x^2 e^{-x} \right]_0^\infty - 1 \right) \\ &=& \frac{1}{\lambda^2} \left( \left[ -2 e^{-x} -2x e^{-x} - x^2 e^{-x} \right]_0^\infty - 1 \right) \\ &=& \frac{1}{\lambda^2} \end{eqnarray*}

確率密度と確率分布の形状

確率密度は当然、指数関数の形状となるため、t = 0で最大値をとる単調減少関数。

このため、到着時間間隔がt以下となるような確率は、t = 0での増加率が最も大きく、その後水平に近くなっていく。

statistics-exponential-density

statistics-exponential-distribution

指数分布に関する考察

指数分布はランダムに到着する客の到着時間間隔やトランザクションの時間、信頼性における機器の故障などに現れるが、「平均発生時間間隔」があるのに何故確率密度がそれを中心とした凸型にならずに単調現象なのか、なかなかストンと胸に落ちなかった。

いろいろ考えていて、「無記憶性」の発生事象ということを考えると、次のように整理はできる。

  • 前の事象の発生と次の事象の発生に、何の因果関係もない
  • 次の瞬間、瞬間に事象が起こる率は一定
  • ということは、前の事象が起こってすぐに次の事象が起こる率\lambda \Delta tより、一定時間後に(それまで発生せず)事象が発生する確率の方が小さくなる(1 - \lambda \Delta t)^{n-1} \lambda \Delta t
  • ゆえに、確率密度は単調現象