ポアソン過程の到着間隔~指数分布

離散的な方法による確認

単位時間あたりの到着率\lambdaのポアソン過程において、時刻0に到着が発生した後、次の到着があるまでの時間間隔がt以下である確率を考える。

tn等分し、\Delta t = t / nとすると、到着間隔がt以下なので、連続して到着しなかった後に到着が発生する事象を重ね合わせて、以下のように表せる。

(1)    \begin{eqnarray*} P(\tau \le t) &=& \lambda \Delta t + (1 - \lambda \Delta t)\lambda \Delta t + \cdots + (1 - \lambda \Delta t)^{n-1} \lambda \Delta t \\ &=& \lambda \Delta t \frac{1 - (1 - \lambda \Delta t)^n}{1 - (1 - \lambda \Delta t)} \\ &=& 1 - \left( 1 - \frac{\lambda t}{n} \right) \end{eqnarray*}

ここで-n/\lambda t = rとおいてr \to \inftyの極限をとると、

(2)    \begin{equation*} \lim_{r \to \infty} 1 - \left( 1 + \frac{1}{r} \right)^{-r \lambda t} = 1 - e^{- \lambda t} \end{equation*}

となって指数分布の確率分布関数を得る。

確率密度関数を直接求める方法

到着時間間隔の確率密度関数をf(x)とし、0 \sim tの間は到着が発生せず、t \sim t + \Delta tで到着が発生する場合を考える。

(3)    \begin{equation*} f(t) \Delta t = \left( 1 - \int_0^t f(t) dt \right) \lambda \Delta t \end{equation*}

これより、

(4)    \begin{equation*} f(t) = \lambda - \lambda \int_0^t f(t) dt \end{equation*}

両辺をtで微分して、

(5)    \begin{equation*} f'(t) = - \lambda f(t) \end{equation*}

この微分方程式の解は、

(6)    \begin{equation*} f(t) = C e^{- \lambda t} \end{equation*}

確率密度関数なので、全定義域の積分値が1となることから、

(7)    \begin{equation*} \int_0^\infty C e^{- \lambda t} dt = \left[ - \frac{C}{\lambda} e^{- \lambda t} \right]_0^\infty = 1 \end{equation*}

これよりC = \lambdaを得るので、確率密度関数は以下のように得られる。

(8)    \begin{equation*} f(t) = \lambda e^{- \lambda t} \end{equation*}

Poisson分布から導く方法

ポアソン過程に関して、以下のPoisson分布を考える。

(9)    \begin{equation*} P(X = k) = \frac{(\lambda t)^k}{k!} e^{- \lambda t} \end{equation*}

ここで、時刻T = 0 \sim tの間に全く到着がない確率はその時間の間k = 0であるから、

(10)    \begin{equation*} F(T > t) = e^{- \lambda t} \end{equation*}

ここで、到着時間間隔がt以下である確率は、T = 0 \sim tの間に1回以上到着がある事象の和であり、「1回も到着がない」事象の余事象でもある。これより、以下の指数分布の分布関数を得る。

(11)    \begin{equation*} F(T \le t) = 1 - e^{- \lambda t} \end{equation*}

 

ポアソン分布

Poisson分布の標準形

ポアソン過程の到着数に現れる、離散確率分布。

(1)    \begin{equation*} P(k; \lambda) = \frac{\lambda ^ k}{k!} e^{- \lambda} \end{equation*}

全事象の確率が1となることの確認

(2)    \begin{equation*} \sum_{k=0}^{\infty} \frac{\lambda ^ k}{k!} e^{- \lambda} = e^{\lambda} e^{-\lambda} = 1 \end{equation*}

平均

(3)    \begin{eqnarray*} E(k) &=& \sum_{k=0}^{\infty} k \frac{\lambda ^ k}{k!} e^{- \lambda} = e^{-\lambda} \sum_{k=1}^{\infty} \frac{\lambda ^ k}{(k - 1)!} = e^{-\lambda} \sum_{k=0}^{\infty} \frac{\lambda ^ {k + 1}}{k!} = e^{-\lambda} \lambda \sum_{k=0}^{\infty} \frac{\lambda ^ {k}}{k!} \\ &=& \lambda e^{-\lambda} e^{\lambda} \\ &=& \lambda \end{eqnarray*}

この過程で以下のようになっていることに留意。

(4)    \begin{eqnarray*} \sum_{k=0}^{\infty} k \frac{\lambda ^ k}{k!} &=& 0\cdot \frac{\lambda ^0}{0!} + 1 \cdot \frac{\lambda ^1}{1!} + 2 \cdot \frac{\lambda ^2}{1 \cdot 2} + 3 \cdot \frac{\lambda ^3}{1 \cdot 2 \cdot 3} + \cdots + k\frac{\lambda ^k}{1 \cdots k} + \cdots \\ &=& \frac{\lambda ^1}{1} + \frac{\lambda ^2}{1} + \frac{\lambda ^3}{1 \cdot 2} + \cdots + \frac{\lambda ^k}{1 \cdots (k-1)} + \cdots \left( = \sum_{k=1}^{\infty} \frac{\lambda ^ k}{(k - 1)!} \right) \\ &=& \frac{\lambda ^1}{0!} + \frac{\lambda ^2}{1!} + \frac{\lambda ^3}{2!} + \cdots + \frac{\lambda ^{k}}{k-1} + \cdots \left( = \sum_{k=0}^{\infty} \frac{\lambda ^ {k + 1}}{k!} \right) \\ &=& \lambda \sum_{k=0}^{\infty} \frac{\lambda ^k}{k!} \end{eqnarray*}

分散

(5)    \begin{equation*} V(k) &=& \sum_{k=0}^{\infty} k^2 \frac{\lambda ^k}{k!} e^{- \lambda} - \lambda^2 = e^{- \lambda} \sum_{k=0}^{\infty} k^2 \frac{\lambda ^k}{k!} - {\lambda}^2 \end{equation*}

第一項の和の部分については、

(6)    \begin{eqnarray*} \sum_{k=0}^{\infty} k^2 \frac{\lambda ^k}{k!} &=& \sum_{k=1}^{\infty} k \frac{\lambda ^k}{(k - 1)!} =  \sum_{k=0}^{\infty} (k + 1) \frac{\lambda ^(k + 1)}{k!} \\ &=& \lambda \sum_{k=0}^{\infty} k \frac{\lambda ^k}{k!} +  \lambda \sum_{k=0}^{\infty} \frac{\lambda ^k}{k!} \\ &=& \lambda ^2 e^\lambda + \lambda e^\lambda \end{eqnarray*}

したがって分散は以下のように得られる。

(7)    \begin{equation*} V(k) = \lambda \end{equation*}

確率分布の形状と考察

Poisson分布の形状の特徴は以下の通り。

  • \lambda < 1のときは単調減少
  • \lambda = 1のときk = 0, 1に対する確率が等しく、約0.368
  • \lambda > 1でピークが現れる。

statistics-poisson-distribution

statistics-poisson-table

\lambda < 1は、その観測期間内に平均して1回も来ないようなケース。たとえば\lambda = 0.5だと、平均して20分に1度来訪者が来ているとき次の10分に何人来そうか?といったイメージで、全く来ない確率が約60%、1人来る確率が約30%、2人以上来る確率が1割程度となる。ランダム事象と仮定したときの、災害に当てはめても興味深い。

\lambda = 1は、単位時間あたりの到着率に観測時間を乗じた値が1ということであり、平均的にその観測時間内に1回到着しそうな状況にあたる。このような状況でも全く到着がない確率と1回到着する確率が等しく約37%、2回以上到着する確率が25%強となる。

\lambda > 1の場合、\lambdaの値に近いところで確率が最大となり、\lambdaの値が大きくなるにしたがって高さは低く、裾野が広くなり対称形に近くなる。

 

指数分布

標準形

ポアソン過程の到着時間間隔や信頼性の故障発生間隔に現れる連続確率分布。単位時間当たりの到着率や発生率を\lambdaとしたとき、時刻tを確率変数とした確率密度関数と確率分布関数は以下の形になる。

(1)    \begin{equation*} f(t) = \lambda e^{- \lambda t} \end{equation*}

(2)    \begin{equation*} F(t) = 1 - e^{- \lambda t} \end{equation*}

全事象の確率が1となることの確認

(3)    \begin{equation*} \int_0^\infty \lambda e^{- \lambda t} dt = \left[ e^{-\lambda t} \right]_0^\infty = 1 \end{equation*}

平均

(4)    \begin{eqnarray*} E(t) &=& \int_0^\infty t \lambda e^{- \lambda t} dt = \int_0^\infty x e^{-x} d \frac{x}{\lambda} \\ &=& \frac{1}{\lambda} \left( \int_0^\infty e^{-x} dx - \left[ x e^{-x} \right]_0^\infty \right) = \frac{1}{\lambda} \left[ - e^{-x} - x e^{-x} \right]_0^\infty \\ &=& \frac{1}{\lambda} \end{eqnarray*}

分散

(5)    \begin{eqnarray*} V(t) &=& \int_0^\infty t^2 \lambda e^{-\lambda t} dt - \left( \frac{1}{\lambda} \right)^2 = \frac{1}{\lambda^2} \int_0^\infty x^2 e^{-x} dx - \frac{1}{\lambda^2} \\ &=& \frac{1}{\lambda^2} \left( 2 \int_0^\infty x e^{-x} dx - \left[ x^2 e^{-x} \right]_0^\infty - 1 \right) \\ &=& \frac{1}{\lambda^2} \left( \left[ -2 e^{-x} -2x e^{-x} - x^2 e^{-x} \right]_0^\infty - 1 \right) \\ &=& \frac{1}{\lambda^2} \end{eqnarray*}

確率密度と確率分布の形状

確率密度は当然、指数関数の形状となるため、t = 0で最大値をとる単調減少関数。

このため、到着時間間隔がt以下となるような確率は、t = 0での増加率が最も大きく、その後水平に近くなっていく。

statistics-exponential-density

statistics-exponential-distribution

指数分布に関する考察

指数分布はランダムに到着する客の到着時間間隔やトランザクションの時間、信頼性における機器の故障などに現れるが、「平均発生時間間隔」があるのに何故確率密度がそれを中心とした凸型にならずに単調現象なのか、なかなかストンと胸に落ちなかった。

いろいろ考えていて、「無記憶性」の発生事象ということを考えると、次のように整理はできる。

  • 前の事象の発生と次の事象の発生に、何の因果関係もない
  • 次の瞬間、瞬間に事象が起こる率は一定
  • ということは、前の事象が起こってすぐに次の事象が起こる率\lambda \Delta tより、一定時間後に(それまで発生せず)事象が発生する確率の方が小さくなる(1 - \lambda \Delta t)^{n-1} \lambda \Delta t
  • ゆえに、確率密度は単調現象