確率統計 – 平均・期待値

定義

平均の定義には標本平均と確率変数の平均があって、それぞれ定義が異なるので、ここで整理する。

標本平均に対しては算術平均、幾何平均、調和平均などの定義があるが、ここでは算術平均を対象とする。

標本平均

標本平均は、標本データの値を足し合わせてその個数で割った値。

標本の値がX : \{x_1, x_2, \cdots , x_n\}のとき、標本平均\overline{x}は標本値の算術平均で定義される。

(1)    \begin{equation*} \overline{x} = E(X) = \frac{1}{n} \sum_{i=1}^{n} x_i \end{equation*}

確率変数の平均

確率変数の平均は、離散型の場合と連続型の場合それぞれで定義される。

離散型の確率変数X\{x_1, x_2, \cdots , x_n\}の値を取り、それぞれの値をとる確率を{\rm Pr}(X = x_i)と表すと、Xの母平均\muは確率変数とその確率変数の発生確率の積の総和で定義される。

(2)    \begin{equation*} \mu = E(X) = \sum_{i=1}^{n} x_i {\rm Pr}(X = x_i) \end{equation*}

連続型の確率変数の平均は、確率密度関数をf(x)とすると、Xの母平均\muは、確率変数とその値に対する確率密度の積の全定義域における積分で定義される。

(3)    \begin{equation*} \mu = E(X) = \int_{- \infty}^{\infty} x f(x) dx \end{equation*}

平均(期待値)の性質

平均(期待値)には以下の性質がある。これらは、母集団の確率分布に関係なく常に成り立つ。

(4)    \begin{equation*} E(X+t) =E(X)+t \end{equation*}

(5)    \begin{equation*} E(aX) =a E(X) \end{equation*}

(6)    \begin{equation*} E(X+Y) =E(X)+E(Y) \end{equation*}

定数加算

標本値、確率変数に定数を加えた場合の平均は、元の平均に定数を加えた値に等しい。

     \begin{equation*} E(X+t) =E(X)+t \end{equation*}

証明:標本平均

(7)    \begin{equation*} E(X+t) = \frac{1}{n} \sum_{i=1}^{n} (x_i + t) = \frac{1}{n} \sum_{i=1}^{n} x_i + \frac{1}{n} \sum_{i=1}^{n} t = E(X) + t \end{equation*}

証明:離散型確率変数

(8)    \begin{eqnarray*} E(X + t) &=& \sum_{i=1}^{n} (x_i + t){\rm Pr}(X = x_i) \\ &=& \sum_{i=1}^{n} x_i {\rm Pr}(X = x_i) + t  \sum_{i=1}^{n} {\rm Pr}(X = x_i) \\ &=& E(X) + t \end{eqnarray*}

証明:連続型確率変数

(9)    \begin{eqnarray*} E(X + t) &=& \int_{- \infty}^{\infty} (x + t) f(x) dx \\ &=& \int_{- \infty}^{\infty} x f(x) dx + t \int_{- \infty}^{\infty} f(x) dx \\ &=& E(X) + t \end{eqnarray*}

定数倍

標本値、確率変数を定数倍した場合の平均は、元の平均の定数倍に等しい。

     \begin{equation*} E(aX) =aE(X) \end{equation*}

証明:標本平均

(10)    \begin{equation*} E(aX) = \frac{1}{n} \sum_{i=1}^{n} ax_i = a \cdot \frac{1}{n} \sum_{i=1}^{n} x_i = a E(X) \end{equation*}

証明:離散型確率変数

(11)    \begin{equation*} E(aX) &=& \sum_{i=1}^{n} a x_i {\rm Pr}(X = x_i) = a  \sum_{i=1}^{n} x_i {\rm Pr}(X = x_i) = a E(X) \end{equation*}

証明:連続型確率変数

(12)    \begin{equation*} E(aX) &=& \int_{- \infty}^{\infty} ax f(x) dx = a \int_{- \infty}^{\infty} x f(x) dx = a E(X) \end{equation*}

和の平均

複数の標本値(データセット)、確率変数を加えた場合の平均は、それぞれの平均の和に等しい

     \begin{equation*} E(X + Y) = E(X) + E(Y) \end{equation*}

証明:標本平均

(13)    \begin{equation*} E(X+Y) = \frac{1}{n} \sum_{i=1}^{n} (x_i + y_i) = \frac{1}{n} \sum_{i=1}^{n} x_i +  \frac{1}{n} \sum_{i=1}^{n} y_i = E(X) + E(Y) \end{equation*}

証明:離散型確率変数

 

確率変数Xx_i (i=1~m)Yy_j (j=1~n)であり、XYはそれぞれの確率分布に従うとする。また、XYの同時生起確率を{\rm Pr}(x_i,y_j)と表す。

このとき、確率変数X+Yの平均は以下のように計算される。

(14)    \begin{eqnarray*} E(X+Y) &=& \sum_{i=1}^{m} \sum_{j=1}^{n} (x_i + y_j) {\rm Pr}(x_i,y_j) \\ &=& \sum_{i=1}^{m} \sum_{j=1}^{n} x_i {\rm Pr}(x_i,y_j) +  \sum_{i=1}^{m} \sum_{j=1}^{n} y_j {\rm Pr}(x_i,y_j) \end{eqnarray*}

上式の第1項についてみると、x_iの値に対してすべてのy_jのとりうる値を考慮していることから、x_iとそれに対する生起確率{\rm Pr}(X = x_i)=Pr(x_i)となり、第1項はXの平均となる。

(15)    \begin{equation*} \sum_{i=1}^{m} \sum_{j=1}^{n} x_i {\rm Pr}(x_i,y_j) = \sum_{i=1}^{m} x_i  {\rm Pr}(x_i) \end{equation*}

第2項も同様にYの平均なので、以下が成り立つ。

     \begin{equation*} E(X + Y) = E(X) + E(Y) \end{equation*}

証明:連続型確率変数

確率変数X:x , Y:yに対する同時生起確率密度をf(x, y)とすると、

(16)    \begin{eqnarray*} E(X,Y) &=& \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} (x + y) f(x, y) dy dx \\ &=& \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} x f(x, y) dydx + \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} y f(x, y) dxdy \end{eqnarray*}

離散型と同様の考え方により、上式の第1項、第2項はそれぞれX, Yの平均となり、次式が成り立つ。

     \begin{equation*} E(X + Y) = E(X) + E(Y) \end{equation*}

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です