目次へ

>> 101112131415161718

二項分布の期待値,分散,標準偏差


今回は二項分布の期待値、分散、標準偏差を求めます。


今、Yがパラメータ (N,p) の二項分布に従う確率変数であるとします。復習すると、このとき Y は「確率 p で事象Aが起こるベルヌーイ試行N 回行ったときにAが起こる回数」です。Aの解釈は「成功」「当たり」「陽性」など何でも構いません。Y の実現値は0からN のいずれかです。Y の期待値や分散はいくつになるでしょうか。


これを求めるテクニックは次の通りです。今、X_1 を1回目の結果、X_2 を2回目の結果、X_3 を3回目の結果… としましょう。いずれも、Aが起これば1、起こらなければ0です。Y は「N 回のうち何回Aが起こるか」なので、

    \begin{eqnarray*}Y = X_1 + X_2 + \cdots + X_N\end{eqnarray*}


と表せます。各 X_ii=1,2,\cdots, N)はベルヌーイ分布です。


これを利用すれば、Y の期待値は(上の式の両辺の期待値を取れば)

    \begin{eqnarray*}E[Y] &=& E[X_1 + X_2 + \cdots + X_N]\\&=& E[X_1] + E[X_2] + \cdots + E[X_N]\\&=& p + p + \cdots + p\\&=& Np\end{eqnarray*}


と求まります。2つめのイコールは「線形結合の期待値」の公式、3つめのイコールはベルヌーイ分布の期待値p であること(E[X_i]=p)を用いています。この結果(E[Y] = Np)は直観的です。確率0.36で天使シールが出るビックリマンチョコを100個買ったら、当たる天使シールの数の期待値は36枚だと言っているのです。


他方の分散を求めるには分散公式(係数が全て1の場合)を用います。

    \begin{eqnarray*}\mbox{Var}[Y] &=& \mbox{Var}[X_1 + X_2 + \cdots + X_N]\\&=& \sum^N_{i=1} \mbox{Var}[X_i] + \sum_{i<j} 2\mbox{Cov}(X_i, X_j)\\&=& Np(1-p)\end{eqnarray*}


2つめのイコールが分散公式です。最後のイコールは、

(i) ベルヌーイ分布の分散\mbox{Var}[X_i]=p(1-p)
(ii) ベルヌーイ試行の結果は互いに独立なので、共分散は全て0

を用いています。標準偏差は分散の平方根なので \sqrt{Np(1-p)} です。確率0.36で天使シールが出るビックリマンチョコを100個買う例では、当たる天使シールの標準偏差は \sqrt{100\cdot 0.36\cdot (1-0.36)} = 4.8 枚となります。


このように、二項分布の期待値、分散、標準偏差は、「二項分布にしたがう確率変数が、ベルヌーイ分布に従う確率変数の和であること」に気づけば、簡単に求めることができます。


次回は二項分布から派生する分布の例を紹介したいと思います。


今日のポイント
二項分布は、ベルヌーイ分布の和であることを利用して期待値・分散を求める。




>> 確率分布(離散型)(8)二項分布の派生分布