目次へ

>> 101112131415161718

確率のモデル化


サイコロの目は、1から6が等確率に出る「一様分布」に従います。また、コインを3枚投げたときに表が出る数は、N=3p=0.5 の「二項分布」に従います。これらは確かにそうだと納得する人がほとんどでしょう。


では、「100人の履修者のうち、授業に出席する人の数」はどうでしょうか。100人の学生が各々出席または欠席するのですから、100枚のコインを投げるのに似ています。仮に大学の授業の出席率が平均60%とするなら、出席者数は 「N=100p=0.6 の二項分布」に従うと考えられるでしょう。


ここで「考えられる」と言ったのは、本当にそうだとは言い切れないからです。コイン投げなら各コインの結果は確かに独立しており、ベルヌーイ試行とみなせます。しかし、100人の学生の出席はどうでしょう。ひょっとすると仲の良い学生たちは、一緒に授業に出るか、さぼって遊びに行くか決めているかもしれません。そうだとすると、正確にはベルヌーイ試行とは言えないことになります。


それでも、仮にほとんどの学生が各々独立に出欠を決め、かつ出席の確率はみな60%くらいであるとすれば、出席者数はだいたい二項分布に従うとみなせます。その場合、出席者数の確率分布を、二項分布で「記述した」とか「モデル化した」と言います。サイコロやコイン投げとは違って、正確なところは分からないけれども、その確率分布を仮定したという意味です。


確率分布をモデル化することのメリットは、仮想的な確率をシミュレーションできることです。例えば、履修者が100人いるにもかかわらず、利用可能な講義室には席が80個しかないとしましょう。席が足りずに座れない学生が出てしまう確率はどれくらいでしょうか。予備の椅子を用意すべきでしょうか。


この問に答えるためには、N=100p=0.6 の二項分布で、81以上が実現する確率を求めればいいのです。エクセルでは
= BINOM.DIST(80, 100, 0.6, TRUE)
で、出席者が80人以下である確率を求めることができます。求めてみると0.9999941です。つまり、81人以上出席する確率は10万分の1以下であり、席が足りなくなる心配は不要という結論になります。


確率のモデル化によく用いられる確率分布に「ポアソン分布」があります。そこで、次回からポアソン分布を説明します。

>> 確率分布(離散型)(13)ポアソン分布(1)ポアソン分布の作り方