確率の定義たち
標本空間と標本点
ある系に対して、起こりうる全ての結果の集合を標本空間といい、その要素を標本点といいます。起こりうる事象とは標本空間の部分空間として定義され、事象はを満たします。事象が空集合であるとき、空事象といいます。
標本空間は離散的な場合もあれば、連続的な場合もあります。
例:コインを1回投げる(離散的)
コインの表、裏をそれぞれ1, 0と対応させると、標本空間は
であり、事象は
です。
例:電球の寿命
電球の寿命を標本空間とすると、電球が製作されてから無限の時間が標本空間であり
です。ここで事象として電球が1000時間まで正常に稼働するという事象は、
です(単位は時間)。
確率の定義
確率の定義にはいくつか種類があり、ここでは4つほど紹介します。
- ラプラスの古典的定義
- 相対頻度に基づく頻度説
- コルモゴロフの公理主義的定義
- ベイズ的主観確率
ラプラスの古典的定義
試行の根本事象の数が全部で個あって、それらは同様に確からしいとします。このとき、事象が起こりうる根本事象が回起こる時、事象の確率は
と定義されます。
「同様に確からしい」という仮定のもとこの定義は成り立ちます。この点が古典的定義の欠点となります。
一方、根本事象に対して、何も偏りがある理由を説明できないとき、「同様に確からしい」ことは妥当だとみなします。この原則を理由不十分の原則といいます。
例えば、コインやサイコロが正しく作られていることを期待し、不正が見つからない場合には、原則から、コインや裏表やサイコロの出る目は同様に確からしいとみなします。この立場からは、仮にコインやサイコロの重心がずれているような不正があったとしても、正しい確率を与えることができないことに注意しなければなりません。
頻度説
古典的定義に対して、同様に確からしくない場合でも確率論を構成したくなります。ナイーブには、現れる結果の頻度に対して確率を構成することです。出現頻度が高ければ確率は高い、出現頻度が低ければ確率は低い、という考え方です。
一般に、事象を生成しうる実験を回繰り返し、が生成される回数をとします。この実験を無限に繰り返したときに収束する値
が得られるならば、その確率をと定義します。
コルモゴロフの公理主義的定義
現代の確率論は、基本的に下記の公理系を認めてから構成します。
- 公理1:任意の事象に対して、が成り立つ。
- 公理2:
- 公理3:互いに排反な事象に対して、
が成り立つ。
主観確率
ある事象が起こる回数や頻度は客観的に評価できるのに対し、研究者らがこれまでの研究の情報や観測の示唆から主観的に確率を与えることがあり、これを主観確率といいます。これはベイズ統計学につながる話なので、後ほど勉強します。
Inuverse Sci. X Tech. Blog