標本空間と事象
起こり得るすべての結果は分かっていても、その中のどの結果が実際に起こるかはランダムネスによって支配されている実験や観察を試行と呼びます。試行によって起こり得る個々の結果を標本点と呼び、すべての標本点からなる集合を標本集合と呼びます。試行によって起こり得る現象は標本空間の部分集合として定式化され、それを事象と呼びます。
確率の定義について述べる前に、まずは確率の測定対象となる現象を定式化します。
起こり得るすべての結果は分かっていても、その中のどの結果が実際に起こるかはランダムネスによって支配されている実験や観察を試行と呼びます。試行によって起こり得る個々の結果を標本点と呼び、すべての標本点からなる集合を標本集合と呼びます。試行によって起こり得る現象は標本空間の部分集合として定式化され、それを事象と呼びます。
ある事象 A が別の事象 B の部分集合であるとき、A は B の部分事象であるといいます。A が B の部分事象であることは、試行のもとで A が起こる場合には B も必ず起こることを意味します。
事象 A に属する標本点と事象 B に属する標本点が完全に一致するとき、A と B は等しいと言います。これは、A が B の部分事象であるとともに、B が A の部分事象であることを意味します。
標本空間はそれ自身の部分集合であることから、これもまた事象です。標本空間を事象とみなしたとき、それを全事象と呼びます。全事象は試行によって必ず起こる現象に相当する事象です。
空集合は任意の集合の部分集合であることから、標本空間の部分集合でもあり、したがって事象です。空集合を事象とみなしたとき、それを空事象と呼びます。空事象は試行によって決して起こらない現象に相当する事象です。
事象は標本空間の部分集合として定義されるため、事象を対象とする集合演算を行うことができます。
事象 A の補集合として定義される事象を A の余事象と呼びます。これは「事象 A が起こらない」という現象に相当する事象です。
事象 A と事象 B の共通部分として定義される事象を A と B の積事象と呼びます。これは「A と B の双方が起こる」という現象に相当する事象です。また、A と B の積事象が空事象であるとき、A と B はお互いに排反事象であると言います。
事象 A と事象 B の和集合として定義される事象を A と B の和事象と呼びます。これは「A と B の少なくとも一方が起こる」という現象に相当する事象です。
事象 A と事象 B の差集合として定義される事象を A と B の差事象と呼びます。これは「A は起こるが B は起こらない」という現象に相当する事象です。
事象 A と事象 B の対称差として定義される事象を A と B の対称差事象と呼びます。これは「A と B の少なくとも一方が起こるが両者が同時には起こらない」という現象に相当する事象です。
確率をどのように定義すべきか、基本的な考え方をいくつか紹介します。
試行に関する標本空間に含まれる標本点はいずれも同じ程度の確かさで起こるという仮定のもと、問題としている事象に含まれる標本点の個数と、標本空間に含まれる標本点の個数の比として事象の確率を定める立場を経験的確率やラプラスの確率と呼びます。
何かを1つ選択する場合の選び方の数を求める際には、すべての選択肢を互いに交わらない複数のグループに分類した上で、それぞれのグループに含まれる選択肢の数を数え、それらの和をとります。これを和の法則と呼びます。
複数の選択肢のグループから1つずつ選択する場合の選び方の数を求めるためには、それぞれのグループに含まれる選択肢の数を数え、それらの積をとります。これを積の法則と呼びます。
有限n個の要素を持つ集合から1つずつ順番に、合計k個の要素を重複しない形で選んだ上で、このk個の要素を選んだ順番に並べることで得られる要素の列を順列と呼びます。
有限n個の要素を持つ集合からk個の要素を選べば、このk個の要素からなるもとの集合の部分集合が得られますが、これを組合せと呼びます。
同一条件のもとで何回でも繰り返すことができ、なおかつ、各回においてどの標本点が起こるかが互いに干渉しないような試行を実際に繰り返したときに、事象と整合的な標本点が出た回数と試行回数の比が一定の値に収束するならば、その極限を事象の確率と定める立場を経験的確率と呼びます。
ビュッフォンの針の先験的確率と経験的確率を求めるとともに、モンテ・カルロ法と呼ばれる概念について解説します。
確率の概念を解釈する先験的確率や経験的確率などの他にも存在しますが、いずれも一長一短であり、結局のところ、確率とは何かという議論の最終的な結論は見えそうにありません。そこでコルモゴロフは、確率の概念を具体的に解釈するのではなく、最初にいくつかの公理を設定して、それらを満たす対象を確率とみなす公理主義的立場を採用しました。
公理主義的確率論の立場から確率の概念を定式化します。
標本空間が有限集合であるとき、その任意の部分集合を事象として考察対象に含めることができます。その上で、標本空間のベキ集合上に集合関数を定義した上で、それが確率論の公理と呼ばれる性質を満たすものと定めます。こうして得られる概念を有限確率空間と呼びます。
標本空間が可算集合であるとき、その任意の部分集合を事象として考察対象に含めることができます。その上で、標本空間のベキ集合上に集合関数を定義した上で、それが確率論の公理と呼ばれる性質を満たすものと定めます。こうして得られる概念を可算確率空間と呼びます。
標本空間が非可算集合であるとき、その任意の部分集合を事象として考察対象に含めると問題が生じます。そこで、σ-代数と呼ばれる集合系を事象空間として採用し、その上に確率論の公理を満たす集合関数を定義します。
空事象は可測であり、その確率はゼロです。これらのことを確率論の公理から示します。
和事象は可測です。排反事象の和事象の確率を知る上で確率関数の加法性が役に立ち、排反であるとは限らない事象の和事象に関しては劣加法性や加法定理が役に立ちます。
確率論の公理より、任意の事象の余事象は可測です。さらに、事象 A の余事象の確率は、全事象の確率に相当する 1 から事象 A の確率を引くことで得られます。これを確率論の公理から示します。
積事象は可測です。2つの事象の確率とそれらの和事象の確率が分かっている場合、積事象の確率は加法定理から導くことができます。和事象の確率が不明である場合、ボンフェローニの不等式を利用すれば積事象の確率の範囲を絞ることができます。
差事象は可測です。事象 A,B の差事象の確率は、事象 A の確率から積事象の確率を引くことにより得られます。
対称差事象は可測です。対称差事象の確率は、それぞれの事象の確率の和から、積事象の確率の2倍を引くことにより得られます。
可算個の事象からなる事象列が単調増加列もしくは単調減少列である場合には、その和事象や積事象の確率に関して、連続性と呼ばれる性質が成り立ちます。
可測事象の確率が0である場合、そのような事象を零事象と呼びます。また、可測事象の確率が1である場合、そのような事象をほぼ確実な事象と呼びます。
可算個の事象の確率の総和が有限な実数である場合、それらの事象の上極限の確率は0になるとともに、それらの事象の余事象の下極限の確率は1になります。これをボレル・カンテリの第1補題と呼びます。
事象の確率を評価する際に、別の事象が起こっていることが判明している場合には、条件付き確率と呼ばれる概念のもとで確率を評価します。
試行によって事象 A が起きているか否かは観察できないものの、何らかの事情により、別の事象 B が起きているか否かは観察可能である場合(もしくは、事象 B が起きているものと仮定する場合)には、事象 A が起こる確率を条件付き確率という概念のもとで評価することができます。
積事象の確率を導出する方法としては加法定理の他に、条件付き確率を用いた方法も存在します。
ある事象の確率を直接求めることが困難である場合、起こり得るすべての状況が排反事象に分割可能であれば、問題としている事象を分割することにより、その確率を容易に求めることができます。
「事象Aが起きたという前提のもと、その後に事象Bが起こる確率」が判明している場合には、ベイズの定理を利用することにより、「事象Bが起きたことが観察された場合、それ以前に、前提として事象Aが起こっていた確率」を特定できます。
モンティ・ホール問題とその解法について解説するとともに、この問題の核心が、追加的な情報を活用した事前確率の事後確率への更新にあることを説明します。
被告人が犯人である(もしくは無実である)確率と、証拠が得られる確率を混同する誤りを検察官の誤謬と呼びます。
母集団に対して成立する仮説と、母集団を分割することにより得られる集団に対して成立する仮説とが正反対になる現象をシンプソンのパラドクスと呼びます。
事象が独立であることの意味を定義します。
事象Bが起こるかどうかが事象Aが起こる確率に影響を与えない場合、これらの事象は独立であると言います。これは、2つの事象の積事象の確率が個々の事象の確率の積と一致することとして定式化されます。
有限個の事象が独立であることの意味を定義するとともに、その代表的な性質について解説します。
可算個の事象が与えられたとき、そこから有限個の事象を任意に選んだ場合にそれらが独立であるならば、もとの可算個の事象は独立であると言います。
可算個の独立な事象の確率の総和が無限大である場合、それらの事象の上極限の確率は1になるとともに、それらの事象の余事象の下極限の確率は0になります。これをボレル・カンテリの第2補題と呼びます。
事象族が独立であることの意味を定義します。
乗法族(π-族)とディンキン族(λ-族)および完全加法族(σ-代数)などの概念を定義するとともに、これらの概念の間に成立する関係について解説します。
2つの事象族から選ばれた事象どうしが独立になることが保証される場合、それらの事象族は独立であると言います。2つの事象族が独立であり、なおかつ各々が積事象について閉じている場合、それらから生成されるσ-代数もまた独立になることが保証されます。
有限個の事象族から選ばれた事象どうしが独立になることが保証される場合、それらの事象族は独立であると言います。有限個の事象族が独立であり、各々が積事象について閉じているとともに全体事象を要素として持つ場合、それらから生成されるσ-代数もまた独立になることが保証されます。
可算個の事象族の中から有限個の事象族を任意に選んだ場合にそれらが独立であるならば、もとの可算個の事象は独立であると言います。
可算事象族の要素である無限個の事象の影響を受ける一方で、有限個の事象の影響を受けない事象を末尾事象と呼びます。可算事象族が独立である場合、その任意の末尾事象の確率は0または1のどちらか一方に定まります。これをコルモゴロフの0-1の法則と呼びます。
事象が条件付き独立であることの意味を定義します。
事象Cが起きているという前提のもと、事象Bが起こるかどうかが事象Aが起こる確率に影響を与えない場合、これらの事象はCのもとで条件付き独立であると言います。
確率や統計で頻繁に用いられる特別な関数について解説します。
ガンマ関数と呼ばれる関数を定義するとともに、その基本的な性質について解説します。ガンマ関数は階乗関数の一般化です。
ベータ関数と呼ばれる関数を定義するとともに、その基本的な性質について解説します。
確率に関する確認テストです。
本節で得た知識は以下の分野を学ぶ上での基礎になります。
それぞれの標本点に対して実数を1つずつ割り当てる写像を確率変数と呼びます。確率変数の概念を定義するとともに、その性質を解説します。
確率に関して定量的な分析を行うために確率変数を用いて標本点を数値化します。特に、試行において起こり得る結果が有限個ないし可算個である場合には離散型の確率変数を利用します。
確率に関して定量的な分析を行うために確率変数を用いて標本点を数値化します。特に、試行において起こり得る結果が非可算個である場合には連続型の確率変数を利用します。
代表的な確率分布を紹介するとともに、その性質を解説します。
漸近理論について解説します。