条件付き確率
ある試行に関する確率空間\((\Omega ,\mathcal{F},P)\)が与えられているものとします。つまり、事象空間\(\mathcal{F}\subset 2^{\Omega }\)は可測空間の公理\begin{eqnarray*}&&\left( M_{1}\right) \ \mathcal{F}\not=\phi \\
&&\left( M_{2}\right) \ \forall A\in \mathcal{F}:A^{c}\in \mathcal{F} \\
&&\left( M_{3}\right) \ \forall \left\{ A_{n}\right\} _{n\in \mathbb{N} }\subset \mathcal{F}:\bigcup_{n\in \mathbb{N} }A_{n}\in \mathcal{F}
\end{eqnarray*}を満たすとともに、確率測度\(P:\mathcal{F}\rightarrow \mathbb{R} \)は確率論の公理\begin{eqnarray*}&&\left( P_{1}\right) \ \forall A\in \mathcal{F}:P\left( A\right) \geq 0 \\
&&\left( P_{2}\right) \ P\left( \Omega \right) =1 \\
&&\left( P_{3}\right) \ \forall \text{排反な}\left\{
A_{n}\right\} _{n\in \mathbb{N} }\subset \mathcal{F}:P\left( \bigcup_{n\in \mathbb{N} }A_{n}\right) =\sum_{n\in \mathbb{N} }P\left( A_{n}\right)
\end{eqnarray*}を満たすということです。試行の結果はランダムネスによって支配されているため、試行によって事象\(A\in \mathcal{F}\)が起こるかどうかを確定的に知ることはできず、事象\(A\)が起こる確率\(P\left( A\right) \)のもとで試行を評価せざるを得ません。
では、試行によって事象\(A\)が起こるかどうかを事前に観察できないものの、何らかの事情により、別の事象\(B\in \mathcal{F}\)が起きたことが観察された場合(もしくは、事象\(B\)が起きているものと仮定する場合)、事象\(A\)が起こる確率をどのように評価すべきでしょうか。このような場合にも事象\(A\)が起こる確率を\(P\left( A\right) \)と評価したのでは、事象\(B\)が起きているという追加的な情報を活用できておらず望ましくありません。ある事象が起きたことを前提とした上で別の事象が起きる確率を評価する際には、通常の確率とは異なる新たな概念が必要です。
確率空間\((\Omega ,\mathcal{F},P)\)が与えられたとき、2つの事象\(A,B\in \mathcal{F}\)について、事象\(B\)が起きたことを前提としたときに事象\(A\)が起こる確率を、事象\(B\)が起きたという条件のもとでの事象\(A\)の条件付き確率(conditional probability of the event \(A\) given that the event \(B\) has occurred)と呼び、これを、\begin{equation*}P\left( A|B\right)
\end{equation*}で表記します。では、この条件付き確率を具体的にどのように定義すべきでしょうか。直感的に明らかな事実を出発点に考察を行います。
標本空間が有限ないし可算集合である場合の条件付き確率
まずは標本空間\(\Omega \)が有限集合ないし可算集合である場合の確率空間\begin{equation*}\left( \Omega ,2^{\Omega },P\right)
\end{equation*}を舞台に議論を行います。つまり、確率測度\(P:2^{\Omega }\rightarrow \mathbb{R} \)は確率論の公理\begin{eqnarray*}&&\left( P_{1}\right) \ \forall \omega \in \Omega :P\left( \left\{ \omega
\right\} \right) \geq 0 \\
&&\left( P_{2}\right) \ \sum_{\omega \in \Omega }P\left( \left\{ \omega
\right\} \right) =1 \\
&&\left( P_{3}\right) \ \forall A\in 2^{\Omega }:P\left( A\right)
=\sum_{\omega \in A}P\left( \left\{ \omega \right\} \right)
\end{eqnarray*}を満たすということです。事象\(B\in 2^{\Omega }\)が起きたという条件のもとでの事象\(A\in 2^{\Omega }\)の条件付き確率\begin{equation*}P\left( A|B\right)
\end{equation*}をどのように評価すればよいでしょうか。
ここでのポイントは、事象\(B\)が起きたことはすでに分かっているため、試行によって実現した標本点が事象\(B\)の要素であることが確定しているという点です。したがって、考察対象とすべき標本空間を\(\Omega \)から\(B\)へと縮小できます。つまり、事象\(B\)が起きたという条件のもとでの事象\(A\)の条件付き確率について考える際には、新たな確率空間\begin{equation*}\left( B,2^{B},P(\cdot |B)\right)
\end{equation*}を舞台として設定するのがもっともらしいということです。新たな確率測度\(P\left( \cdot|B\right) :2^{B}\rightarrow \mathbb{R} \)にあわせて確率論の公理を書き換えると、\begin{eqnarray*}&&\left( P_{1}\right) \ \forall \omega \in B:P\left( \left\{ \omega \right\}
|B\right) \geq 0 \\
&&\left( P_{2}\right) \ \sum_{\omega \in B}P\left( \left\{ \omega \right\}
|B\right) =1 \\
&&\left( P_{3}\right) \ \forall A\in 2^{B}:P\left( A|B\right) =\sum_{\omega
\in A}P\left( \left\{ \omega \right\} |B\right)
\end{eqnarray*}となりますが、以上の公理を満たす確率測度\(P\left( \cdot |B\right) \)を具体的に構成することはできるのでしょうか。
試みとして、事象\(B\)の部分事象\(A\in 2^{B}\)に対して、その条件付き確率を、\begin{equation*}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\end{equation*}と定める関数\(P\left( \cdot |B\right):2^{B}\rightarrow \mathbb{R} \)を確率測度の候補として採用します。ただし、右辺中の\(P\)はもとの確率空間\(\left( \Omega ,2^{\Omega},P\right) \)のもとでの確率測度\(P:2^{\Omega }\rightarrow \mathbb{R} \)です。また、事象\(B\)が起きている状況を想定しているため、\begin{equation*}P\left( B\right) >0
\end{equation*}と定めます。加えて、\(A\in 2^{B}\)すなわち\(A\subset B\)より\(A\cap B=A\)であるため、先の定義は、\begin{equation*}P\left( A|B\right) =\frac{P\left( A\right) }{P\left( B\right) }
\end{equation*}と必要十分です。つまり、事象\(B\)が起きたことが分かっている場合には、その部分事象\(A\)が起こる確率を、両者の確率の商として評価するということです。
以上のように定義された関数\(P\left( \cdot |B\right) \)は確率論の公理を満たします。
\end{equation*}を定める関数\(P\left( \cdot |B\right):2^{B}\rightarrow \mathbb{R} \)を定義する。このとき、\(\left( B,2^{B},P\left( \cdot |B\right) \right) \)は確率空間となる。すなわち、\begin{eqnarray*}&&\left( a\right) \ \forall \omega \in B:P\left( \left\{ \omega \right\}
|B\right) \geq 0 \\
&&\left( b\right) \ \sum_{\omega \in B}P\left( \left\{ \omega \right\}
|B\right) =1 \\
&&\left( c\right) \ \forall A\in 2^{B}:P\left( A|B\right) =\sum_{\omega \in
A}P\left( \left\{ \omega \right\} |B\right)
\end{eqnarray*}が成り立つ。
以上の命題より、事象\(B\)およびその部分事象\(A\)がそれぞれ任意に与えられたとき、条件付き確率を、\begin{equation}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\quad \cdots (1)
\end{equation}と定義すれば確率論の公理とは矛盾しないことが明らかになりました。では、事象\(B\)の部分事象であるとは限らない事象\(A\)に対して、その条件付き確率\(P\left( A|B\right) \)をどのように定義すればよいでしょうか。言い換えると、もとの標本空間\(\Omega \)のもとで、\begin{equation*}\left( \Omega ,2^{\Omega },P\left( \cdot |B\right) \right)
\end{equation*}が確率空間になるような確率測度\(P\left( \cdot |B\right):2^{\Omega }\rightarrow \mathbb{R} \)を具体的に構成できるのでしょうか。実は、このような場合にも、条件付き確率を\(\left( 1\right) \)と同様に定義できます。
\end{equation*}を定める関数\(P\left( \cdot |B\right):2^{\Omega }\rightarrow \mathbb{R} \)を定義する。このとき、\(\left( \Omega ,2^{\Omega },P\left( \cdot |B\right) \right) \)は確率空間となる。すなわち、\begin{eqnarray*}&&\left( a\right) \ \forall \omega \in \Omega :P\left( \left\{ \omega
\right\} |B\right) \geq 0 \\
&&\left( b\right) \ \sum_{\omega \in \Omega }P\left( \left\{ \omega \right\}
|B\right) =1 \\
&&\left( c\right) \ \forall A\in 2^{\Omega }:P\left( A|B\right)
=\sum_{\omega \in A}P\left( \left\{ \omega \right\} |B\right)
\end{eqnarray*}が成り立つ。
以上の議論より、問題としている試行の標本空間\(\Omega \)が有限集合または可算集合である場合には、2つの事象\(A,B\subset \Omega \)をそれぞれ任意に選んだとき、条件付き確率を、\begin{equation*}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\end{equation*}と定義すれば確率論の公理と矛盾しないことが明らかになりました。
1,2\right\} :x_{i}\in \left\{ 1,2,3,4,5,6\right\} \right\}
\end{equation*}となります。ただし、\(x_{i}\)は\(i\)回目に出た目です。標本空間\(\Omega \)は有限集合であるため、事象集合\(\mathcal{F}\)として標本空間のベキ集合\(2^{\Omega }\)を採用します。サイコロには歪みがないため、確率測度\(P:2^{\Omega}\rightarrow \mathbb{R} \)はそれぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation}P\left( \{\omega \}\right) =\frac{1}{36} \quad \cdots (1)
\end{equation}を定めます。それぞれの事象\(A\subset \Omega \)の確率を、\begin{equation}P\left( A\right) =\sum_{\omega \in A}P\left( \{\omega \}\right) \quad \cdots (2)
\end{equation}と定めます。以上の\(\left( \Omega ,2^{\Omega },P\right) \)は明らかに確率空間です。「出た目の和の合計は\(10\)以上である」という事象は、\begin{equation*}A=\left\{ \left( 4,6\right) ,\left( 6,4\right) ,\left( 5,5\right) ,\left(
5,6\right) ,\left( 6,5\right) ,\left( 6,6\right) \right\}
\end{equation*}であるため、その確率は、\begin{eqnarray*}
P\left( A\right) &=&\sum_{\omega \in A}P\left( \{\omega \}\right) \quad
\because \left( 2\right) \\
&=&6\cdot \frac{1}{36}\quad \because \left( 1\right) \\
&=&\frac{1}{6}
\end{eqnarray*}となります。では、1回目に出た目が\(6\)であることが観察できた場合(2回目の目は観察できなかった)、「出た目の合計が\(10\)以上である」確率はどうなるでしょうか。「1回目に\(6\)が出る」という事象は、\begin{equation}B=\left\{ \left( 6,1\right) ,\left( 6,2\right) ,\left( 6,3\right) ,\left(
6,4\right) ,\left( 6,5\right) ,\left( 6,6\right) \right\} \quad \cdots (3)
\end{equation}であるため、問題としている事象の確率は条件付き確率\(P\left( A|B\right) \)に相当します。積事象\(A\cap B\)は、\begin{equation}A\cap B=\left\{ \left( 6,4\right) ,\left( 6,5\right) ,\left( 6,6\right)
\right\} \quad \cdots (4)
\end{equation}であるため、\begin{eqnarray*}
P\left( A|B\right) &=&\frac{P\left( A\cap B\right) }{P\left( B\right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{3\cdot \frac{1}{36}}{6\cdot \frac{1}{36}}\quad \because \left(
1\right) ,\left( 2\right) ,\left( 3\right) ,\left( 4\right) \\
&=&\frac{1}{2}
\end{eqnarray*}となります。
$$\begin{array}{|c|c|c|}
\hline
対象者\backslash 検査結果 &
陽性 & 陰性 \\ \hline
感染者 & 90\% & 10\% \\ \hline
非感染者 & 20\% & 80\% \\ \hline
\end{array}$$
ある集団から1人をランダムに選んでこの検査を実施したところ、その人は陽性と判定されました。この人が実際に感染者である確率はどの程度でしょうか。ただし、この人が実際に感染者であるかは否かは不明ですが、問題としている集団における感染者の割合が\(5\%\)であることは分かっているものとします。まず、この試行を表す確率空間を定式化します。「集団から1人をランダムに選んで検査を行う」という試行の標本点を、\begin{equation*}\omega =\left( \omega _{1},\omega _{2}\right)
\end{equation*}と表記します。ただし、\(\omega _{1}\in \{0,1\}\)であり、\(0\)はこの人が感染者であることに、\(1\)はこの人が非感染者であることにそれぞれ対応します。また、\(\omega _{2}\in\{P,N\}\)であり、\(P\)は検査において陽性であることに、\(N\)は検査において陰性であることにそれぞれ対応します。この試行の標本空間\begin{equation*}\Omega =\left\{ 0,1\right\} \times \left\{ P,N\right\}
\end{equation*}は有限集合であるため、事象空間を、\begin{equation*}
\mathcal{F}=2^{\Omega }
\end{equation*}と定めます。確率測度\(P:2^{\Omega }\rightarrow \mathbb{R} \)がそれぞれの根元事象に対して定める確率は、\begin{eqnarray}P\left( \left\{ \left( 0,P\right) \right\} \right) &=&\frac{5}{100}\cdot
\frac{90}{100}=\frac{9}{200} \quad \cdots (1) \\
P\left( \left\{ \left( 0,N\right) \right\} \right) &=&\frac{5}{100}\cdot
\frac{10}{100}=\frac{1}{200} \quad \cdots (2) \\
P\left( \left\{ \left( 1,P\right) \right\} \right) &=&\frac{95}{100}\cdot
\frac{20}{100}=\frac{19}{100} \quad \cdots (3) \\
P\left( \left\{ \left( 1,N\right) \right\} \right) &=&\frac{95}{100}\cdot
\frac{80}{100}=\frac{76}{100} \quad \cdots (4)
\end{eqnarray}です。それぞれの事象\(A\in 2^{\Omega }\)について、その確率を、\begin{equation}P\left( A\right) =\sum_{\omega \in A}P\left( \{\omega \}\right) \quad \cdots (5)
\end{equation}と定めます。以上の\(\left( \Omega ,2^{\Omega },P\right) \)は確率空間です。この試行において、検査において陽性と判定された人が実際に感染者であるという確率は、以下の 2 つの事象\begin{eqnarray*}A &:&\text{感染者である} \\
B &:&\text{検査で陽性になる}
\end{eqnarray*}に関する条件付き確率\(P\left( A|B\right) \)として表現されますが、\begin{align*}A\cap B& =\left\{ \left( 0,P\right) \right\} \\
B& =\left\{ \left( 0,P\right) ,\left( 1,P\right) \right\}
\end{align*}であることを踏まえると、\begin{eqnarray*}
P\left( A|B\right) &=&\frac{P\left( A\cap B\right) }{P\left( B\right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{\sum\limits_{\omega \in A\cap B}P\left( \{\omega \}\right) }{\sum\limits_{\omega \in B}P\left( \{\omega \}\right) }\quad \because \left(
5\right) \\
&=&\frac{P\left( \left\{ \left( 0,P\right) \right\} \right) }{P\left(
\left\{ \left( 0,P\right) \right\} \right) +P\left( \left\{ \left(
1,P\right) \right\} \right) } \\
&=&\frac{\frac{9}{200}}{\frac{9}{200}+\frac{19}{100}}\quad \because \left(
1\right) ,\left( 3\right) \\
&=&\frac{9}{47} \\
&\approx &0.19
\end{eqnarray*}となります。ちなみに、陽性と判定された人が実際には非感染者である確率や、陰性と判定された人が実際には感染者である確率、また、陰性と判定された人が実際に非感染者である確率なども、上と同様に条件付き確率として求めることができます。
標本空間が一般の集合である場合の条件付き確率
これまでは標本空間\(\Omega \)が有限集合もしくは可算集合である場合について考えてきましたが、標本空間\(\Omega \)が非可算集合である場合にも、条件付き確率を同様に定義することができます。
\end{equation*}を定める関数\(P\left( \cdot |B\right) :\mathcal{F}\rightarrow \mathbb{R} \)を定義する。このとき、\(\left( \Omega ,\mathcal{F},P\left( \cdot |B\right) \right) \)は確率空間となる。すなわち、\begin{eqnarray*}&&\left( a\right) \ \forall A\in \mathcal{F}:P\left( A|B\right) \geq 0 \\
&&\left( b\right) \ P\left( \Omega |B\right) =1 \\
&&\left( c\right) \ \forall \text{排反な}\left\{
A_{n}\right\} _{n\in \mathbb{N} }\subset \mathcal{F}:P\left( \bigcup\limits_{n\in \mathbb{N} }A_{n}|B\right) =\sum\limits_{n\in \mathbb{N} }P\left( A_{n}|B\right)
\end{eqnarray*}が成り立つ。
条件付き確率関数\(P\left(\cdot |B\right) \)は確率論の公理を満たすことが明らかになりました。したがって、確率論の公理を用いて導かれた確率測度\(P\)に関する性質は、条件付き確率測度\(P\left( \cdot |B\right) \)にも引き継がれます。以下が具体例です。
\end{equation*}が成り立ちます。つまり、空事象の条件付き確率は\(0\)です。
A_{2}|B\right)
\end{equation*}が成り立ちます。
A_{2}|B\right)
\end{equation*}が成り立ちます。
A_{2}|B\right) -P\left( A_{1}\cap A_{2}|B\right)
\end{equation*}が成り立ちます。
\end{equation*}が成り立ちます。
\end{equation*}が成り立ちます。
演習問題
- 上の子が男であることが分かっている場合、二人が男女である確率を求めてください。
- 少なくとも一方が女であることが分かっている場合、二人とも女である確率を求めてください。
- 上の子が女であることが分かっている場合、二人とも女である確率を求めてください。
$$\begin{array}{|c|c|c|}
\hline
色覚異常の有無\backslash 性別 & 男性 & 女性 \\ \hline
色覚異常である & 4\% & 0.2\% \\ \hline
色覚異常ではない & 47\% & 48.8\% \\ \hline
\end{array}$$
以下の問いに答えてください。
- 集団の中から1人をランダムに選んだところ、その人は男性でした。この男性が色覚異常である確率を求めてください。
- 集団の中から1人をランダムに選んだところ、その人は女性でした。この女性が色覚異常である確率を求めてください。
P\left( B\right) &=&\frac{3}{10} \\
P\left( A\cap B\right) &=&\frac{15}{100}
\end{eqnarray*}が成り立つものとします。以下の確率\begin{equation*}
P\left( A|B^{c}\right)
\end{equation*}を求めてください。
- ある製品を検品したところ、検査項目\(A\)に失格していることが判明しました。この製品が検査項目\(B\)にも失格する確率を求めてください。
- ある製品を検品したところ、検査項目\(A\)に合格していることが判明しました。この製品が検査項目\(B\)にも合格する確率を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】