ベイズの定理
問題としている試行に関する確率空間\(\left(\Omega ,\mathcal{F},P\right) \)が与えられたとき、確率が正であるような2つの事象を任意に選びます。つまり、\begin{eqnarray*}P\left( A\right) &>&0 \\
P\left( B\right) &>&0
\end{eqnarray*}を満たす事象\(A,B\in \mathcal{F}\)に注目するということです。この場合、条件付き確率に関して、\begin{eqnarray}P\left( A|B\right) &=&\frac{P\left( A\cap B\right) }{P\left( B\right) }
\quad \cdots (1) \\
P\left( B|A\right) &=&\frac{P\left( A\cap B\right) }{P\left( A\right) }
\quad \cdots (2)
\end{eqnarray}がともに成り立ちますが、\(\left( 2\right) \)を用いて\(\left( 1\right) \)から\(P\left( A\cap B\right) \)を消去すると、\begin{equation*}P\left( A|B\right) =\frac{P\left( B|A\right) \cdot P\left( A\right) }{P\left( B\right) }
\end{equation*}を得ます。これをベイズの定理(Bayes’ rule)と呼びます。
つまり、条件付き確率\(P\left( A|B\right) \)を直接計算することが困難である場合でも、2つの事象\(A,B\)の立場を入れ替えた条件付き確率\(P\left( B|A\right) \)とそれぞれの事象の確率\(P\left( A\right) ,P\left( B\right) \)を特定できるのであれば、それらの情報を用いて\(P\left( A|B\right) \)を特定できるということです。
2つの事象\(A,B\)の時間的な前後関係が、\begin{equation*}A\rightarrow B
\end{equation*}である状況を想定します。つまり、事象\(A\)が起きてから事象\(B\)が起こるということです。「事象\(A\)が起きた後に事象\(B\)が起こる確率\(P\left( B|A\right) \)」が明らかである場合、ベイズの定理より、逆に、「事象\(B\)が起きたことが事後的に観察された場合、それ以前に事象\(A\)が起こっていた確率\(P\left( A|B\right) \)」を特定できます。つまり、原因\(A\)のもとで結果\(B\)が起こる確率が判明している場合、逆に、結果\(B\)をもたらした原因が\(A\)である確率を特定できるということです。
P\left( B\right) &>&0
\end{eqnarray*}が成り立つ場合には、\begin{equation*}
P\left( A|B\right) =\frac{P\left( B|A\right) \cdot P\left( A\right) }{P\left( B\right) }
\end{equation*}という関係が成り立つ。
条件付き確率を用いたベイズの定理
確率が正であるような2つの事象\(A,B\in \mathcal{F}\)について、\begin{equation}P\left( A|B\right) =\frac{P\left( B|A\right) \cdot P\left( A\right) }{P\left( B\right) } \quad \cdots (1)
\end{equation}が成り立つことが明らかになりました。分母の確率\(P\left( B\right) \)をそのまま求めるのが困難である場合、標本空間\(\Omega \)が2つの事象\(A,A^{c}\)に分割可能であることに注目すると、全確率の定理より、\begin{equation*}P\left( B\right) =P\left( B|A\right) \cdot P\left( A\right) +P\left(
B|A^{c}\right) \cdot P\left( A^{c}\right)
\end{equation*}が成り立つため、これを用いて\(\left( 1\right) \)を言い換えると、\begin{equation*}P\left( A|B\right) =\frac{P\left( B|A\right) \cdot P\left( A\right) }{P\left( B|A\right) \cdot P\left( A\right) +P\left( B|A^{c}\right) \cdot
P\left( A^{c}\right) }
\end{equation*}を得ます。これもまたベイズの定理と呼ばれます。
P\left( B\right) &>&0
\end{eqnarray*}が成り立つ場合には、\begin{equation*}
P\left( A|B\right) =\frac{P\left( B|A\right) \cdot P\left( A\right) }{P\left( B|A\right) \cdot P\left( A\right) +P\left( B|A^{c}\right) \cdot
P\left( A^{c}\right) }
\end{equation*}という関係が成り立つ。
\end{equation}の確率を求めます。事象\(A,B\)をそれぞれ、\begin{eqnarray*}A &:&\text{選ばれた袋は}1\text{である} \\
B &:&\text{選ばれたボールは赤である}
\end{eqnarray*}と定義するのであれば、事象\(\left( 1\right) \)の確率は、条件付き確率\begin{equation*}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\end{equation*}と表現されます。これを直接求めるのは困難であるため、ベイズの定理\begin{equation}
P\left( A|B\right) =\frac{P\left( B|A\right) \cdot P\left( A\right) }{P\left( B|A\right) \cdot P\left( A\right) +P\left( B|A^{c}\right) \cdot
P\left( A^{c}\right) } \quad \cdots (2)
\end{equation}を利用します。\(P\left( B|A\right) \)は「袋\(1\)からとり出したボールが赤である確率」であるため、\begin{equation*}P\left( B|A\right) =\frac{5}{10}
\end{equation*}となります。\(P\left( B|A^{c}\right) \)は「袋\(2\)からとり出したボールが赤である確率」であるため、\begin{equation*}P\left( B|A^{c}\right) =\frac{3}{10}
\end{equation*}となります。\(P\left( A\right) \)は「袋\(1\)が選ばれる確率」であるため、\begin{equation*}P\left( A\right) =\frac{1}{2}
\end{equation*}となります。\(P\left( A^{c}\right) \)は「袋\(2\)が選ばれる確率」であるため、\begin{equation*}P\left( A^{c}\right) =\frac{1}{2}
\end{equation*}となります。これらと\(\left( 2\right) \)より、\begin{eqnarray*}P\left( A|B\right) &=&\frac{\frac{5}{10}\cdot \frac{1}{2}}{\frac{5}{10}\cdot \frac{1}{2}+\frac{3}{10}\cdot \frac{1}{2}} \\
&=&\frac{5}{8}
\end{eqnarray*}であることが明らかになりました。
ベイズの定理の一般化
ベイズの定理を以下のように一般化することができます。
i\not=j\Rightarrow A_{i}\cap A_{j}=\phi \right) \\
&&\left( b\right) \ \bigcup\limits_{i=1}^{n}A_{i}=\Omega \\
&&\left( c\right) \ \forall i\in \left\{ 1,\cdots ,n\right\} :P\left(
A_{i}\right) >0
\end{eqnarray*}を満たす有限\(n\)個の事象\(A_{1},\cdots ,A_{n}\in \mathcal{F}\)が存在する場合には、\begin{equation*}P\left( B\right) >0
\end{equation*}を満たす事象\(B\in \mathcal{F}\)を任意に選んだときに、それぞれの事象\(A_{i}\in \mathcal{F}\)に対して、\begin{equation*}P\left( A_{i}|B\right) =\frac{P\left( B|A_{i}\right) \cdot P\left(
A_{i}\right) }{\sum\limits_{j=1}^{n}\left[ P\left( B|A_{j}\right) \cdot
P\left( A_{j}\right) \right] }
\end{equation*}という関係が成り立つ。
\(n+1\)個の事象\(A_{1},\cdots ,A_{n},B\)の時間的な前後関係が、\begin{equation*}\left.
\begin{array}{c}
A_{1} \\
\vdots \\
A_{n}\end{array}\right\} \rightarrow B
\end{equation*}である状況を想定します。つまり、事象\(A_{1},\cdots ,A_{n}\)の中のいずれかが起きてから事象\(B\)が起こるということです。それぞれの事象\(A_{i}\ \left( i=1,\cdots ,n\right) \)について「事象\(A_{i}\)が起きた場合に事象\(B\)が起こる確率\(P\left( B|A_{i}\right) \)」が明らかである場合、ベイズの定理より、逆に、「事象\(B\)が起きたことが事後的に観察された場合、それ以前に事象\(A_{i}\)が起こっていた確率\(P\left( A_{i}|B\right) \)」を特定できます。つまり、原因\(A_{1},\cdots ,A_{n}\)のもとで結果\(B\)が起こる確率がそれぞれ判明している場合、逆に、結果\(B\)をもたらした原因が\(A_{i}\)である確率を特定できるということです。
&&\left( b\right) \ A_{1}\cup A_{2}\cup A_{3}=\Omega \\
&&\left( c\right) \ P\left( A_{1}\right) >0\wedge P\left( A_{2}\right)
>0\wedge P\left( A_{3}\right) >0
\end{eqnarray*}を満たす3個の事象\(A_{1},A_{2},A_{3}\in \mathcal{F}\)が存在する場合には、ベイズの定理より、\begin{eqnarray*}P\left( A_{1}|B\right) &=&\frac{P\left( B|A_{1}\right) \cdot P\left(
A_{1}\right) }{P\left( B|A_{1}\right) \cdot P\left( A_{1}\right) +P\left(
B|A_{2}\right) \cdot P\left( A_{2}\right) +P\left( B|A_{3}\right) \cdot
P\left( A_{3}\right) } \\
P\left( A_{2}|B\right) &=&\frac{P\left( B|A_{2}\right) \cdot P\left(
A_{2}\right) }{P\left( B|A_{1}\right) \cdot P\left( A_{1}\right) +P\left(
B|A_{2}\right) \cdot P\left( A_{2}\right) +P\left( B|A_{3}\right) \cdot
P\left( A_{3}\right) } \\
P\left( A_{3}|B\right) &=&\frac{P\left( B|A_{3}\right) \cdot P\left(
A_{3}\right) }{P\left( B|A_{1}\right) \cdot P\left( A_{1}\right) +P\left(
B|A_{2}\right) \cdot P\left( A_{2}\right) +P\left( B|A_{3}\right) \cdot
P\left( A_{3}\right) }
\end{eqnarray*}がいずれも成り立ちます。
\end{equation}の確率を求めます。事象\(A_{1},A_{2},A_{3},B\)をそれぞれ、\begin{eqnarray*}A_{1} &:&\text{商品の供給源は業者}1\text{である} \\
A_{2} &:&\text{商品の供給源は業者}2\text{である} \\
A_{3} &:&\text{商品の供給源は業者}3\text{である} \\
B &:&\text{購入した商品が不良品である}
\end{eqnarray*}と定義すると、事象\(\left( 1\right) \)の確率は、条件付き確率\begin{equation*}P\left( A_{2}|B\right) =\frac{P\left( A_{2}\cap B\right) }{P\left( B\right) }
\end{equation*}と表現されます。これを直接求めるのは困難であるため、ベイズの定理\begin{equation}
P\left( A_{2}|B\right) =\frac{P\left( B|A_{2}\right) \cdot P\left(
A_{2}\right) }{P\left( B|A_{1}\right) \cdot P\left( A_{1}\right) +P\left(
B|A_{2}\right) \cdot P\left( A_{2}\right) +P\left( B|A_{3}\right) \cdot
P\left( A_{3}\right) } \quad \cdots (2)
\end{equation}を利用します。\(P\left(B|A_{1}\right) \)は「業者\(1\)から仕入れた商品が不良品である確率」であるため、\begin{equation*}P\left( B|A_{1}\right) =\frac{1}{100}
\end{equation*}となります。\(P\left( B|A_{2}\right) \)は「業者\(2\)から仕入れた商品が不良品である確率」であるため、\begin{equation*}P\left( B|A_{2}\right) =\frac{2}{100}
\end{equation*}となります。\(P\left( B|A_{3}\right) \)は「業者\(3\)から仕入れた商品が不良品である確率」であるため、\begin{equation*}P\left( B|A_{3}\right) =\frac{3}{100}
\end{equation*}となります。\(P\left( A_{1}\right) \)は「購入した商品の供給減が業者\(1\)である確率」であるため、\begin{equation*}P\left( A_{1}\right) =\frac{2}{10}
\end{equation*}となります。\(P\left( A_{2}\right) \)は「購入した商品の供給減が業者\(2\)である確率」であるため、\begin{equation*}P\left( A_{2}\right) =\frac{3}{10}
\end{equation*}となります。\(P\left( A_{3}\right) \)は「購入した商品の供給減が業者\(3\)である確率」であるため、\begin{equation*}P\left( A_{3}\right) =\frac{5}{10}
\end{equation*}となります。これらと\(\left( 2\right) \)より、\begin{eqnarray*}P\left( A_{2}|B\right) &=&\frac{\frac{2}{100}\cdot \frac{3}{10}}{\frac{1}{100}\cdot \frac{2}{10}+\frac{2}{100}\cdot \frac{3}{10}+\frac{3}{100}\cdot
\frac{5}{10}} \\
&=&\frac{6}{23}
\end{eqnarray*}であることが明らかになりました。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】