離散型確率変数の条件付き分布関数
ある試行に関する確率空間\((\Omega ,\mathcal{F},P)\)が与えられたとき、その試行によって事象\(A\in \mathcal{F}\)が起こるかどうかを事前に観察できないものの、何らかの事情により、別の事象\(B\in \mathcal{F}\)が起きたことが観察された場合(もしくは、事象\(B\)が起きているものと仮定する場合)に事象\(A\)が起こる確率を\(P\left( A\right) \)と評価したのでは、事象\(B\)が起きているという追加的な情報を活用できておらず望ましくありません。このような事情を踏まえた上で、2つの事象\(A,B\in \mathcal{F}\)について、事象\(B\)が起きたという条件、すなわち\(P\left( B\right) >0\)が成り立つ場合の事象\(A\)の条件付き確率を、\begin{equation*}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\end{equation*}と定義しました。以上を踏まえた上で、確率変数に関する条件付き確率を定義します。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\begin{equation*}\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}が与えられている状況を想定します。一方の確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の実現値が集合\(Y\in \mathcal{B}\left( \mathbb{R} \right) \)に属するという条件のもとでもう一方の確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値が集合\(X\in \mathcal{B}\left( \mathbb{R} \right) \)に属する条件付き確率\begin{equation*}P\left( X\in A|Y\in B\right)
\end{equation*}をどのように評価すればよいでしょうか。ただし、\(\mathcal{B}\left( \mathbb{R} \right) \)は数直線\(\mathbb{R} \)上のボレル集合族です。
2つの集合\(A,B\in \mathcal{B}\left( \mathbb{R} \right) \)を任意に選んだとき、「確率変数\(X\)の実現値が\(A\)に属する」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}であり、「確率変数\(Y\)の実現値が\(B\)に属する」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in B\right\}
\end{equation*}です。以上の2つの積事象は「確率変数\(X\)の実現値が\(A\)に属するとともに確率変数\(Y\)の実現値が\(B\)に属する」という事象ですが、これは、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge Y\left(
\omega \right) \in B\right\}
\end{equation*}すなわち、\begin{equation*}
\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in
A\times B\right\}
\end{equation*}です。したがって、確率変数\(Y\)の実現値が\(B\)に属するという条件のもとで確率変数\(X\)の実現値が\(A\)に属する条件付き確率は、\begin{eqnarray*}P\left( X\in A|Y\in B\right) &=&\frac{P\left( \left\{ \omega \in \Omega \
|\ \left( X,Y\right) \left( \omega \right) \in A\times B\right\} \right) }{P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in B\right\}
\right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{P\left( \left( X,Y\right) \in A\times B\right) }{P\left( Y\in
B\right) }
\end{eqnarray*}となります。ただし、\begin{equation*}
P\left( Y\in B\right) >0
\end{equation*}である状況を想定していることに注意してください。
以上を踏まえると、実数\(x,y\in \mathbb{R} \)が与えられたとき、確率変数\(Y\)の実現値が\(y\)であるという条件のもとで確率変数\(X\)の実現値が\(x\)以下である条件付き確率は、\begin{eqnarray*}P\left( X\leq x|Y=y\right) &=&P\left( X\in (-\infty ,x]|Y\in \left\{
y\right\} \right) \\
&=&\frac{P\left( \left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left(
\omega \right) \in (-\infty ,x]\times \left\{ y\right\} \right\} \right) }{P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in \left\{
y\right\} \right\} \right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq
x\wedge Y\left( \omega \right) =y\right\} \right) }{P\left( \left\{ \omega
\in \Omega \ |\ Y\left( \omega \right) =y\right\} \right) } \\
&=&\frac{P\left( X\leq x\wedge Y=y\right) }{P\left( Y=y\right) }
\end{eqnarray*}となります。ただし、\begin{equation*}
P\left( Y=y\right) >0
\end{equation*}である状況を想定していることに注意してください。
以上を踏まえると、\begin{equation*}
P\left( Y=y\right) >0
\end{equation*}を満たす\(y\in \mathbb{R} \)が与えられたとき、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X|Y=y}\left( x\right) =P\left( X\leq x|Y=y\right)
\end{equation*}を定める関数\begin{equation*}
F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}が定義可能です。これを\(Y=y\)のもとでの\(X\)の条件付き分布関数(conditional distribution function of \(X\) given \(Y=y\))や条件付き累積分布関数(conditional cumulative distribution function)などと呼びます。なお、\(Y=y\)のもとでの\(X\)の条件付き分布関数を、\begin{equation*}F_{X|Y}\left( \cdot |y\right) :\mathbb{R} \rightarrow \mathbb{R} \end{equation*}と表記する流儀もあります。
同時確率変数\(\left( X,Y\right) \)の同時確率質量関数\(f_{XY}\)と確率変数\(Y\)の周辺確率質量関数\(f_{Y}\)が与えられれば、\(Y=y\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=y}\)を以下の要領で特定できます。
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X|Y=y}\left( x\right) =\frac{1}{f_{Y}\left( y\right) }\sum_{x_{i}\leq
x}f_{XY}\left( x_{i},y\right)
\end{equation*}を定める。
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}であるとともに、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の周辺確率質量関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( 0\right) &=&f_{XY}\left( 0,0\right) +f_{XY}\left( 2,0\right) =\frac{1}{3}+\frac{1}{3}=\frac{2}{3} \\
f_{Y}\left( 1\right) &=&f_{XY}\left( 1,1\right) =\frac{1}{3}=\frac{1}{3}
\end{eqnarray*}であるため、\(Y=0\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{eqnarray*}F_{X|Y=0}\left( x\right) &=&\frac{1}{f_{Y}\left( 0\right) }\sum_{x_{i}\leq
x}f_{XY}\left( x_{i},0\right) \\
&=&\frac{3}{2}\sum_{x_{i}\leq x}f_{XY}\left( x_{i},0\right) \\
&=&\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{3}{2}\cdot \frac{1}{3} & \left( if\ 0\leq x<2\right) \\
\frac{3}{2}\left( \frac{1}{3}+\frac{1}{3}\right) & \left( if\ x\geq
2\right)
\end{array}\right. \\
&=&\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2} & \left( if\ 0\leq x<2\right) \\
1 & \left( if\ x\geq 2\right)
\end{array}\right.
\end{eqnarray*}であり、\(Y=1\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=1}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{eqnarray*}F_{X|Y=1}\left( x\right) &=&\frac{1}{f_{Y}\left( 1\right) }\sum_{x_{i}\leq
x}f_{XY}\left( x_{i},1\right) \\
&=&3\sum_{x_{i}\leq x}f_{XY}\left( x_{i},1\right) \\
&=&\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
3\cdot \frac{1}{3} & \left( if\ x\geq 1\right)
\end{array}\right. \\
&=&\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{eqnarray*}です。
もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。
\end{equation*}を満たす\(x\in \mathbb{R} \)を任意に選んだとき、\(X=x\)のもとでの\(Y\)の条件付き分布関数\(F_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}F_{Y|X=x}\left( y\right) =\frac{1}{f_{X}\left( x\right) }\sum_{y_{i}\leq
y}f_{XY}\left( x,y_{i}\right)
\end{equation*}を定める。
条件付き分布関数と条件付き確率質量関数の関係
条件付き分布関数は条件付き確率質量関数から以下のようにして導出することもできます。
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、条件付き分布関数\(F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X|Y=y}\left( x\right) =\sum_{x_{i}\leq x}f_{X|Y=y}\left( x_{i}\right)
\end{equation*}を定める。
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に示したように、\(Y=0\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}F_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2} & \left( if\ 0\leq x<2\right) \\
1 & \left( if\ x\geq 2\right)
\end{array}\right.
\end{equation*}ですが、同じことを先の命題を用いて示します。\(Y\)の周辺確率質量関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}f_{Y}\left( 0\right) &=&f_{XY}\left( 0,0\right) +f_{XY}\left( 2,0\right) \\
&=&\frac{1}{3}+\frac{1}{3} \\
&=&\frac{2}{3} \\
&\not=&0
\end{eqnarray*}を満たすため、\(Y=0\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)については、\begin{eqnarray*}f_{X|Y=0}\left( 0\right) &=&\frac{f_{XY}\left( 0,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{\frac{1}{3}}{\frac{2}{3}} \\
&=&\frac{1}{2}
\end{eqnarray*}であり、\begin{eqnarray*}
f_{X|Y=0}\left( 1\right) &=&\frac{f_{XY}\left( 1,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{0}{\frac{2}{3}} \\
&=&0
\end{eqnarray*}であり、\begin{eqnarray*}
f_{X|Y=0}\left( 2\right) &=&\frac{f_{XY}\left( 2,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{\frac{1}{3}}{\frac{2}{3}} \\
&=&\frac{1}{2}
\end{eqnarray*}であり、それ以外の任意の\(x\in \mathbb{R} \)について、\begin{eqnarray*}f_{X|Y=0}\left( x\right) &=&\frac{f_{XY}\left( x,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{0}{\frac{2}{3}} \\
&=&0
\end{eqnarray*}となります。結果をまとめると、\begin{equation*}
f_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{2} & \left( if\ x=0\right) \\
0 & \left( if\ x=1\right) \\
\frac{1}{2} & \left( if\ x=2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}となります。すると、先の命題より、条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{eqnarray*}F_{X|Y=0}\left( x\right) &=&\sum_{x_{i}\leq x}f_{X|Y=0}\left( x_{i}\right)
\\
&=&\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2} & \left( if\ 0\leq x<2\right) \\
1 & \left( if\ x\geq 2\right)
\end{array}\right.
\end{eqnarray*}です。これは先の結果と整合的です。
もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。
\end{equation*}を満たす\(x\in \mathbb{R} \)を任意に選んだとき、\(X=x\)のもとでの\(Y\)の条件付き確率質量関数\(f_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、条件付き分布関数\(F_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}F_{Y|X=x}\left( y\right) =\sum_{y_{i}\leq y}f_{Y|X=x}\left( y_{i}\right)
\end{equation*}を定める。
演習問題
2,0\right) ,\left( 1,1\right) ,\left( 1,2\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{4} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。\(Y=0\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】