連続型確率変数の条件付き分布関数
ある試行に関する確率空間\((\Omega ,\mathcal{F},P)\)が与えられたとき、その試行によって事象\(A\in \mathcal{F}\)が起こるかどうかを事前に観察できないものの、何らかの事情により、別の事象\(B\in \mathcal{F}\)が起きたことが観察された場合(もしくは、事象\(B\)が起きているものと仮定する場合)に事象\(A\)が起こる確率を\(P\left( A\right) \)と評価したのでは、事象\(B\)が起きているという追加的な情報を活用できておらず望ましくありません。このような事情を踏まえた上で、2つの事象\(A,B\in \mathcal{F}\)について、事象\(B\)が起きたという条件、すなわち\(P\left( B\right) >0\)が成り立つ場合の事象\(A\)の条件付き確率を、\begin{equation*}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\end{equation*}と定義しました。以上を踏まえた上で、確率変数に関する条件付き確率を定義します。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の同時確率変数\(\left( X,Y\right):\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率密度関数\begin{equation*}f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}によって記述されており、個々の確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)の周辺確率分布が周辺確率密度関数\begin{eqnarray*}f_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
f_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}によって記述されている状況を想定します。
一方の確率変数\(Y:\Omega\rightarrow \mathbb{R} \)の実現値が集合\(Y\in \mathcal{B}\left( \mathbb{R} \right) \)に属するという条件のもとでもう一方の確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値が集合\(X\in \mathcal{B}\left( \mathbb{R} \right) \)に属する条件付き確率\begin{equation*}P\left( X\in A|Y\in B\right)
\end{equation*}をどのように評価すればよいでしょうか。ただし、\(\mathcal{B}\left( \mathbb{R} \right) \)は数直線\(\mathbb{R} \)上のボレル集合族です。
2つの集合\(A,B\in \mathcal{B}\left( \mathbb{R} \right) \)を任意に選んだとき、「確率変数\(X\)の実現値が\(A\)に属する」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}であり、「確率変数\(Y\)の実現値が\(B\)に属する」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in B\right\}
\end{equation*}です。以上の2つの積事象は「確率変数\(X\)の実現値が\(A\)に属するとともに確率変数\(Y\)の実現値が\(B\)に属する」という事象ですが、これは、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge Y\left(
\omega \right) \in B\right\}
\end{equation*}すなわち、\begin{equation*}
\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in
A\times B\right\}
\end{equation*}です。したがって、確率変数\(Y\)の実現値が\(B\)に属するという条件のもとで確率変数\(X\)の実現値が\(A\)に属する条件付き確率は、\begin{eqnarray*}P\left( X\in A|Y\in B\right) &=&\frac{P\left( \left\{ \omega \in \Omega \
|\ \left( X,Y\right) \left( \omega \right) \in A\times B\right\} \right) }{P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in B\right\}
\right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{P\left( \left( X,Y\right) \in A\times B\right) }{P\left( Y\in
B\right) }
\end{eqnarray*}となります。ただし、\begin{equation*}
P\left( Y\in B\right) >0
\end{equation*}である状況を想定していることに注意してください。
以上を踏まえると、実数\(x,y\in \mathbb{R} \)が与えられたとき、確率変数\(Y\)の実現値が\(y\)であるという条件のもとで確率変数\(X\)の実現値が\(x\)以上である条件付き確率は、\begin{eqnarray*}P\left( X\leq x|Y=y\right) &=&P\left( X\in (-\infty ,x]|Y\in \left\{
y\right\} \right) \\
&=&\frac{P\left( \left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left(
\omega \right) \in (-\infty ,x]\times \left\{ y\right\} \right\} \right) }{P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in \left\{
y\right\} \right\} \right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq
x\wedge Y\left( \omega \right) =y\right\} \right) }{P\left( \left\{ \omega
\in \Omega \ |\ Y\left( \omega \right) =y\right\} \right) } \\
&=&\frac{P\left( X\leq x\wedge Y=y\right) }{P\left( Y=y\right) }
\end{eqnarray*}となります。ただし、絶対連続型の確率変数が特定の値をとる確率はゼロであるため、\begin{equation*}
P\left( Y=y\right) =0
\end{equation*}となり、先の条件付き確率の分母がゼロになってしまいます。このような問題を解決するためには何らかの工夫が必要です。そこで、代替案として、\(Y\)の実現値が特定の値\(y\)をとるという条件ではなく、\(Y\)の実現値が点\(y\)を端点とする区間\(\left[ y,y+h\right] \ \left( h>0\right) \)に属するという条件のもとでの条件付き確率\begin{eqnarray*}P\left( X\leq x|Y\in \left[ y,y+h\right] \right) &=&\frac{P\left( X\in
(-\infty ,x]\wedge Y\in \left[ y,y+h\right] \right) }{P\left( Y\in \left[
y,y+h\right] \right) } \\
&=&\frac{\int_{s=-\infty }^{x}\int_{t=y}^{y+h}f_{XY}\left( s,t\right) dsdt}{\int_{y}^{y+h}f_{Y}\left( t\right) dt}
\end{eqnarray*}に注目します。このような状況を想定すれば、\(Y=y\)の場合とは異なり、\begin{equation*}P\left( Y\in \left[ y,y+h\right] \right) =\int_{y}^{y+h}f_{Y}\left( t\right)
dt>0
\end{equation*}となる状況は起こり得ます。これを具体的に積分すると以下を得ます。証明では定積分に関する平均値の定理を利用します。
\end{equation*}を満たす\(y\in \mathbb{R} \)および\(h>0\)を任意に選ぶ。\(f_{XY}\)および\(f_{Y}\)が変数\(y\)に関して区間\(\left[ y,y+h\right] \)上で連続であるならば、\begin{equation*}P\left( X\leq x|Y\in \left[ y,y+h\right] \right) =\int_{x=-\infty }^{x}\frac{f_{XY}\left( s,y+\theta _{1}h\right) }{f_{Y}\left( y+\theta _{2}h\right) }ds
\end{equation*}を満たす\(\theta _{1},\theta _{2}\in \left(0,1\right) \)が存在する。
以上の結果を踏まえた上で、区間\(\left[ y,y+h\right] \)の幅を限りなく短くすると、すなわち、\(h\rightarrow 0+\)の場合の右側極限をとると、\begin{eqnarray*}\lim_{h\rightarrow 0+}P\left( X\leq x|Y\in \left[ y,y+h\right] \right)
&=&\lim_{h\rightarrow 0+}\int_{s=-\infty }^{x}\frac{f_{XY}\left( s,y+\theta
_{1}h\right) }{f_{Y}\left( y+\theta _{2}h\right) }ds \\
&=&\int_{s=-\infty }^{x}\frac{f_{XY}\left( s,y\right) }{f_{Y}\left( y\right)
}ds
\end{eqnarray*}を得ます。\(h\rightarrow 0+\)の場合、区間\(\left[ y,y+h\right] \)は1点集合\(\left\{ y\right\} \)に限りなく近づきます。したがって、近似的には以下の関係\begin{equation}P\left( X\leq x|Y=y\right) =\int_{s=-\infty }^{x}\frac{f_{XY}\left(
s,y\right) }{f_{Y}\left( y\right) }ds \quad \cdots (4)
\end{equation}という関係が成り立つことが明らかになりました。
以上の事情を踏まえた上で、\begin{equation*}
f_{Y}\left( y\right) >0
\end{equation*}を満たす\(y\in \mathbb{R} \)が与えられたとき、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X|Y=y}\left( x\right) =\int_{s=-\infty }^{x}\frac{f_{XY}\left( s,y\right)
}{f_{Y}\left( y\right) }ds
\end{equation*}を定める関数\begin{equation*}
F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義すれば、\(\left( 4\right) \)より、近似的には以下の関係\begin{equation*}P\left( X\leq x|Y=y\right) =F_{X|Y=y}\left( x\right)
\end{equation*}が成り立ちます。この関数\(F_{X|Y=y}\)を\(Y=y\)のもとでの\(X\)の条件付き分布関数(conditional distribution function of \(X\) given \(Y=y\))や条件付き累積分布関数(conditional cumulative distribution function)などと呼びます。なお、\(Y=y\)のもとでの\(X\)の条件付き分布関数を、\begin{equation*}F_{X|Y}\left( \cdot |y\right) :\mathbb{R} \rightarrow \mathbb{R} \end{equation*}と表記する流儀もあります。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\} \\
Y\left( \Omega \right) &=&\left\{ y\in \mathbb{R} \ |\ 0\leq y\leq 1\right\}
\end{eqnarray*}です。\(Y=0\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)を求めます。\(Y\)の周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( y\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dx
\\
&=&\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dx \\
&=&\left[ \frac{1}{2}x^{2}+\frac{3}{2}xy^{2}\right] _{0}^{1} \\
&=&\frac{1}{2}+\frac{3}{2}y^{2}
\end{eqnarray*}であるため、\begin{equation*}
f_{Y}\left( 0\right) =\frac{1}{2}\not=0
\end{equation*}であり、\(F_{X|Y=0}\)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\(x<0\)の場合には、\begin{equation*}F_{X|Y=0}\left( x\right) =0
\end{equation*}であり、\(0\leq x<1\)の場合には、\begin{eqnarray*}F_{X|Y=0}\left( x\right) &=&\int_{s=-\infty }^{x}\frac{f_{XY}\left(
s,0\right) }{f_{Y}\left( 0\right) }ds \\
&=&\int_{s=0}^{x}\frac{s}{\frac{1}{2}}ds \\
&=&\int_{s=0}^{x}2sds \\
&=&\left[ s^{2}\right] _{0}^{x} \\
&=&x^{2}
\end{eqnarray*}であり、\(x\geq 1\)の場合には、\begin{equation*}F_{X|Y=0}\left( x\right) =1
\end{equation*}となります。結果をまとめると、\begin{equation*}
F_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x^{2} & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}となります。したがって、\(Y\)の値が\(0\)であるという条件のもとで\(X\)の値が\(\frac{1}{2}\)以下である確率は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}|Y=0\right) &=&F_{X|Y=0}\left( \frac{1}{2}\right)
\\
&=&\left( \frac{1}{2}\right) ^{2} \\
&=&\frac{1}{4}
\end{eqnarray*}です。
もう一方の確率変数\(Y\)についても同様に考えます。つまり、\begin{equation*}f_{X}\left( x\right) >0
\end{equation*}を満たす\(x\in \mathbb{R} \)が与えられたとき、それぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}F_{Y|X=x}\left( y\right) =\int_{t=-\infty }^{y}\frac{f_{XY}\left( x,t\right)
}{f_{X}\left( x\right) }dt
\end{equation*}を定める関数\begin{equation*}
F_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義すれば、近似的には以下の関係\begin{equation*}
P\left( Y\leq y|X=x\right) =F_{Y|X=x}\left( y\right)
\end{equation*}が成り立ちます。この関数\(F_{Y|X=x}\)を\(X=x\)のもとでの\(Y\)の条件付き分布関数(conditional distribution function of \(Y\) given \(X=x\))や条件付き累積分布関数(conditional cumulative distribution function)などと呼びます。
条件付き分布関数と条件付き確率密度関数の関係
条件付き分布関数は条件付き確率密度関数から以下のようにして導出することもできます。
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、条件付き分布関数\(F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X|Y=y}\left( x\right) =\int_{s=-\infty }^{x}f_{X|Y=y}\left( s\right) ds
\end{equation*}を定める。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に示したように、\(Y=0\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}F_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x^{2} & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}ですが、同じことを先の命題を用いて示します。\(Y\)の周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}f_{Y}\left( 0\right) &=&\int_{x=-\infty }^{+\infty }f_{XY}\left( x,0\right)
dx \\
&=&\int_{x=0}^{1}xdx \\
&=&\left[ \frac{1}{2}x^{2}\right] _{x=0}^{1} \\
&=&\frac{1}{2} \\
&\not=&0
\end{eqnarray*}を満たすため、\(Y=0\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \left[ 0,1\right] \)に対して定める値は、\begin{eqnarray*}f_{X|Y=0}\left( x\right) &=&\frac{f_{XY}\left( x,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{x}{\frac{1}{2}} \\
&=&2x
\end{eqnarray*}であるため、\begin{equation*}
f_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
2x & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を得ます。すると、先の命題より、条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\(x<0\)の場合には、\begin{equation*}F_{X|Y=0}\left( x\right) =0
\end{equation*}であり、\(0\leq x<1\)の場合には、\begin{eqnarray*}F_{X|Y=0}\left( x\right) &=&\int_{s=-\infty }^{x}f_{X|Y=0}\left( s\right) ds
\\
&=&\int_{s=0}^{x}2sds \\
&=&\left[ s^{2}\right] _{s=0}^{x} \\
&=&x^{2}
\end{eqnarray*}であり、\(x\geq 1\)の場合には、\begin{equation*}F_{X|Y=0}\left( x\right) =1
\end{equation*}です。結果をまとめると、\begin{equation*}
F_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x^{2} & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}となりますが、これは先の結果と整合的です。
もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。
\end{equation*}を満たす\(x\in \mathbb{R} \)を任意に選んだとき、\(X=x\)のもとでの\(Y\)の条件付き確率密度関数\(f_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、条件付き分布関数\(F_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}F_{Y|X=x}\left( y\right) =\int_{t=-\infty }^{y}f_{Y|X=x}\left( t\right) dt
\end{equation*}を定める。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】