連続型確率変数の条件付き確率密度関数
ある試行に関する確率空間\((\Omega ,\mathcal{F},P)\)が与えられたとき、その試行によって事象\(A\in \mathcal{F}\)が起こるかどうかを事前に観察できないものの、何らかの事情により、別の事象\(B\in \mathcal{F}\)が起きたことが観察された場合(もしくは、事象\(B\)が起きているものと仮定する場合)に事象\(A\)が起こる確率を\(P\left( A\right) \)と評価したのでは、事象\(B\)が起きているという追加的な情報を活用できておらず望ましくありません。このような事情を踏まえた上で、2つの事象\(A,B\in \mathcal{F}\)について、事象\(B\)が起きたという条件、すなわち\(P\left( B\right) >0\)が成り立つ場合の事象\(A\)の条件付き確率を、\begin{equation*}P\left( A|B\right) =\frac{P\left( A\cap B\right) }{P\left( B\right) }
\end{equation*}と定義しました。以上を踏まえた上で、確率変数に関する条件付き確率を定義します。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の同時確率変数\(\left( X,Y\right):\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率密度関数\begin{equation*}f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}によって記述されており、個々の確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)の周辺確率分布が周辺確率密度関数\begin{eqnarray*}f_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
f_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}によって記述されている状況を想定します。
一方の確率変数\(Y\)の実現値が集合\(Y\in \mathcal{B}\left( \mathbb{R} \right) \)に属するという条件のもとで、もう一方の確率変数\(X\)の値が集合\(X\in \mathcal{B}\left( \mathbb{R} \right) \)に属する条件付き確率\begin{equation*}P\left( X\in A|Y\in B\right)
\end{equation*}をどのように評価すればよいでしょうか。ただし、\(\mathcal{B}\left( \mathbb{R} \right) \)は数直線\(\mathbb{R} \)上のボレル集合族です。
2つの集合\(A,B\in \mathcal{B}\left( \mathbb{R} \right) \)を任意に選んだとき、「確率変数\(X\)の実現値が\(A\)に属する」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}であり、「確率変数\(Y\)の実現値が\(B\)に属する」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in B\right\}
\end{equation*}です。以上の2つの積事象は「確率変数\(X\)の実現値が\(A\)に属するとともに確率変数\(Y\)の実現値が\(B\)に属する」という事象ですが、これは、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge Y\left(
\omega \right) \in B\right\}
\end{equation*}すなわち、\begin{equation*}
\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in
A\times B\right\}
\end{equation*}です。したがって、確率変数\(Y\)の実現値が\(B\)に属するという条件のもとで確率変数\(X\)の実現値が\(A\)に属する条件付き確率は、\begin{eqnarray*}P\left( X\in A|Y\in B\right) &=&\frac{P\left( \left\{ \omega \in \Omega \
|\ \left( X,Y\right) \left( \omega \right) \in A\times B\right\} \right) }{P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in B\right\}
\right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{P\left( \left( X,Y\right) \in A\times B\right) }{P\left( Y\in
B\right) }
\end{eqnarray*}となります。ただし、\begin{equation*}
P\left( Y\in B\right) >0
\end{equation*}である状況を想定していることに注意してください。
以上を踏まえると、集合\(A\in \mathcal{B}\left( \mathbb{R} \right) \)と実数\(y\in \mathbb{R} \)が与えられたとき、確率変数\(Y\)の実現値が\(y\)であるという条件のもとで確率変数\(X\)の実現値が\(A\)に属する条件付き確率は、\begin{eqnarray*}P\left( X\in A|Y=y\right) &=&P\left( X\in A|Y\in \left\{ y\right\} \right)
\\
&=&\frac{P\left( \left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left(
\omega \right) \in A\times \left\{ y\right\} \right\} \right) }{P\left(
\left\{ \omega \in \Omega \ |\ Y\left( \omega \right) \in \left\{ y\right\}
\right\} \right) }\quad \because \text{条件付き確率の定義} \\
&=&\frac{P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in
A\wedge Y\left( \omega \right) =y\right\} \right) }{P\left( \left\{ \omega
\in \Omega \ |\ Y\left( \omega \right) =y\right\} \right) } \\
&=&\frac{P\left( X\in A\wedge Y=y\right) }{P\left( Y=y\right) }
\end{eqnarray*}となります。ただし、絶対連続型の確率変数が特定の値をとる確率はゼロであるため、\begin{equation*}
P\left( Y=y\right) =0
\end{equation*}となり、先の条件付き確率の分母がゼロになってしまいます。このような問題を解決するためには何らかの工夫が必要です。そこで、代替案として、\(Y\)の実現値が特定の値\(y\)をとるという条件ではなく、\(Y\)の実現値が点\(y\)を端点とする区間\(\left[ y,y+h\right] \ \left( h>0\right) \)に属するという条件のもとでの条件付き確率\begin{eqnarray*}P\left( X\in A|Y\in \left[ y,y+h\right] \right) &=&\frac{P\left( X\in
A\wedge Y\in \left[ y,y+h\right] \right) }{P\left( Y\in \left[ y,y+h\right]
\right) } \\
&=&\frac{\int_{s\in A}\int_{t=y}^{y+h}f_{XY}\left( s,t\right) dsdt}{\int_{y}^{y+h}f_{Y}\left( t\right) dt}
\end{eqnarray*}に注目します。このような状況を想定すれば、\(Y=y\)の場合とは異なり、\begin{equation*}P\left( Y\in \left[ y,y+h\right] \right) =\int_{y}^{y+h}f_{Y}\left( t\right)
dt>0
\end{equation*}となる状況は起こり得ます。これを具体的に積分すると以下を得ます。証明では定積分に関する平均値の定理を利用します。
\end{equation*}を満たす\(y\in \mathbb{R} \)および\(h>0\)を任意に選ぶ。\(f_{XY}\)および\(f_{Y}\)が変数\(y\)に関して区間\(\left[ y,y+h\right] \)上で連続であるならば、\begin{equation*}P\left( X\in A|Y\in \left[ y,y+h\right] \right) =\int_{A}\frac{f_{XY}\left(
x,y+\theta _{1}h\right) }{f_{Y}\left( y+\theta _{2}h\right) }dx
\end{equation*}を満たす\(\theta _{1},\theta _{2}\in \left(0,1\right) \)が存在する。
以上の結果を踏まえた上で、区間\(\left[ y,y+h\right] \)の幅を限りなく短くすると、すなわち、\(h\rightarrow 0+\)の場合の右側極限をとると、\begin{eqnarray*}\lim_{h\rightarrow 0+}P\left( X\in A|Y\in \left[ y,y+h\right] \right)
&=&\lim_{h\rightarrow 0+}\int_{A}\frac{f_{XY}\left( x,y+\theta _{1}h\right)
}{f_{Y}\left( y+\theta _{2}h\right) }dx \\
&=&\int_{A}\frac{f_{XY}\left( x,y\right) }{f_{Y}\left( y\right) }dx
\end{eqnarray*}を得ます。\(h\rightarrow 0+\)の場合、区間\(\left[ y,y+h\right] \)は1点集合\(\left\{ y\right\} \)に限りなく近づきます。したがって、近似的には以下の関係\begin{equation}P\left( X\in A|Y=y\right) =\int_{A}\frac{f_{XY}\left( x,y\right) }{f_{Y}\left( y\right) }dx \quad \cdots (4)
\end{equation}という関係が成り立つことが明らかになりました。
以上の事情を踏まえた上で、\begin{equation*}
f_{Y}\left( y\right) >0
\end{equation*}を満たす\(y\in \mathbb{R} \)が与えられたとき、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X|Y=y}\left( x\right) =\frac{f_{XY}\left( x,y\right) }{f_{Y}\left(
y\right) }
\end{equation*}を定める関数\begin{equation*}
f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義すれば、\(\left( 4\right) \)より、近似的には以下の関係\begin{equation*}P\left( X\in A|Y=y\right) =\int_{A}f_{X|Y=y}\left( x\right) dx
\end{equation*}が成り立ちます。この関数\(f_{X|Y=y}\)を\(Y=y\)のもとでの\(X\)の条件付き確率密度関数(conditional probability density function of \(X\) given \(Y=y\))と呼びます。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\} \\
Y\left( \Omega \right) &=&\left\{ y\in \mathbb{R} \ |\ 0\leq y\leq 1\right\}
\end{eqnarray*}です。\(Y=0\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)を求めます。\(Y\)の周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( y\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dx
\\
&=&\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dx \\
&=&\left[ \frac{1}{2}x^{2}+\frac{3}{2}xy^{2}\right] _{0}^{1} \\
&=&\frac{1}{2}+\frac{3}{2}y^{2}
\end{eqnarray*}であるため、\begin{equation*}
f_{Y}\left( 0\right) =\frac{1}{2}\not=0
\end{equation*}であり、\(f_{X|Y=0}\)がそれぞれの\(x\in X\left( \Omega \right) \)に対して定める値は、\begin{eqnarray*}f_{X|Y=0}\left( x\right) &=&\frac{f_{XY}\left( x,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{x+\frac{3}{2}\cdot 0^{2}}{\frac{1}{2}} \\
&=&2x
\end{eqnarray*}であり、\(x\not\in X\left( \Omega \right) \)を満たす\(x\in X\)に対して定める値は、\begin{eqnarray*}f_{X|Y=0}\left( x\right) &=&\frac{f_{XY}\left( x,0\right) }{f_{Y}\left(
0\right) } \\
&=&\frac{0}{\frac{1}{2}} \\
&=&0
\end{eqnarray*}となります。結果をまとめると、\begin{equation*}
f_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cc}
2x & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、\(Y\)の値が\(0\)であるという条件のもとで\(X\)の値が\(0\)以上\(\frac{1}{2}\)以下である確率は、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}|Y=0\right) &=&\int_{0}^{\frac{1}{2}}f_{X|Y=0}\left( x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}2xdx \\
&=&2\int_{0}^{\frac{1}{2}}xdx \\
&=&2\left[ \frac{1}{2}x^{2}\right] _{0}^{\frac{1}{2}} \\
&=&2\left( \frac{1}{2}\right) \left( \frac{1}{2}\right) ^{2} \\
&=&\frac{1}{4}
\end{eqnarray*}です。
もう一方の確率変数\(Y\)についても同様に考えます。つまり、\begin{equation*}f_{X}\left( x\right) >0
\end{equation*}を満たす\(x\in \mathbb{R} \)が与えられたとき、それぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}f_{Y|X=x}\left( y\right) =\frac{f_{XY}\left( x,y\right) }{f_{X}\left(
x\right) }
\end{equation*}を定める関数\begin{equation*}
f_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義すれば、集合\(B\in \mathcal{B}\left( \mathbb{R} \right) \)を任意に選んだとき、近似的には以下の関係\begin{equation*}P\left( Y\in B|X=x\right) =\int_{B}f_{Y|X=x}\left( y\right) dy
\end{equation*}が成り立ちます。この関数\(f_{Y|X=x}\)を\(X=x\)のもとでの\(Y\)の条件付き確率密度関数(conditional probability density function of \(Y\) given \(X=x\))と呼びます。
条件付き確率密度関数の非負性
条件付き確率密度関数は非負の実数を値としてとります。特に、確率変数の値域に属さない値に対して、条件付き確率密度関数はゼロを値として定めます。
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在する。さらに、\begin{equation*}\forall x\in \mathbb{R} :f_{X|Y=y}\left( x\right) \geq 0
\end{equation*}が成り立つ。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に求めたように、\(Y=0\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cc}
2x & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X|Y=0}\left( x\right) \geq 0
\end{equation*}が成立しています。以上の結果は先の命題の主張と整合的です。
もう一方の確率変数\(Y\)についても同様の命題が成り立ちます。証明は先の命題と同様です。
\end{equation*}を満たす\(x\in \mathbb{R} \)を任意に選んだとき、\(X=x\)のもとでの\(Y\)の条件付き確率密度関数\(f_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)が存在する。さらに、\begin{equation*}\forall y\in \mathbb{R} :f_{Y|X=x}\left( y\right) \geq 0
\end{equation*}が成り立つ。
条件付き確率密度関数の積分
条件付き確率密度関数を全区間上で積分すると\(1\)になります。
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在する。さらに、\begin{equation*}\int_{-\infty }^{+\infty }f_{X|Y=y}\left( x\right) dx=1
\end{equation*}が成り立つ。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に求めたように、\(Y=0\)のもとでの\(X\)の条件付き確率密度関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cc}
2x & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。このとき、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X|Y=y}\left( x\right) dx &=&\int_{0}^{1}2xdx \\
&=&1
\end{eqnarray*}が成立しています。以上の結果は先の命題の主張と整合的です。
もう一方の確率変数\(Y\)についても同様の命題が成り立ちます。証明は先の命題と同様です。
\end{equation*}を満たす\(x\in \mathbb{R} \)を任意に選んだとき、\(X=x\)のもとでの\(Y\)の条件付き確率密度関数\(f_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)が存在する。さらに、\begin{equation*}\int_{-\infty }^{+\infty }f_{Y|X=x}\left( y\right) dy=1
\end{equation*}が成り立つ。
演習問題
\begin{array}{cl}
\frac{3}{4}\left( x-y\right) & \left( if\ 0\leq y<x<2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。以下の条件付き確率\begin{equation*}
P\left( X>1|Y=1\right)
\end{equation*}を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】