教材一覧
教材一覧
教材検索

離散型の確率分布

離散型確率変数の条件付き分布関数

目次

Twitterで共有
メールで共有

条件付き確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布が同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値がベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)と一致する確率は、\begin{equation*}P\left( X=x\wedge Y=y\right) =f_{XY}\left( x,y\right)
\end{equation*}であり、同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =\sum_{\left( x,y\right) \in
A\times B}f_{XY}\left( x,y\right)
\end{equation*}であるということです。この場合、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の周辺確率質量関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}f_{Y}\left( y\right) =\left\{
\begin{array}{cc}
\sum\limits_{\left( x_{i},y_{i}\right) \in \left( X,Y\right) \left( \Omega
\right) \ s.t.\ y_{i}=y}f_{XY}\left( x_{i},y_{i}\right) & \left( if\ y\in
Y\left( \Omega \right) \right) \\
0 & \left( if\ y\not\in Y\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。特に、\begin{equation*}
f_{Y}\left( y\right) >0
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在し、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X|Y=y}\left( x\right) =\frac{f_{XY}\left( x,y\right) }{f_{Y}\left(
y\right) }
\end{equation*}を定めます。確率変数\(Y\)の値が\(y\)であるという条件のもとで確率変数\(X\)の値が\(x\)である確率は、\begin{equation*}P\left( X=x|Y=y\right) =f_{X|Y=y}\left( x\right)
\end{equation*}であり、確率変数\(Y\)の値が\(y\)であるという条件のもとで確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A|Y=y\right) =\sum_{x\in A}f_{X|Y=y}\left( x\right)
\end{equation*}として定まります。

それぞれの集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A|Y=y\right) \)が明らかになっている場合、そのような情報の集まりを\(Y=y\)のもとでの確率変数\(X\)の条件付き確率分布と呼びます。条件付き確率質量関数\(f_{X|Y=y}\)が与えられれば上の関係を用いて任意の集合\(A\)に関する確率\(P\left( X\in A|Y=y\right) \)を特定できるため、条件付き確率質量関数は離散型の確率変数の条件付き確率分布を表現する手段の1つです。ただ、離散型の確率変数の条件付き確率分布は、条件付き確率質量関数とは異なる概念を用いて表現することもできます。順番に解説します。

 

離散型確率変数の条件付き分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\(\left( X,Y\right) \)が与えられている場合、一方の確率変数\(Y\)の値が\(y\)であるという条件のもとでもう一方の確率変数\(X\)の値が\(x\)以下である条件付き確率\begin{equation*}P\left( X\leq x|Y=y\right)
\end{equation*}をどのように評価すればよいでしょうか。

2つの実数\(x,y\in \mathbb{R} \)を任意に選んだとき、「確率変数\(X\)の値が\(x\)以下である」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\}
\end{equation*}であり、「確率変数\(Y\)の値が\(y\)である」という事象は、\begin{equation*}\left\{ \omega \in \Omega \ |\ Y\left( \omega \right) =y\right\}
\end{equation*}です。以上の2つの事象の積事象は「確率変数\(X\)の値が\(x\)以下であるとともに確率変数\(Y\)の値が\(y\)である」ですが、これは、\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\wedge Y\left(
\omega \right) =y\right\}
\end{equation*}です。したがって、確率変数\(Y\)の値が\(y\)であるという条件のもとで確率変数\(X\)の値が\(x\)以下である条件付き確率は、\begin{equation*}P\left( X\leq x|Y=y\right) =\frac{P\left( \left\{ \omega \in \Omega \ |\
X\left( \omega \right) \leq x\wedge Y\left( \omega \right) =y\right\}
\right) }{P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right)
=y\right\} \right) }\quad \because \text{条件付き確率の定義}
\end{equation*}となります。以上を踏まえた上で、\begin{equation*}
P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega \right) =y\right\}
\right) >0
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだ上で、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X|Y=y}\left( x\right) =P\left( X\leq x|Y=y\right)
\end{equation*}を定める関数\begin{equation*}
F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義し、これを\(Y=y\)のもとでの\(X\)の条件付き分布関数(conditional distribution function)や条件付き累積分布関数(conditional cumulative distribution function)などと呼びます。

同時確率質量関数や条件付き確率質量関数が与えられている場合、そこから条件付き分布関数を以下の要領で特定できます。

命題(離散型確率変数の条件付き分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。そこから導かれる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)の周辺確率質量関数が\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)であるものする。その上で、\begin{equation*}f_{Y}\left( y\right) >0
\end{equation*}を満たす\(y\in \mathbb{R} \)を任意に選んだとき、\(Y=y\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、条件付き分布関数\(F_{X|Y=y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{eqnarray*}F_{X|Y=y}\left( x\right) &=&\sum_{x_{i}\leq x}f_{X|Y=y}\left( x_{i}\right)
\\
&=&\frac{1}{f_{Y}\left( y\right) }\sum_{x_{i}\leq x}f_{XY}\left(
x_{i},y\right)
\end{eqnarray*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題は、条件付き周辺分布関数\(F_{X|Y=y}\)が条件付き周辺確率質量関数\(f_{X|Y=y}\)から導出可能であることを示唆します。つまり、条件付き周辺分布関数\(F_{X|Y=y}\)が点\(x\)に対して定める値は、条件付き周辺確率質量関数\(f_{X|Y=y}\)が\(x\)以下のそれぞれの点に対して定める値の総和と一致します。

例(離散型確率変数の条件付き分布関数)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( 1,1\right) ,\left(
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ 0,1,2\right\} \\
Y\left( \Omega \right) &=&\left\{ 0,1\right\}
\end{eqnarray*}です。\(Y=0\)のもとでの\(X\)の条件付き確率質量関数\(f_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{2} & \left( if\ x=0\right) \\
0 & \left( if\ x=1\right) \\
\frac{1}{2} & \left( if\ x=2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}です。すると、先の命題より、条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}F_{X|Y=0}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2} & \left( if\ 0\leq x<2\right) \\
1 & \left( if\ x\geq 2\right)
\end{array}\right.
\end{equation*}です。

もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。

命題(離散型確率変数の条件付き分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。そこから導かれる確率変数\(X:\Omega\rightarrow \mathbb{R} \)の周辺確率質量関数が\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)であるものする。その上で、\begin{equation*}f_{X}\left( x\right) >0
\end{equation*}を満たす\(x\in \mathbb{R} \)を任意に選んだとき、\(X=x\)のもとでの\(Y\)の条件付き確率質量関数\(f_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、条件付き分布関数\(F_{Y|X=x}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{eqnarray*}F_{Y|X=x}\left( y\right) &=&\sum_{y_{i}\leq y}f_{Y|X=x}\left( y_{i}\right)
\\
&=&\frac{1}{f_{X}\left( x\right) }\sum_{y_{i}\leq y}f_{XY}\left(
x,y_{i}\right)
\end{eqnarray*}を定める。

上の命題は、条件付き周辺分布関数\(F_{Y|X=x}\)が条件付き周辺確率質量関数\(f_{Y|X=x}\)から導出可能であることを示唆します。つまり、条件付き周辺分布関数\(F_{Y|X=x}\)が点\(y\)に対して定める値は、条件付き周辺確率質量関数\(f_{Y|X=x}\)が\(y\)以下のそれぞれの点に対して定める値の総和と一致します。

 

演習問題

問題(条件付き分布関数)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( 1,1\right) ,\left(
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(Y=1\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=1}:\mathbb{R} \rightarrow \mathbb{R} \)を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(条件付き分布関数)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( 1,0\right) ,\left(
2,0\right) ,\left( 1,1\right) ,\left( 1,2\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{4} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(Y=0\)のもとでの\(X\)の条件付き分布関数\(F_{X|Y=0}:\mathbb{R} \rightarrow \mathbb{R} \)を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitterで共有
メールで共有
DISCUSSION

質問とコメント