連続型同時確率変数の周辺化（周辺分布関数）

同時分布関数から導かれる周辺分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値が区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に属する確率が、\begin{equation*}P\left( \left( X,Y\right) \in I\times J\right) =\int \int_{\left( x,y\right)
\in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}であるということです。この場合、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\end{equation*}を定めることを示しました。周辺確率密度関数の定義より、確率変数\(X\)の値が区間\(I\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in I\right) =\int_{x\in I}f_{X}\left( x\right) dx
\end{equation*}として定まります。

それぞれの集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X\)の周辺確率分布と呼びます。\(X\)が離散型の確率変数である場合、\(X\)の周辺確率分布を特定するためには\(X\)の値がそれぞれの区間\(I\subset \mathbb{R} \)に属する確率\(P\left( X\in I\right) \)を特定すれば十分です。したがって、周辺確率密度関数は連続型の確率変数の周辺分布を表現する手段の1つです。ただ、連続型の確率変数の周辺確率分布は、周辺確率密度関数とは異なる概念を用いて表現することもできます。順番に解説します。

連続型確率変数の周辺分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられている場合、一方の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が特定の実数\(x\in \mathbb{R} \)以下の値をとる確率\begin{equation*}P\left( X\leq x\right)
\end{equation*}をどのように評価すればよいでしょうか。

同時確率変数\(\left( X,Y\right) \)はそれぞれの標本点\(\omega \in\Omega \)に対してベクトル\begin{equation*}\left( X,Y\right) \left( \omega \right) =\left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in \mathbb{R} ^{2}
\end{equation*}を1つずつ定めるため、「確率変数\(X\)の値が\(x\)以下である」という事象は、\(X\left( \omega \right) \leq x\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\}
=\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\wedge Y\left(
\omega \right) \in Y\left( \Omega \right) \right\} \quad \because Y\left(
\omega \right) \in Y\left( \Omega \right) \text{は恒真式}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が\(x\)以下である」という事象が起こる確率は、\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\wedge Y\left( \omega \right) \in Y\left( \Omega
\right) \right\} \right)
\end{equation*}となります。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、確率変数\(X\)が\(x\)以下の値をとる確率\begin{equation*}F_{X}\left( x\right) =P\left( X\leq x\right)
\end{equation*}を特定する関数\begin{equation*}
F_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義し、これを\(X\)の周辺分布関数（marginal distribution function）や周辺累積分布関数（cumulative marginal distribution function）などと呼びます。

連続型の確率変数\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられている場合には、点\(x\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt
\end{equation*}という関係が成り立つことが保証されます。つまり、周辺確率密度関数\(f_{X}\)を無限区間\((-\infty ,x]\)上で積分すれば\(F_{X}\left( x\right) \)が得られるということです。言い換えると、連続型の確率変数\(X\)に関しては、周辺分布関数\(F_{X}\)が周辺確率密度関数\(f_{X}\)から導出可能であるということです。

命題（連続型確率変数の周辺分布関数）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( s\right) ds
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

上の命題は、周辺分布関数\(F_{X}\)が周辺確率密度関数\(f_{X}\)から導出可能であることを示唆します。つまり、周辺分布関数\(F_{X}\)が点\(x\)に対して定める値は、周辺確率密度\(f_{X}\)を無限区間\((-\infty ,x]\)上で積分した値と一致します。

例（連続型確率変数の周辺分布関数）

連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\\
&=&\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dy \\
&=&\left[ xy+\frac{1}{2}y^{3}\right] _{0}^{1} \\
&=&x+\frac{1}{2}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。結果を整理すると、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。すると、先の命題より、周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\(x<0\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( s\right) ds \\
&=&\int_{-\infty }^{x}0ds\quad \because x<0 \\
&=&0
\end{eqnarray*}であり、\(0\leq x<1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( s\right) ds \\
&=&\int_{-\infty }^{0}0ds+\int_{0}^{x}\left( s+\frac{1}{2}\right) ds\quad
\because 0\leq x<1 \\
&=&0+\left[ \frac{1}{2}s^{2}+\frac{1}{2}s\right] _{0}^{x} \\
&=&\frac{1}{2}x^{2}+\frac{1}{2}x
\end{eqnarray*}であり、\(x\geq 1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( s\right) ds \\
&=&\int_{-\infty }^{0}0ds+\int_{0}^{1}\left( s+\frac{1}{2}\right)
ds+\int_{1}^{+\infty }0ds\quad \because x\geq 1 \\
&=&0+\left[ \frac{1}{2}s^{2}+\frac{1}{2}s\right] _{0}^{1}+0 \\
&=&\frac{1}{2}\cdot 1^{2}+\frac{1}{2}\cdot 1 \\
&=&1
\end{eqnarray*}となります。結果をまとめると、\begin{equation*}
F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}となります。したがって、例えば、\(X\)の値が\(\frac{1}{2}\)以下である確率は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}\right) &=&F_{X}\left( \frac{1}{2}\right) \\
&=&\frac{1}{2}\left( \frac{1}{2}\right) ^{2}+\frac{1}{2}\left( \frac{1}{2}\right) \\
&=&\frac{3}{8}
\end{eqnarray*}です。

もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。

命題（連続型確率変数の周辺分布関数）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、周辺分布関数\(F_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}F_{Y}\left( y\right) =\int_{-\infty }^{y}f_{Y}\left( t\right) dt
\end{equation*}を定める。

上の命題は、周辺分布関数\(F_{Y}\)が周辺確率密度関数\(f_{Y}\)から導出可能であることを示唆します。つまり、周辺分布関数\(F_{Y}\)が点\(y\)に対して定める値は、周辺確率密度\(f_{Y}\)を無限区間\((-\infty ,y]\)上で積分した値と一致します。

同時分布関数と周辺分布関数の関係

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布が同時分布関数\(F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値がベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)以下である確率が、\begin{equation*}P\left( X\leq x\wedge Y\leq y\right) =F_{XY}\left( x,y\right)
\end{equation*}であるということです。

同時分布関数\(F_{XY}\)から確率変数\(X\)の周辺分布関数\(F_{X}\)を以下の要領で導くこともできます。

命題（同時分布関数と周辺分布関数の関係）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時分布関数\(F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\lim_{y\rightarrow \infty }F_{XY}\left( x,y\right)
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

例（同時分布関数と周辺分布関数の関係）

同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、同時分布関数\(F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}F_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\vee y<0\right) \\
\frac{1}{2}x^{2}y+\frac{1}{2}xy^{3} & \left( if\ 0\leq x\leq 1\wedge 0\leq
y\leq 1\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x\leq 1\wedge y>1\right)
\\
\frac{1}{2}y+\frac{1}{2}y^{3} & \left( if\ x>1\wedge 0\leq y\leq 1\right)
\\
1 & \left( if\ x>1\wedge y>1\right)
\end{array}\right.
\end{equation*}を定めるものとします。先の命題より、周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\(x<0\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\lim_{y\rightarrow \infty }F_{XY}\left( x,y\right)
\\
&=&\lim_{y\rightarrow \infty }0\quad \because F_{XY}\text{の定義} \\
&=&0
\end{eqnarray*}であり、\(0\leq x\leq 1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\lim_{y\rightarrow \infty }F_{XY}\left( x,y\right)
\\
&=&\lim_{y\rightarrow \infty }\left( \frac{1}{2}x^{2}+\frac{1}{2}x\right)
\quad \because F_{XY}\text{の定義} \\
&=&\frac{1}{2}x^{2}+\frac{1}{2}x
\end{eqnarray*}であり、\(x>1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\lim_{y\rightarrow \infty }F_{XY}\left( x,y\right)
\\
&=&\lim_{y\rightarrow \infty }1\quad \because F_{XY}\text{の定義} \\
&=&1
\end{eqnarray*}となります。結論をまとめると、\begin{equation*}
F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}となります。

もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。

命題（同時分布関数と周辺分布関数の関係）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時分布関数\(F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の周辺分布関数\(F_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、それぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}F_{Y}\left( y\right) =\lim_{x\rightarrow \infty }F_{XY}\left( x,y\right)
\end{equation*}を定める。

演習問題

問題（周辺分布関数）

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

問題（周辺確率密度関数）

連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\mathbb{R} _{+}^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
e^{-x-y} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を求めてください。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

WIIS

数学のコース

経済学のコース

アカウント

WIIS

連続型の確率分布

連続型同時確率変数の周辺化（周辺分布関数）

目次

関連知識

同時分布関数から導かれる周辺分布関数

連続型確率変数の周辺分布関数

同時分布関数と周辺分布関数の関係

演習問題

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率