WIIS

連続型の確率分布

連続型同時確率変数の周辺化(周辺確率密度関数)

目次

Twitter
Mailで保存

同時確率分布から導かれる周辺確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)が与えられている場合、一方の確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値がある集合\(A\subset \mathbb{R} \)に属する確率\begin{equation*}P\left( X\in A\right)
\end{equation*}をどのように評価すればよいでしょうか。

同時確率変数\(\left( X,Y\right) \)はそれぞれの標本点\(\omega \in\Omega \)に対してベクトル\begin{equation*}\left( X,Y\right) \left( \omega \right) =\left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in \mathbb{R} ^{2}
\end{equation*}を1つずつ定めるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
&=&\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge Y\left(
\omega \right) \in Y\left( \Omega \right) \right\} \quad \because Y\left(
\omega \right) \in Y\left( \Omega \right) \text{は恒真式} \\
&=&\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \in A\times Y\left(
\Omega \right) \right\}
\end{eqnarray*}として表現されます。したがって、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ \left(
X,Y\right) \in A\times Y\left( \Omega \right) \right\} \right)
\end{equation*}となります。

同時確率変数\(\left( X,Y\right) \)が与えられている状況において、確率変数\(X\)の値がそれぞれの集合\(A\subset \mathbb{R} \)に属する確率\(P\left( X\in A\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X\)の周辺確率分布(marginal probability distribution)と呼びます。もう一方の確率変数\(Y\)についても同様の議論が成立します。同時確率変数の同時確率分布が分かっている場合には、個々の変数の周辺確率分布を特定できるということです。

 

離散型確率変数の周辺確率密度関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布は同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値が区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に属する確率が、\begin{equation*}P\left( \left( X,Y\right) \in I\times J\right) =\int \int_{\left( x,y\right)
\in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}であるということです。

同時確率変数\(\left( X,Y\right) \)の同時確率分布に関する以上の情報から、確率変数\(X\)の周辺確率分布を特定するためにはどうすればよいでしょうか。\(X\)は連続型の確率変数であるため、その確率分布を描写するためには確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を特定すれば十分です。確率密度関数の定義より、確率変数\(X\)の値が区間\(I\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in I\right) =\int_{x\in I}f_{X}\left( x\right) dx
\end{equation*}となりますが、この関数\(f_{X}\)は同時確率密度関数\(f_{XY}\)から以下のようにして導くことができます。

命題(周辺確率密度関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

つまり、確率変数\(X\)の確率密度関数\(f_{X}\left( x\right) \)を得るためには、同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}\left(x,y\right) \)を変数\(y\)に関して全区間\(\left( -\infty ,+\infty \right) \)上で積分すればよいということです。

例(周辺確率密度関数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\\
&=&\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dy \\
&=&\left[ xy+\frac{1}{2}y^{3}\right] _{0}^{1} \\
&=&x+\frac{1}{2}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。結果をまとめると、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、例えば、「確率変数\(X\)の値が\(\frac{1}{2}\)以下である確率」は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}\right) &=&\int_{-\infty }^{\frac{1}{2}}f_{X}\left( x\right) dx \\
&=&\int_{-\infty }^{0}0dx+\int_{0}^{\frac{1}{2}}\left( x+\frac{1}{2}\right)
dx \\
&=&\left[ \frac{1}{2}x^{2}+\frac{1}{2}x\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{2}\left( \frac{1}{2}\right) ^{2}+\frac{1}{2}\left( \frac{1}{2}\right) \\
&=&\frac{3}{8}
\end{eqnarray*}です。

もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。

命題(周辺確率密度関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation*}f_{Y}\left( y\right) =\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dx
\end{equation*}を定める。

つまり、確率変数\(Y\)の確率密度関数\(f_{Y}\left( y\right) \)を得るためには、同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}\left(x,y\right) \)を変数\(x\)に関して全区間\(\left( -\infty ,+\infty \right) \)上で積分すればよいということです。

以上の諸命題より、同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}\)が与えられれば、そこから個々の確率変数\(X,Y\)の確率密度関数\(f_{X},f_{Y}\)をそれぞれ導けることが明らかになりました。確率密度関数\(f_{X},f_{Y}\)が同時確率密度関数\(f_{XY}\)から導かれたものである場合には、\(f_{X},f_{Y}\)のことを確率変数\(X,Y\)に関する周辺確率密度関数(marginal probability density function)と呼びます。また、同時確率密度関数\(f_{XY}\)から周辺確率密度関数\(f_{X},f_{Y}\)を導くプロセスを周辺化(marginalizing)と呼びます。

 

周辺確率密度関数の非負性

周辺確率密度関数は非負の実数を値としてとります。

命題(周辺確率密度関数の非負性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(周辺確率密度関数の非負性)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}です。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。

もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。

命題(周辺確率密度関数の非負性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、任意の\(y\in \mathbb{R} \)に対して、\begin{equation*}f_{Y}\left( y\right) \geq 0
\end{equation*}が成り立つ。

 

周辺確率密度関数の積分

周辺確率密度関数を全区間上で積分すると\(1\)になります。

命題(周辺確率密度関数の積分)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、\begin{equation*}\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx=1
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(周辺確率密度関数の積分)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}です。このとき、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{-\infty
}^{0}0dx+\int_{0}^{1}\left( x+\frac{1}{2}\right) dx+\int_{1}^{+\infty }0dx \\
&=&\left[ \frac{1}{2}x^{2}+\frac{1}{2}x\right] _{0}^{1} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}が成立しています。

もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。

命題(周辺確率密度関数の積分)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、\begin{equation*}\int_{-\infty }^{+\infty }f_{Y}\left( y\right) dy=1
\end{equation*}が成り立つ。

 

演習問題

問題(周辺確率密度関数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{4}{5}\left( xy+x+y\right) & \left( if\ \left( x,y\right) \in \left(
X,Y\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の周辺確率密度関数\(f_{X},f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)をそれぞれ求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(周辺確率密度関数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\mathbb{R} _{+}^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
e^{-x-y} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識