同時確率分布から導かれる周辺確率分布
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)が与えられている場合、一方の確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値がある集合\(A\subset \mathbb{R} \)に属する確率\begin{equation*}P\left( X\in A\right)
\end{equation*}をどのように評価すればよいでしょうか。
同時確率変数\(\left( X,Y\right) \)はそれぞれの標本点\(\omega \in\Omega \)に対してベクトル\begin{equation*}\left( X,Y\right) \left( \omega \right) =\left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in \mathbb{R} ^{2}
\end{equation*}を1つずつ定めるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
&=&\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge Y\left(
\omega \right) \in Y\left( \Omega \right) \right\} \quad \because Y\left(
\omega \right) \in Y\left( \Omega \right) \text{は恒真式} \\
&=&\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \in A\times Y\left(
\Omega \right) \right\}
\end{eqnarray*}として表現されます。したがって、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ \left(
X,Y\right) \in A\times Y\left( \Omega \right) \right\} \right)
\end{equation*}となります。
同時確率変数\(\left( X,Y\right) \)が与えられている状況において、確率変数\(X\)の値がそれぞれの集合\(A\subset \mathbb{R} \)に属する確率\(P\left( X\in A\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X\)の周辺確率分布(marginal probability distribution)と呼びます。もう一方の確率変数\(Y\)についても同様の議論が成立します。同時確率変数の同時確率分布が分かっている場合には、個々の変数の周辺確率分布を特定できるということです。
離散型確率変数の周辺確率密度関数
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布は同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値が区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に属する確率が、\begin{equation*}P\left( \left( X,Y\right) \in I\times J\right) =\int \int_{\left( x,y\right)
\in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}であるということです。
同時確率変数\(\left( X,Y\right) \)の同時確率分布に関する以上の情報から、確率変数\(X\)の周辺確率分布を特定するためにはどうすればよいでしょうか。\(X\)は連続型の確率変数であるため、その確率分布を描写するためには確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を特定すれば十分です。確率密度関数の定義より、確率変数\(X\)の値が区間\(I\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in I\right) =\int_{x\in I}f_{X}\left( x\right) dx
\end{equation*}となりますが、この関数\(f_{X}\)は同時確率密度関数\(f_{XY}\)から以下のようにして導くことができます。
\end{equation*}を定める。
つまり、確率変数\(X\)の確率密度関数\(f_{X}\left( x\right) \)を得るためには、同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}\left(x,y\right) \)を変数\(y\)に関して全区間\(\left( -\infty ,+\infty \right) \)上で積分すればよいということです。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\\
&=&\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dy \\
&=&\left[ xy+\frac{1}{2}y^{3}\right] _{0}^{1} \\
&=&x+\frac{1}{2}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。結果をまとめると、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、例えば、「確率変数\(X\)の値が\(\frac{1}{2}\)以下である確率」は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}\right) &=&\int_{-\infty }^{\frac{1}{2}}f_{X}\left( x\right) dx \\
&=&\int_{-\infty }^{0}0dx+\int_{0}^{\frac{1}{2}}\left( x+\frac{1}{2}\right)
dx \\
&=&\left[ \frac{1}{2}x^{2}+\frac{1}{2}x\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{2}\left( \frac{1}{2}\right) ^{2}+\frac{1}{2}\left( \frac{1}{2}\right) \\
&=&\frac{3}{8}
\end{eqnarray*}です。
もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。
\end{equation*}を定める。
つまり、確率変数\(Y\)の確率密度関数\(f_{Y}\left( y\right) \)を得るためには、同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}\left(x,y\right) \)を変数\(x\)に関して全区間\(\left( -\infty ,+\infty \right) \)上で積分すればよいということです。
以上の諸命題より、同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}\)が与えられれば、そこから個々の確率変数\(X,Y\)の確率密度関数\(f_{X},f_{Y}\)をそれぞれ導けることが明らかになりました。確率密度関数\(f_{X},f_{Y}\)が同時確率密度関数\(f_{XY}\)から導かれたものである場合には、\(f_{X},f_{Y}\)のことを確率変数\(X,Y\)に関する周辺確率密度関数(marginal probability density function)と呼びます。また、同時確率密度関数\(f_{XY}\)から周辺確率密度関数\(f_{X},f_{Y}\)を導くプロセスを周辺化(marginalizing)と呼びます。
周辺確率密度関数の非負性
周辺確率密度関数は非負の実数を値としてとります。
\end{equation*}が成り立つ。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}です。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。
もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。
\end{equation*}が成り立つ。
周辺確率密度関数の積分
周辺確率密度関数を全区間上で積分すると\(1\)になります。
\end{equation*}が成り立つ。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\}
\end{equation*}であるとともに、\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}です。このとき、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{-\infty
}^{0}0dx+\int_{0}^{1}\left( x+\frac{1}{2}\right) dx+\int_{1}^{+\infty }0dx \\
&=&\left[ \frac{1}{2}x^{2}+\frac{1}{2}x\right] _{0}^{1} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}が成立しています。
もう一方の確率変数\(Y\)についても同様の議論が成立します。証明は先の命題と同様です。
\end{equation*}が成り立つ。
演習問題
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{4}{5}\left( xy+x+y\right) & \left( if\ \left( x,y\right) \in \left(
X,Y\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の周辺確率密度関数\(f_{X},f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)をそれぞれ求めてください。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
e^{-x-y} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】