同時確率分布から導かれる周辺確率分布
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられている場合、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の値がある集合\(A_{1}\subset \mathbb{R} \)に属する確率\begin{equation*}P\left( X_{1}\in A_{1}\right)
\end{equation*}をどのように評価すればよいでしょうか。
確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率変数\(X_{1}\)の値が集合\(A_{1}\)に属する」という事象は、\(X_{1}\left( \omega\right) \in A_{1}\)を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}&&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\right\}
\\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
X_{2}\left( \omega \right) \in X\left( \Omega \right) \wedge \cdots \wedge
X_{n}\left( \omega \right) \in X_{n}\left( \Omega \right) \right\} \\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
\left( X_{2},\cdots ,X_{n}\right) \left( \omega \right) \in \left(
X_{2},\cdots ,X_{n}\right) \left( \Omega \right) \right\}
\end{eqnarray*}として表現されます。したがって、「確率変数\(X_{1}\)の値が集合\(A_{1} \)に属する」という事象が起こる確率は、\begin{equation*}P\left( X_{1}\in A_{1}\right) =P\left( \left\{ \omega \in \Omega \ |\
X_{1}\left( \omega \right) \in A_{1}\wedge \left( X_{2},\cdots ,X_{n}\right)
\left( \omega \right) \in \left( X_{2},\cdots ,X_{n}\right) \left( \Omega
\right) \right\} \right)
\end{equation*}となります。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。
確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)が与えられている状況において、確率変数\(X_{1}\)の値がそれぞれの集合\(A_{1}\subset \mathbb{R} \)に属する確率\(P\left( X_{1}\in A_{1}\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X_{1}\)の周辺確率分布(marginal probability distribution)と呼びます。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。
連続型確率変数の周辺確率密度関数
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられており、その同時確率分布が同時確率密度関数\begin{equation*}
f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)が区間の直積\(I_{1}\times \cdots \times I_{n}\subset \mathbb{R} ^{n}\)に属する確率が、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in I_{1}\times \cdots \times
I_{n}\right) =\int \cdots \int_{\left( x_{1},\cdots ,x_{n}\right) \in
I_{1}\times \cdots \times I_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots
,x_{n}\right) dx_{1}\cdots dx_{n}
\end{equation*}であるということです。
確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率分布に関する以上の情報から、確率変数\(X_{1}\)の周辺確率分布を特定するためにはどうすればよいでしょうか。\(X_{1}\)は連続型の確率変数であるため、その確率分布を描写するためには確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)を特定すれば十分です。確率密度関数の定義より、確率変数\(X_{1}\)の値が区間\(I_{1}\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X_{1}\in I_{1}\right) =\int_{x_{1}\in I_{1}}f_{X_{1}}\left(
x_{1}\right) dx_{1}
\end{equation*}となりますが、この関数\(f_{X_{1}}\)は同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から以下のようにして導くことができます。
}^{+\infty }f_{X_{1}\cdots X_{n}}\left( x_{1},y_{2},\cdots ,y_{n}\right)
dy_{2}\cdots dy_{n}
\end{equation*}を定める。
つまり、確率変数\(X_{1}\)の確率密度関数の値\(f_{X_{1}}\)を得るためには、確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)を変数\(x_{2},\cdots,x_{n}\)に関して\(\left( -\infty ,+\infty \right)^{n-1}\)上で積分すればよいということです。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty
}f_{XYZ}\left( x,y,z\right) dydz \\
&=&\int_{0}^{1}\int_{0}^{1}\left( \frac{1}{3}x+\frac{2}{3}y+z\right) dydz \\
&=&\int_{0}^{1}\left[ \frac{1}{3}xy+\frac{1}{3}y^{2}+zy\right] _{0}^{1}dz \\
&=&\int_{0}^{1}\left( \frac{1}{3}x+\frac{1}{3}+z\right) dz \\
&=&\left[ \frac{1}{3}xz+\frac{1}{3}z+\frac{1}{2}z^{2}\right] _{0}^{1} \\
&=&\frac{1}{3}x+\frac{1}{3}+\frac{1}{2} \\
&=&\frac{1}{3}x+\frac{5}{6}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。結果をまとめると、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、例えば、「確率変数\(X\)の値が\(\frac{1}{2}\)以下である確率」は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}\right) &=&\int_{-\infty }^{\frac{1}{2}}f_{X}\left( x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}\left( \frac{1}{3}x+\frac{5}{6}\right) dx \\
&=&\left[ \frac{1}{6}x^{2}+\frac{5}{6}x\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{6}\left( \frac{1}{2}\right) ^{2}+\frac{5}{6}\left( \frac{1}{2}\right) \\
&=&\frac{11}{24}
\end{eqnarray*}です。他の確率変数\(Y,Z\)についても同様に考えます。
先の命題より、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば、そこから個々の確率変数\(X_{1},\cdots ,X_{n}\)の確率密度関数\(f_{X_{1}},\cdots ,f_{X_{n}}\)をそれぞれ導けることが明らかになりました。確率密度関数\(f_{X_{1}},\cdots,f_{X_{n}}\)が同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から導かれたものである場合には、\(f_{X_{1}},\cdots ,f_{X_{n}}\)のことを確率変数\(X_{1},\cdots ,X_{n}\)に関する周辺確率密度関数(marginal probability density function)と呼びます。また、同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から周辺確率密度関数\(f_{X_{1}},\cdots ,f_{X_{n}}\)を導くプロセスを周辺化(marginalizing)と呼びます。
周辺確率密度関数の非負性
周辺確率密度関数は非負の実数を値としてとります。
\end{equation*}が成り立つ。
他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。他の確率変数\(Y,Z\)についても同様に考えます。
周辺確率密度関数の積分
周辺確率密度関数を全区間上で積分すると\(1\)になります。
\end{equation*}が成り立つ。
他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。このとき、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{0}^{1}\left(
\frac{1}{3}x+\frac{5}{6}\right) dx \\
&=&\left[ \frac{1}{6}x^{2}+\frac{5}{6}x\right] _{0}^{1} \\
&=&\frac{1}{6}+\frac{5}{6} \\
&=&1
\end{eqnarray*}が成立しています。他の確率変数\(Y,Z\)についても同様に考えます。
演習問題
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cc}
e^{-x-y-z} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( if\ \left( x,y,z\right) \not\in \left( X,Y,Z\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。個々の確率変数\(X,Y,Z:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{X},f_{Y},f_{Z}:\mathbb{R} \rightarrow \mathbb{R} \)をそれぞれ求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】