WIIS

連続型の確率分布

連続型確率ベクトルの周辺化(周辺確率密度関数)

目次

関連知識

Mailで保存
Xで共有

同時確率分布から導かれる周辺確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられている場合、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の値がある集合\(A_{1}\subset \mathbb{R} \)に属する確率\begin{equation*}P\left( X_{1}\in A_{1}\right)
\end{equation*}をどのように評価すればよいでしょうか。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率変数\(X_{1}\)の値が集合\(A_{1}\)に属する」という事象は、\(X_{1}\left( \omega\right) \in A_{1}\)を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}&&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\right\}
\\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
X_{2}\left( \omega \right) \in X\left( \Omega \right) \wedge \cdots \wedge
X_{n}\left( \omega \right) \in X_{n}\left( \Omega \right) \right\} \\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
\left( X_{2},\cdots ,X_{n}\right) \left( \omega \right) \in \left(
X_{2},\cdots ,X_{n}\right) \left( \Omega \right) \right\}
\end{eqnarray*}として表現されます。したがって、「確率変数\(X_{1}\)の値が集合\(A_{1} \)に属する」という事象が起こる確率は、\begin{equation*}P\left( X_{1}\in A_{1}\right) =P\left( \left\{ \omega \in \Omega \ |\
X_{1}\left( \omega \right) \in A_{1}\wedge \left( X_{2},\cdots ,X_{n}\right)
\left( \omega \right) \in \left( X_{2},\cdots ,X_{n}\right) \left( \Omega
\right) \right\} \right)
\end{equation*}となります。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)が与えられている状況において、確率変数\(X_{1}\)の値がそれぞれの集合\(A_{1}\subset \mathbb{R} \)に属する確率\(P\left( X_{1}\in A_{1}\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X_{1}\)の周辺確率分布(marginal probability distribution)と呼びます。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。

 

連続型確率変数の周辺確率密度関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられており、その同時確率分布が同時確率密度関数\begin{equation*}
f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)が区間の直積\(I_{1}\times \cdots \times I_{n}\subset \mathbb{R} ^{n}\)に属する確率が、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in I_{1}\times \cdots \times
I_{n}\right) =\int \cdots \int_{\left( x_{1},\cdots ,x_{n}\right) \in
I_{1}\times \cdots \times I_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots
,x_{n}\right) dx_{1}\cdots dx_{n}
\end{equation*}であるということです。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率分布に関する以上の情報から、確率変数\(X_{1}\)の周辺確率分布を特定するためにはどうすればよいでしょうか。\(X_{1}\)は連続型の確率変数であるため、その確率分布を描写するためには確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)を特定すれば十分です。確率密度関数の定義より、確率変数\(X_{1}\)の値が区間\(I_{1}\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X_{1}\in I_{1}\right) =\int_{x_{1}\in I_{1}}f_{X_{1}}\left(
x_{1}\right) dx_{1}
\end{equation*}となりますが、この関数\(f_{X_{1}}\)は同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から以下のようにして導くことができます。

命題(周辺確率密度関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{X_{1}}\left( x_{1}\right) =\int_{-\infty }^{+\infty }\cdots \int_{-\infty
}^{+\infty }f_{X_{1}\cdots X_{n}}\left( x_{1},y_{2},\cdots ,y_{n}\right)
dy_{2}\cdots dy_{n}
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

つまり、確率変数\(X_{1}\)の確率密度関数の値\(f_{X_{1}}\)を得るためには、確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)を変数\(x_{2},\cdots,x_{n}\)に関して\(\left( -\infty ,+\infty \right)^{n-1}\)上で積分すればよいということです。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。

例(周辺確率密度関数)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left[ 0,1\right] ^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty
}f_{XYZ}\left( x,y,z\right) dydz \\
&=&\int_{0}^{1}\int_{0}^{1}\left( \frac{1}{3}x+\frac{2}{3}y+z\right) dydz \\
&=&\int_{0}^{1}\left[ \frac{1}{3}xy+\frac{1}{3}y^{2}+zy\right] _{0}^{1}dz \\
&=&\int_{0}^{1}\left( \frac{1}{3}x+\frac{1}{3}+z\right) dz \\
&=&\left[ \frac{1}{3}xz+\frac{1}{3}z+\frac{1}{2}z^{2}\right] _{0}^{1} \\
&=&\frac{1}{3}x+\frac{1}{3}+\frac{1}{2} \\
&=&\frac{1}{3}x+\frac{5}{6}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。結果をまとめると、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、例えば、「確率変数\(X\)の値が\(\frac{1}{2}\)以下である確率」は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}\right) &=&\int_{-\infty }^{\frac{1}{2}}f_{X}\left( x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}\left( \frac{1}{3}x+\frac{5}{6}\right) dx \\
&=&\left[ \frac{1}{6}x^{2}+\frac{5}{6}x\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{6}\left( \frac{1}{2}\right) ^{2}+\frac{5}{6}\left( \frac{1}{2}\right) \\
&=&\frac{11}{24}
\end{eqnarray*}です。他の確率変数\(Y,Z\)についても同様に考えます。

先の命題より、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば、そこから個々の確率変数\(X_{1},\cdots ,X_{n}\)の確率密度関数\(f_{X_{1}},\cdots ,f_{X_{n}}\)をそれぞれ導けることが明らかになりました。確率密度関数\(f_{X_{1}},\cdots,f_{X_{n}}\)が同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から導かれたものである場合には、\(f_{X_{1}},\cdots ,f_{X_{n}}\)のことを確率変数\(X_{1},\cdots ,X_{n}\)に関する周辺確率密度関数(marginal probability density function)と呼びます。また、同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から周辺確率密度関数\(f_{X_{1}},\cdots ,f_{X_{n}}\)を導くプロセスを周辺化(marginalizing)と呼びます。

 

周辺確率密度関数の非負性

周辺確率密度関数は非負の実数を値としてとります。

命題(周辺確率密度関数の非負性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、任意の\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{X_{1}}\left( x_{1}\right) \geq 0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

例(周辺確率密度関数の非負性)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left[ 0,1\right] ^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。他の確率変数\(Y,Z\)についても同様に考えます。

 

周辺確率密度関数の積分

周辺確率密度関数を全区間上で積分すると\(1\)になります。

命題(周辺確率密度関数の積分)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、\begin{equation*}\int_{-\infty }^{+\infty }f_{X_{1}}\left( x_{1}\right) dx_{1}=1
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

例(周辺確率密度関数の積分)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left[ 0,1\right] ^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。このとき、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{0}^{1}\left(
\frac{1}{3}x+\frac{5}{6}\right) dx \\
&=&\left[ \frac{1}{6}x^{2}+\frac{5}{6}x\right] _{0}^{1} \\
&=&\frac{1}{6}+\frac{5}{6} \\
&=&1
\end{eqnarray*}が成立しています。他の確率変数\(Y,Z\)についても同様に考えます。

 

演習問題

問題(周辺確率密度関数)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\mathbb{R} _{++}^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cc}
e^{-x-y-z} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( if\ \left( x,y,z\right) \not\in \left( X,Y,Z\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。個々の確率変数\(X,Y,Z:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{X},f_{Y},f_{Z}:\mathbb{R} \rightarrow \mathbb{R} \)をそれぞれ求めてください。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録