WIIS

連続型の確率分布

連続型確率ベクトルの周辺化(周辺確率密度関数)

目次

Twitter
Mailで保存

同時確率分布から導かれる周辺確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられている場合、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の値がある集合\(A_{1}\subset \mathbb{R} \)に属する確率\begin{equation*}P\left( X_{1}\in A_{1}\right)
\end{equation*}をどのように評価すればよいでしょうか。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率変数\(X_{1}\)の値が集合\(A_{1}\)に属する」という事象は、\(X_{1}\left( \omega\right) \in A_{1}\)を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}&&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\right\}
\\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
X_{2}\left( \omega \right) \in X\left( \Omega \right) \wedge \cdots \wedge
X_{n}\left( \omega \right) \in X_{n}\left( \Omega \right) \right\} \\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
\left( X_{2},\cdots ,X_{n}\right) \left( \omega \right) \in \left(
X_{2},\cdots ,X_{n}\right) \left( \Omega \right) \right\}
\end{eqnarray*}として表現されます。したがって、「確率変数\(X_{1}\)の値が集合\(A_{1} \)に属する」という事象が起こる確率は、\begin{equation*}P\left( X_{1}\in A_{1}\right) =P\left( \left\{ \omega \in \Omega \ |\
X_{1}\left( \omega \right) \in A_{1}\wedge \left( X_{2},\cdots ,X_{n}\right)
\left( \omega \right) \in \left( X_{2},\cdots ,X_{n}\right) \left( \Omega
\right) \right\} \right)
\end{equation*}となります。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)が与えられている状況において、確率変数\(X_{1}\)の値がそれぞれの集合\(A_{1}\subset \mathbb{R} \)に属する確率\(P\left( X_{1}\in A_{1}\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X_{1}\)の周辺確率分布(marginal probability distribution)と呼びます。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。

 

連続型確率変数の周辺確率密度関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられており、その同時確率分布が同時確率密度関数\begin{equation*}
f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)が区間の直積\(I_{1}\times \cdots \times I_{n}\subset \mathbb{R} ^{n}\)に属する確率が、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in I_{1}\times \cdots \times
I_{n}\right) =\int \cdots \int_{\left( x_{1},\cdots ,x_{n}\right) \in
I_{1}\times \cdots \times I_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots
,x_{n}\right) dx_{1}\cdots dx_{n}
\end{equation*}であるということです。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率分布に関する以上の情報から、確率変数\(X_{1}\)の周辺確率分布を特定するためにはどうすればよいでしょうか。\(X_{1}\)は連続型の確率変数であるため、その確率分布を描写するためには確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)を特定すれば十分です。確率密度関数の定義より、確率変数\(X_{1}\)の値が区間\(I_{1}\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X_{1}\in I_{1}\right) =\int_{x_{1}\in I_{1}}f_{X_{1}}\left(
x_{1}\right) dx_{1}
\end{equation*}となりますが、この関数\(f_{X_{1}}\)は同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から以下のようにして導くことができます。

命題(周辺確率密度関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{X_{1}}\left( x_{1}\right) =\int_{-\infty }^{+\infty }\cdots \int_{-\infty
}^{+\infty }f_{X_{1}\cdots X_{n}}\left( x_{1},y_{2},\cdots ,y_{n}\right)
dy_{2}\cdots dy_{n}
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

つまり、確率変数\(X_{1}\)の確率密度関数の値\(f_{X_{1}}\)を得るためには、確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)を変数\(x_{2},\cdots,x_{n}\)に関して\(\left( -\infty ,+\infty \right)^{n-1}\)上で積分すればよいということです。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様に考えます。

例(周辺確率密度関数)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left[ 0,1\right] ^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty
}f_{XYZ}\left( x,y,z\right) dydz \\
&=&\int_{0}^{1}\int_{0}^{1}\left( \frac{1}{3}x+\frac{2}{3}y+z\right) dydz \\
&=&\int_{0}^{1}\left[ \frac{1}{3}xy+\frac{1}{3}y^{2}+zy\right] _{0}^{1}dz \\
&=&\int_{0}^{1}\left( \frac{1}{3}x+\frac{1}{3}+z\right) dz \\
&=&\left[ \frac{1}{3}xz+\frac{1}{3}z+\frac{1}{2}z^{2}\right] _{0}^{1} \\
&=&\frac{1}{3}x+\frac{1}{3}+\frac{1}{2} \\
&=&\frac{1}{3}x+\frac{5}{6}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。結果をまとめると、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、例えば、「確率変数\(X\)の値が\(\frac{1}{2}\)以下である確率」は、\begin{eqnarray*}P\left( X\leq \frac{1}{2}\right) &=&\int_{-\infty }^{\frac{1}{2}}f_{X}\left( x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}\left( \frac{1}{3}x+\frac{5}{6}\right) dx \\
&=&\left[ \frac{1}{6}x^{2}+\frac{5}{6}x\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{6}\left( \frac{1}{2}\right) ^{2}+\frac{5}{6}\left( \frac{1}{2}\right) \\
&=&\frac{11}{24}
\end{eqnarray*}です。他の確率変数\(Y,Z\)についても同様に考えます。

先の命題より、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば、そこから個々の確率変数\(X_{1},\cdots ,X_{n}\)の確率密度関数\(f_{X_{1}},\cdots ,f_{X_{n}}\)をそれぞれ導けることが明らかになりました。確率密度関数\(f_{X_{1}},\cdots,f_{X_{n}}\)が同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から導かれたものである場合には、\(f_{X_{1}},\cdots ,f_{X_{n}}\)のことを確率変数\(X_{1},\cdots ,X_{n}\)に関する周辺確率密度関数(marginal probability density function)と呼びます。また、同時確率密度関数\(f_{X_{1}\cdots X_{n}}\)から周辺確率密度関数\(f_{X_{1}},\cdots ,f_{X_{n}}\)を導くプロセスを周辺化(marginalizing)と呼びます。

 

周辺確率密度関数の非負性

周辺確率密度関数は非負の実数を値としてとります。

命題(周辺確率密度関数の非負性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、任意の\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{X_{1}}\left( x_{1}\right) \geq 0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

例(周辺確率密度関数の非負性)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left[ 0,1\right] ^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。他の確率変数\(Y,Z\)についても同様に考えます。

 

周辺確率密度関数の積分

周辺確率密度関数を全区間上で積分すると\(1\)になります。

命題(周辺確率密度関数の積分)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率密度関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の確率密度関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、\begin{equation*}\int_{-\infty }^{+\infty }f_{X_{1}}\left( x_{1}\right) dx_{1}=1
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

例(周辺確率密度関数の積分)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left[ 0,1\right] ^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{3}x+\frac{2}{3}y+z & \left( if\ \left( x,y,z\right) \in \left(
X,Y,Z\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に明らかにしたように、確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{3}x+\frac{5}{6} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。このとき、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{0}^{1}\left(
\frac{1}{3}x+\frac{5}{6}\right) dx \\
&=&\left[ \frac{1}{6}x^{2}+\frac{5}{6}x\right] _{0}^{1} \\
&=&\frac{1}{6}+\frac{5}{6} \\
&=&1
\end{eqnarray*}が成立しています。他の確率変数\(Y,Z\)についても同様に考えます。

 

演習問題

問題(周辺確率密度関数)
連続型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\mathbb{R} _{++}^{3}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cc}
e^{-x-y-z} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( if\ \left( x,y,z\right) \not\in \left( X,Y,Z\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。個々の確率変数\(X,Y,Z:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\(f_{X},f_{Y},f_{Z}:\mathbb{R} \rightarrow \mathbb{R} \)をそれぞれ求めてください。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

離散型の同時確率変数

それぞれの標本点に対して2次元ベクトルを1つずつ割り当てる写像を同時確率変数と呼びます。離散型の2個の確率変数から定義される同時確率変数を離散型の同時確率変数と呼びます。

離散型の確率ベクトル(多変量確率変数)

それぞれの標本点に対してベクトルを1つずつ割り当てる写像を確率ベクトルと呼びます。特に、有限個の離散型確率変数から定義される確率ベクトルを離散型の確率ベクトルと呼びます。

離散型確率ベクトルの同時確率質量関数

離散型の確率ベクトルが与えられたとき、それぞれのベクトルに対して、確率ベクトルがそのベクトルを値としてとる確率を特定する巻数を同時確率質量関数と呼びます。

確率ベクトルの定義

標本点に対してn次元ベクトルを1つずつ割り当てる写像を確率ベクトルと呼びます。確率論の公理と整合的な形で確率ベクトルの概念を定義します。

有限個の確率変数の独立性

有限個の確率変数が生成するσ代数どうしが独立である場合、それらの確率変数は独立であると言います。有限個の独立変数が独立であることを様々な形で表現するとともに、独立性を判定する方法について解説します。

連続型の確率ベクトル(多変量確率変数)

それぞれの標本点に対してベクトルを1つずつ割り当てる写像を確率ベクトルと呼びます。特に、有限個の離散型確率変数から定義される確率ベクトルを離散型の確率ベクトルと呼びます。

連続型確率ベクトルの同時確率密度関数

連続型の確率ベクトルの同時確率分布を表現する際に同時確率質量関数を利用できません。連続型の確率ベクトルの同時確率分布を描写する際には同時確率密度関数を利用します。

連続型確率ベクトルの同時分布関数

連続型の確率ベクトルの同時分布関数とは、確率ベクトルがあるベクトル以下の値をとる確率を与えることを通じて同時確率分布を記述する関数です。

有限個の連続型確率変数の独立性

有限個(3個以上)の連続型確率変数が独立であることの意味を定義するとともに、有限個の連続型確率変数が独立であることを判定する方法について解説します。