WIIS

離散型の確率分布

離散型確率ベクトルの周辺化(周辺分布関数)

目次

関連知識

Mailで保存
Xで共有

同時分布関数から導かれる周辺分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられており、その同時確率分布が同時確率質量関数\begin{equation*}
f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)と一致する確率は、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) =f_{X_{1}\cdots
X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}であり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率は、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}であるということです。この場合、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の周辺確率質量関数\begin{equation*}f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}が存在するとともに、これはそれぞれの\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{X_{1}}\left( x_{1}\right) =\left\{
\begin{array}{cc}
\sum\limits_{\left( y_{1},\cdots ,y_{n}\right) \in \left( X_{1},\cdots
,X_{n}\right) \left( \Omega \right) \ s.t.\ y_{1}=x_{1}}f_{X_{1}\cdots
X_{n}}\left( y_{1},\cdots ,y_{n}\right) & \left( if\ x_{1}\in X_{1}\left(
\Omega \right) \right) \\
0 & \left( if\ x_{1}\not\in X_{1}\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めることが明らかになりました。加えて、確率変数\(X_{1}\)の値が集合\(A_{1}\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X_{1}\in A_{1}\right) =\sum_{x_{1}\in A_{1}}f_{X_{1}}\left(
x_{1}\right)
\end{equation*}として定まることが明らかになりました。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

それぞれの集合\(A_{1}\subset \mathbb{R} \)に対して確率\(P\left( X_{1}\in A_{1}\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X_{1}\)の周辺確率分布と呼びます。離散型の確率変数\(X_{1}\)に対して周辺確率質量関数\(f_{X_{1}}\)が与えられれば、上の関係を用いて任意の集合\(A_{1}\)に関する確率\(P\left( X_{1}\in A_{1}\right) \)を特定できるため、周辺確率質量関数は離散型の確率変数の周辺分布を表現する手段の1つです。ただ、離散型の確率変数の周辺確率分布は、周辺確率質量関数とは異なる概念を用いて表現することもできます。順番に解説します。

 

離散型確率変数の周辺分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられている場合、その中の1つの確率変数\begin{equation*}
X_{1}:\Omega \rightarrow \mathbb{R} \end{equation*}が特定の実数\(x_{1}\in \mathbb{R} \)以下の値をとる確率\begin{equation*}P\left( X_{1}\leq x_{1}\right)
\end{equation*}をどのように評価すればよいでしょうか。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率変数\(X_{1}\)の値が\(x_{1}\)以下である」という事象は、\(X_{1}\left( \omega \right)\leq x_{1}\)を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \leq x_{1}\right\}
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \leq
x_{1}\wedge X_{2}\left( \omega \right) \in X_{2}\left( \Omega \right) \wedge
\cdots \wedge X_{n}\left( \omega \right) \in X_{n}\left( \Omega \right)
\right\} \\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \leq
x_{1}\wedge \left( X_{2},\cdots ,X_{n}\right) \left( \omega \right) \in
X_{2}\left( \Omega \right) \times \cdots \times X_{n}\left( \Omega \right)
\right\}
\end{eqnarray*}として表現されます。したがって、「確率変数\(X_{1}\)の値が\(x_{1}\)以下である」という事象が起こる確率は、\begin{equation*}P\left( X_{1}\leq x_{1}\right) =P\left( \left\{ \omega \in \Omega \ |\
X_{1}\left( \omega \right) \leq x_{1}\right\} \right)
\end{equation*}となります。以上を踏まえた上で、それぞれの実数\(x_{1}\in \mathbb{R} \)に対して、確率変数\(X_{1}\)が\(x_{1}\)以下の値をとる確率\begin{equation*}F_{X_{1}}\left( x_{1}\right) =P\left( X_{1}\leq x_{1}\right)
\end{equation*}を特定する関数\begin{equation*}
F_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義し、これを\(X_{1}\)の周辺分布関数(marginal distribution function)や周辺累積分布関数(cumulative marginal distribution function)などと呼びます。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

離散型の確率変数\(X_{1}\)の周辺確率質量関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられている場合には、点\(x_{1}\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}F_{X_{1}}\left( x_{1}\right) =\sum_{y_{i}\leq x_{i}}f_{X_{1}}\left(
y_{i}\right)
\end{equation*}という関係が成り立つことが保証されます。つまり、\(x_{i}\)以下のそれぞれの値\(y_{i}\)に対して\(f_{X_{1}}\)が定める値を特定し、それらの総和をとれば\(F_{X_{1}}\left(x_{1}\right) \)が得られるということです。言い換えると、離散型の確率変数\(X_{1}\)に関しては、周辺分布関数\(F_{X_{1}}\)が周辺確率質量関数\(f_{X_{1}}\)から導出可能であるということです。

命題(離散型確率変数の周辺分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)およびその同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の周辺確率質量関数\(f_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、周辺分布関数\(F_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}F_{X_{1}}\left( x_{1}\right) =\sum_{y_{i}\leq x_{i}}f_{X_{1}}\left(
y_{i}\right)
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題は、周辺分布関数\(F_{X_{1}}\)が同時確率質量関数\(f_{X_{1}}\)から導出可能であることを示唆します。つまり、周辺分布関数\(F_{X_{1}}\)が点\(x_{1}\)に対して定める値は、周辺確率質量関数\(f_{X_{1}}\)が\(x_{1}\)以下のそれぞれの点に対して定める値の総和と一致します。他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

例(離散型確率変数の周辺分布関数)
「コインを3回投げる」という試行を行います。\(i\ \left( =1,2,3\right) \)回目に出た面を\(\omega _{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( \omega _{1},\omega _{2},\omega _{3}\right) \ |\
\forall i\in \left\{ 1,2,3\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}です。各回において表が出た場合にはポイント\(1\)を得て、裏が出た場合にはポイント\(1\)を失うものとします。各回に得るポイントの関係性を分析したい場合には、各回に得るポイントを特定する3個の確率変数の多変量確率変数を利用することになります。具体的には、「1回目に得るポイント」を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)と「2回目に得るポイント」を特定する確率変数\(Y:\Omega \rightarrow \mathbb{R} \)と「3回目に得るポイント」を特定する確率変数\(Z:\Omega \rightarrow \mathbb{R} \)が与えられたとき、確率ベクトル\(\left( X,Y,Z\right) :\Omega\rightarrow \mathbb{R}^{3} \)がそれぞれの標本点\(\left( \omega _{1},\omega _{2},\omega _{3}\right) \in \Omega \)に対して定める値は、\begin{eqnarray*}\left( X,Y,Z\right) \left( \omega _{1},\omega _{2},\omega _{3}\right)
&=&\left( X\left( \omega _{1},\omega _{2},\omega _{3}\right) ,Y\left( \omega
_{1},\omega _{2},\omega _{3}\right) ,Z\left( \omega _{1},\omega _{2},\omega
_{3}\right) \right) \\
&=&\left\{
\begin{array}{cc}
\left( 1,1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{表},\text{表}\right)
\right) \\
\left( 1,1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{表},\text{裏}\right)
\right) \\
\left( 1,-1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{裏},\text{表}\right)
\right) \\
\left( -1,1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{表},\text{表}\right)
\right) \\
\left( 1,-1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{裏},\text{裏}\right)
\right) \\
\left( -1,1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{表},\text{裏}\right)
\right) \\
\left( -1,-1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{裏},\text{表}\right)
\right) \\
\left( -1,-1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{裏},\text{裏}\right)
\right)
\end{array}\right.
\end{eqnarray*}となります。\(\left( X,Y,Z\right) \)の値域は、\begin{eqnarray*}\left( X,Y,Z\right) \left( \Omega \right) &=&\left\{ \left( x,y,z\right)
\in \mathbb{R} ^{3}\ |\ x,y,z\in \left\{ 1,-1\right\} \right\} \\
&=&\left\{ 1,-1\right\} ^{3}
\end{eqnarray*}です。標本空間\(\Omega \)には\(2^{3}=8\)個の標本点が属しますが、仮に、これらがいずれも同じ程度の確かさで起こり得るのであれば、同時確率質量関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{8} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1,-1\right\}
\end{equation*}であり、\(X\)の周辺確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{2} & \left( if\ x=-1\right) \\
\frac{1}{2} & \left( if\ x=1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}です。すると、先の命題より、\(X\)の分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<-1\right) \\
\frac{1}{2} & \left( if\ -1\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}です。他の確率変数\(Y,Z\)についても同様に考えます。

 

同時分布関数と周辺分布関数の関係

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられており、その同時確率分布が同時分布関数\begin{equation*}
F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)以下である確率が、\begin{equation*}P\left( X_{1}\leq x_{1}\wedge \cdots \wedge X_{n}\leq x_{n}\right)
=F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}であるということです。

同時分布関数\(F_{X_{1}\cdots X_{n}}\)から確率変数\(X_{1}\)の周辺分布関数\(F_{X_{1}}\)を以下の要領で導くこともできます。

命題(同時分布関数と周辺分布関数の関係)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)およびその同時分布\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率変数\(X_{1}:\Omega \rightarrow \mathbb{R} \)の周辺分布関数\(F_{X_{1}}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するとともに、それぞれの\(x_{1}\in \mathbb{R} \)に対して、\begin{equation*}F_{X_{1}}\left( x_{1}\right) =\lim_{\left( x_{2},\cdots ,x_{n}\right)
\rightarrow \left( +\infty ,\cdots ,+\infty \right) }F_{X_{1}\cdots
X_{n}}\left( x_{1},x_{2},\cdots ,x_{n}\right)
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

他の確率変数\(X_{2},\cdots ,X_{n}\)についても同様です。

例(同時分布関数と周辺分布関数の関係)
離散型の確率ベクトル\(\left( X,Y,Z\right) :\Omega \rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{3}
\end{equation*}であるとともに、同時分布関数\(F_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}F_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<-1\vee y<-1\vee z<-1\right) \\
\frac{1}{8} & \left( if\ -1\leq x<1\wedge -1\leq y<1\wedge -1\leq z<1\right)
\\
\frac{1}{4} & \left( if\ x\geq 1\wedge -1\leq y<1\wedge -1\leq z<1\right)
\\
\frac{1}{4} & \left( if\ -1\leq x<1\wedge y\geq 1\wedge -1\leq z<1\right)
\\
\frac{1}{4} & \left( if\ -1\leq x<1\wedge -1\leq y<1\wedge z\geq 1\right)
\\
\frac{1}{2} & \left( if\ x\geq 1\wedge y\geq 1\wedge -1\leq z<1\right) \\
\frac{1}{2} & \left( if\ -1\leq x<1\wedge y\geq 1\wedge z\geq 1\right) \\
\frac{1}{2} & \left( if\ x\geq 1\wedge -1\leq y<1\wedge z\geq 1\right) \\
1 & \left( if\ x\geq 1\wedge y\geq 1\wedge z\geq 1\right)
\end{array}\right.
\end{equation*}を定めるものとします。先の命題より、確率変数\(X\)の周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\(x<-1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\lim_{\left( y,z\right) \rightarrow \left( +\infty
,+\infty \right) }F_{XYZ}\left( x,y,z\right) \\
&=&\lim_{\left( y,z\right) \rightarrow \left( +\infty ,+\infty \right)
}0\quad \because F_{XYZ}\text{の定義} \\
&=&0
\end{eqnarray*}であり、\(-1\leq x<1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\lim_{\left( y,z\right) \rightarrow \left( +\infty
,+\infty \right) }F_{XYZ}\left( x,y,z\right) \\
&=&\lim_{\left( y,z\right) \rightarrow \left( +\infty ,+\infty \right) }\frac{1}{2}\quad \because F_{XYZ}\text{の定義} \\
&=&\frac{1}{2}
\end{eqnarray*}であり、\(x\geq 1\)の場合には、\begin{eqnarray*}F_{X}\left( x\right) &=&\lim_{\left( y,z\right) \rightarrow \left( +\infty
,+\infty \right) }F_{XYZ}\left( x,y,z\right) \\
&=&\lim_{\left( y,z\right) \rightarrow \left( +\infty ,+\infty \right)
}1\quad \because F_{XYZ}\text{の定義} \\
&=&1
\end{eqnarray*}となります。結論をまとめると、\begin{equation*}
F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<-1\right) \\
\frac{1}{2} & \left( if\ -1\leq x<1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}となります。他の確率変数\(Y,Z\)についても同様に考えます。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録