教材一覧
教材一覧
教材検索

離散型の確率分布

離散型多変量変数の多変量分布関数(多変量累積分布関数)

目次

Twitterで共有
メールで共有

離散型多変量確率変数の多変量確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとします。同時確率変数\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega
\right) \in A_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) \in
A_{n}\right\} \right)
\end{equation*}と定義しました。より特殊なケースとして、同時確率変数\(\left(X_{1},\cdots ,X_{n}\right) \)の値が点\(\left(x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)と一致する確率を、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) =P\left( \left\{
\omega \in \Omega \ |\ X_{1}\left( \omega \right) =x_{1}\wedge \cdots \wedge
X_{n}\left( \omega \right) =x_{n}\right\} \right)
\end{equation*}と定義しました。以上を踏まえた上で、それぞれの点\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =P\left(
X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right)
\end{equation*}を定める多変量確率関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)を定義し、さらに、集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)を任意に選んだとき、\begin{equation}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) \quad \cdots (1)
\end{equation}という関係が成り立つことを示しました。

一般に、それぞれの集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に対して確率\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)が明らかになっている場合、そのような情報の集まりを多変量確率変数\(\left( X_{1},\cdots ,X_{n}\right) \)の多変量確率分布と呼びます。離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) \)に対して多変量確率関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば、任意の集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に対して\(\left( 1\right) \)の関係を用いることにより\(P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots\times A_{n}\right) \)を特定できるため、多変量確率関数は離散型の多変量確率変数の多変量確率分布を表現する手段の1つであると言えます。ただ、離散型の多変量確率変数の多変量確率分布は、多変量確率関数とは異なる概念を用いて表現することもできます。順番に解説します。

 

離散型多変量確率変数の多変量分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとします。多変量確率変数\(\left( X_{1},\cdots ,X_{n}\right) \)が特定の点\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)以下の値をとる確率、すなわち任意の\(i\ \left(=1,\cdots ,n\right) \)について\(X_{i}\)の値が\(x_{i}\)以下である確率を、\begin{equation*}P\left( X_{1}\leq x_{1}\wedge \cdots \wedge X_{n}\leq x_{n}\right)
\end{equation*}で表記するものとします。つまり、ここでの「以下」とはユークリッド空間\(\mathbb{R} ^{n}\)における標準的順序を踏まえた表現です。

多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\(\left( X_{1}\left( \omega \right) ,\cdots,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}\)を1つずつ定めるため、「多変量確率変数\(\left( X_{1},\cdots ,X_{n}\right) \)の値が\(\left(x_{1},\cdots ,x_{n}\right) \)以下である」という事象は、任意の\(i\)について\(X_{i}\leq x_{i}\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \leq x_{1}\wedge
\cdots \wedge X_{n}\left( \omega \right) \leq x_{n}\right\}
\end{equation*}として表現されます。したがって、「多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) \)の値が\(\left( x_{1},\cdots ,x_{n}\right) \)以下である」という事象が起こる確率は、\begin{equation*}P\left( X_{1}\leq x_{1}\wedge \cdots \wedge X_{n}\leq x_{n}\right) =P\left(
\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \leq x_{1}\wedge
\cdots \wedge X_{n}\left( \omega \right) \leq x_{n}\right\} \right)
\end{equation*}となります。以上を踏まえた上で、それぞれの点\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) \)が\(\left( x_{1},\cdots ,x_{n}\right) \)以下の値をとる確率\begin{equation*}F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =P\left( X_{1}\leq
x_{1}\wedge \cdots \wedge X_{n}\leq x_{n}\right)
\end{equation*}を定める多変数関数\begin{equation*}
F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}を定義し、これを\(\left(X_{1},\cdots ,X_{n}\right) \)の多変量分布関数(multivariate distribution function)や多変量累積分布関数(multivariate cumulative distribution function)などと呼びます。

離散型の多変量確率変数\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられている場合には、点\(\left( x_{1},\cdots ,x_{n}\right)\in \mathbb{R} ^{n}\)を任意に選んだとき、\begin{equation*}F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\sum_{y_{1}\leq
x_{1}}\cdots \sum_{y_{n}\leq x_{n}}f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots
,y_{n}\right)
\end{equation*}という関係が成り立つことが保証されます。任意の\(i\)について\(y_{i}\leq x_{i}\)を満たす点\(\left( y_{1},\cdots,y_{n}\right) \)に対して\(f\)が定める値を特定し、それらの総和をとれば\(F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) \)が得られるということです。言い換えると、離散型の多変量確率変数\(\left( X_{1},\cdots ,X_{n}\right) \)に関しては、多変量分布関数\(F_{X_{1}\cdots X_{n}}\)は多変量確率関数\(f_{X_{1}\cdots X_{n}}\)から導出できるということです。

命題(離散型の多変量分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)と多変量確率関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\sum_{y_{1}\leq
x_{1}}\cdots \sum_{y_{n}\leq x_{n}}f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots
,y_{n}\right)
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

繰り返しになりますが、上の命題は、多変量分布関数\(F_{X_{1}\cdots X_{n}}\)が多変量確率関数\(f_{X_{1}\cdots X_{n}}\)から導出可能であることを主張します。つまり、多変量分布関数\(F_{X_{1}\cdots X_{n}}\)が点\(\left( x_{1},\cdots ,x_{n}\right) \)に対して定める値は、多変量確率関数\(f_{X_{1}\cdots X_{n}}\)が点\(\left( x_{1},\cdots ,x_{n}\right) \)以下のそれぞれの点に対して定める値の総和と一致します。

例(多変量分布関数)
「コインを\(n\)回投げる」という試行を行います。\(i\ \left( =1,\cdots ,n\right) \)回目に出た面を\(\omega _{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( \omega _{i}\right) _{i=1}^{n}\ |\ \forall i\in
\left\{ 1,\cdots ,n\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}となります。各回において表が出た場合にはポイント\(1\)を得て、裏が出た場合にはポイント\(1\)を失うものとします。各回に得るポイントの関係性を分析したい場合には、各回に得るポイントを特定する\(n\)個の確率変数の多変量確率変数を利用することになります。具体的には、「\(i\)回目に得るポイント」を特定する確率変数\(X_{i}:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega =\left( \omega_{i}\right) _{i=1}^{n}\in \Omega \)に対して、\begin{equation*}X_{i}\left( \omega \right) =\left\{
\begin{array}{cc}
1 & \left( if\ \omega _{i}=\text{表}\right) \\
-1 & \left( if\ \omega _{i}=\text{裏}\right)
\end{array}\right.
\end{equation*}を定めるため、多変量確率変数\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)はそれぞれの\(\omega =\left( \omega_{i}\right) _{i=1}^{n}\in \Omega \)に対して、\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right)
\end{equation*}を定めます。\(\left( X_{1},\cdots,X_{n}\right) \)の値域は、\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \Omega \right) =\left\{ \left(
x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\ |\ \forall i\in \left\{ 1,\cdots ,n\right\} :x_{i}\in \left\{
1,-1\right\} \right\}
\end{equation*}です。標本空間には\(2^{n}\)個の標本点が属しますが、仮に、これらがいずれも同じ程度の確かさで起こり得るのであれば、多変量確率関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。上の命題より、多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\sum_{y_{1}\leq
x_{1}}\cdots \sum_{y_{n}\leq x_{n}}f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots
,y_{n}\right)
\end{equation*}を定めます。したがって、例えば、\begin{eqnarray*}
F_{X_{1}\cdots X_{n}}\left( 1,\cdots ,1,-1\right) &=&\sum_{y_{1}\leq
1}\cdots \sum_{y_{n-1}\leq 1}\sum_{y_{n}\leq -1}f_{X_{1}\cdots X_{n}}\left(
y_{1},\cdots ,y_{n-1},y_{n}\right) \\
&=&\sum_{y_{1}\in \left\{ 1,-1\right\} }\cdots \sum_{y_{n-1}\in \left\{
1,-1\right\} }f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots ,y_{n-1},-1\right) \\
&=&2^{n-1}\cdot \frac{1}{2^{n}} \\
&=&\frac{1}{2}
\end{eqnarray*}であり、\begin{eqnarray*}
F_{X_{1}\cdots X_{n}}\left( 0,\cdots ,0\right) &=&\sum_{y_{1}\leq 0}\cdots
\sum_{y_{n}\leq 0}f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots ,y_{n}\right) \\
&=&f_{X_{1}\cdots X_{n}}\left( -1,-1\right) \\
&=&\frac{1}{2^{n}}
\end{eqnarray*}であり、\begin{eqnarray*}
F_{X_{1}\cdots X_{n}}\left( 1,\cdots ,1\right) &=&\sum_{y_{1}\leq 1}\cdots
\sum_{y_{n}\leq 1}f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots ,y_{n}\right) \\
&=&\sum_{y_{1}\in \left\{ 1,-1\right\} }\cdots \sum_{y_{n}\in \left\{
1,-1\right\} }f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots ,y_{n}\right) \\
&=&2^{n}\cdot \frac{1}{2^{n}} \\
&=&1
\end{eqnarray*}となります。また、少なくとも1つの\(x_{i}\)について\(x_{i}<-1\)を満たす任意の\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =0
\end{equation*}となります。

 

多変量分布関数がとり得る値の範囲

多変量分布関数は\(0\)以上\(1\)以下の実数を値としてとります。

命題(多変量分布関数がとり得る値の範囲)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとする。多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が存在するならば、これはそれぞれの\(\left(x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}0\leq F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) \leq 1
\end{equation*}を満たす。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

多変量分布関数は単調増加

離散型の多変量変数\(\left( X_{1},\cdots ,X_{n}\right) \)の多変量分布関数\(F_{X_{1}\cdots X_{n}}\)は\(\mathbb{R} ^{n}\)上に定義された\(n\)変数関数ですが、これを特定の変数\(x_{i}\)に関する1変数関数とみなした場合、\(\mathbb{R} \)上で単調増加(単調非減少)になります。

命題(多変量分布関数は単調増加)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとする。多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が存在するならば、変数\(x_{i}\)を任意に選んだとき、任意の\(x_{i}^{\prime},x_{i}^{\prime \prime }\in \mathbb{R} \)について、\begin{equation*}x_{i}^{\prime }\leq x_{i}^{\prime \prime }\Rightarrow F_{X_{1}\cdots
X_{n}}\left( x_{i}^{\prime },x_{-i}\right) \leq F_{X_{1}\cdots X_{n}}\left(
x_{i}^{\prime \prime },x_{-i}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題を踏まえると以下を得ます。

命題(多変量分布関数は単調増加)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとする。多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が存在するならば、任意の\(\left( x_{1}^{\prime },\cdots ,x_{n}^{\prime}\right) ,\left( x_{1}^{\prime \prime },\cdots ,x_{n}^{\prime \prime
}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}\forall i\in \left\{ 1,\cdots ,n\right\} :x_{i}^{\prime }\leq x_{i}^{\prime
\prime }\Rightarrow F_{X_{1}\cdots X_{n}}\left( x_{1}^{\prime },\cdots
,x_{n}^{\prime }\right) \leq F_{X_{1}\cdots X_{n}}\left( x_{1}^{\prime
\prime },\cdots ,x_{n}^{\prime \prime }\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

多変量分布関数の右側連続性

離散型の多変量変数\(\left( X_{1},\cdots ,X_{n}\right) \)の多変量分布関数\(F_{X_{1}\cdots X_{n}}\)は\(\mathbb{R} ^{n}\)上に定義された\(n\)変数関数ですが、これを特定の変数\(x_{i}\)に関する1変数関数とみなした場合、\(\mathbb{R} \)上で右側連続になります。

命題(多変量分布関数は右側連続)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとする。多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が存在するならば、変数\(x_{i}\)および点\(a\in \mathbb{R} \)をそれぞれ任意に選んだとき、\begin{equation*}\lim_{x\rightarrow a+}F_{X_{1}\cdots X_{n}}\left( x_{i},x_{-i}\right)
=F_{X_{1}\cdots X_{n}}\left( a,x_{-i}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題を踏まえると以下を得ます。

命題(多変量分布関数は右側連続)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとする。多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が存在するならば、点\(\left( a_{1},\cdots ,a_{n}\right) \in \mathbb{R} ^{n}\)を任意に選んだとき、\begin{equation*}\lim_{\left( x_{1},\cdots ,x_{n}\right) \rightarrow \left( a_{1}+,\cdots
,a_{n}+\right) }F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
=F_{X_{1}\cdots X_{n}}\left( a_{1},\cdots ,a_{n}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

多変量分布関数の無限大における極限

多変量分布関数の無限大における極限に関して以下が成り立ちます。

命題(多変量分布関数の無限大における極限)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の多変量確率変数\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとする。多変量分布関数\(F_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が存在するならば、\begin{equation*}\lim_{\left( x_{1},\cdots ,x_{n}\right) \rightarrow \left( +\infty ,\cdots
,+\infty \right) }F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =1
\end{equation*}が成り立つ。また、変数\(x_{i}\)を任意に選んだとき、\begin{equation*}\lim_{x_{i}\rightarrow -\infty }F_{X_{1}\cdots X_{n}}\left(
x_{i},x_{-i}\right) =0
\end{equation*}が成り立つ。ゆえに、\begin{equation*}
\lim_{\left( x_{1},\cdots ,x_{n}\right) \rightarrow \left( -\infty ,\cdots
,-\infty \right) }F_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録