WIIS

離散型の確率分布

離散型確率ベクトルの周辺化(同時周辺確率質量関数)

目次

関連知識

Mailで保存
Xで共有

同時確率分布から導かれる同時周辺確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられている場合、その中の\(m\ \left( <n\right) \)個の確率変数からなる確率ベクトル\begin{equation*}\left( X_{1},\cdots X_{m}\right) :\Omega \rightarrow \mathbb{R} ^{m}
\end{equation*}の値がある集合\(A_{1}\times \cdots\times A_{m}\subset \mathbb{R} ^{m}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots X_{m}\right) \in A_{1}\times \cdots \times
A_{m}\right)
\end{equation*}または、\begin{equation*}
P\left( X_{1}\in A_{1}\wedge \cdots \wedge X_{m}\in A_{m}\right)
\end{equation*}で表記するものとします。これをどのように評価すればよいでしょうか。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率ベクトル\(\left(X_{1},\cdots ,X_{m}\right) \)の値が集合\(A_{1}\times \cdots \times A_{m}\)に属する」という事象は、以下の条件\begin{equation*}\left( X_{1},\cdots ,X_{m}\right) \left( \omega \right) \in A_{1}\times
\cdots \times A_{m}
\end{equation*}を満たす標本点\(\omega \)からなる集合\begin{eqnarray*}&&\left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{m}\right) \left(
\omega \right) \in A_{1}\times \cdots \times A_{m}\right\} \\
&=&\left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in A_{1}\wedge
\cdots \wedge X_{m}\left( \omega \right) \in A_{m}\wedge X_{m+1}\left(
\omega \right) \in X_{m+1}\left( \Omega \right) \wedge \cdots \wedge
X_{n}\left( \omega \right) \in X_{n}\left( \Omega \right) \right\} \\
&=&\left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{m}\right) \left(
\omega \right) \in A_{1}\times \cdots \times A_{m}\wedge \left(
X_{m+1},\cdots ,X_{n}\right) \left( \omega \right) \in \left( X_{m+1},\cdots
,X_{n}\right) \left( \Omega \right) \right\}
\end{eqnarray*}として表現されます。したがって、「確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の値が集合\(A_{1}\times \cdots \times A_{m}\)に属する」という事象が起こる確率は、\begin{eqnarray*}&&P\left( \left( X_{1},\cdots X_{m}\right) \in A_{1}\times \cdots \times
A_{m}\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{m}\right)
\left( \omega \right) \in A_{1}\times \cdots \times A_{m}\wedge \left(
X_{m+1},\cdots ,X_{n}\right) \left( \omega \right) \in \left( X_{m+1},\cdots
,X_{n}\right) \left( \Omega \right) \right\} \right)
\end{eqnarray*}となります。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)が与えられている状況において、確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の値がそれぞれの集合\(A_{1}\times \cdots \times A_{m}\subset \mathbb{R} ^{m}\)に属する確率\begin{equation*}P\left( \left( X_{1},\cdots X_{m}\right) \in A_{1}\times \cdots \times
A_{m}\right)
\end{equation*}が明らかになっている場合、そのような情報の集まりを確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の同時周辺確率分布(joint marginal probability distribution)と呼びます。\(\left( X_{1},\cdots X_{m}\right) \)とは異なる確率ベクトルについても同様に考えます。

 

離散型確率ベクトルの同時周辺確率質量関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}
\end{equation*}が与えられており、その同時確率分布が同時確率質量関数\begin{equation*}
f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)と一致する確率は、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) =f_{X_{1}\cdots
X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}であり、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率は、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}であるということです。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率分布に関する以上の情報から、確率ベクトル\(\left( X_{1},\cdots X_{m}\right) \)の同時周辺確率分布を特定するためにはどうすればよいでしょうか。\(\left(X_{1},\cdots X_{m}\right) \)は離散型の確率ベクトルであるため、その同時確率分布を描写するためには同時確率質量関数\(f_{X_{1}\cdots X_{m}}:\mathbb{R} ^{m}\rightarrow \mathbb{R} \)を特定すれば十分です。同時確率質量関数の定義より、\(f_{X_{1}\cdots X_{m}}\)がそれぞれの\(\left( x_{1},\cdots,x_{m}\right) \in \mathbb{R} ^{m}\)に対して定める値は、確率ベクトル\(\left( X_{1},\cdots X_{m}\right) \)の値が\(\left( x_{1},\cdots ,x_{m}\right) \)と一致する確率\begin{equation*}f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) =P\left(
X_{1}=x_{1}\wedge \cdots \wedge X_{m}=x_{m}\right)
\end{equation*}ですが、この値は確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)から以下のようにして導くことができます。

命題(周辺確率質量関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率ベクトル\(\left( X_{1},\cdots,X_{m}\right) :\Omega \rightarrow \mathbb{R} ^{m}\ \left( m<n\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{m}}:\mathbb{R} ^{m}\rightarrow \mathbb{R} \)が存在するとともに、これはそれぞれの\(\left( x_{1},\cdots ,x_{m}\right) \in \mathbb{R} ^{m}\)に対して、\begin{eqnarray*}&&f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) \\
&=&\left\{
\begin{array}{cc}
\sum\limits_{\left( y_{1},\cdots ,y_{n}\right) \in \left( X_{1},\cdots
,X_{n}\right) \left( \Omega \right) \ s.t.\ \left( y_{1},\cdots
,y_{m}\right) =\left( x_{1},\cdots ,x_{m}\right) }f_{X_{1}\cdots
X_{n}}\left( y_{1},\cdots ,y_{n}\right) & \left( if\ \left( x_{1},\cdots
,x_{m}\right) \in \left( X_{1}\times \cdots X_{m}\right) \left( \Omega
\right) \right) \\
0 & \left( if\ \left( x_{1},\cdots ,x_{m}\right) \not\in \left( X_{1}\times
\cdots X_{m}\right) \left( \Omega \right) \right)
\end{array}\right.
\end{eqnarray*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の値が\(\left(x_{1},\cdots ,x_{m}\right) \)と一致する確率\(f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) \)を求めるためには、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)がとり得る値の組\(\left(y_{1},\cdots ,y_{n}\right) \)の中でも\(\left(y_{1},\cdots ,y_{m}\right) \)が\(\left( x_{1},\cdots ,x_{m}\right) \)と一致するものに対して確率\(f_{X_{1}\cdots X_{n}}\left( y_{1},\cdots,y_{n}\right) \)をそれぞれ特定し、得られた確率の総和をとればよいということです。\(\left( X_{1},\cdots,X_{m}\right) \)とは異なる確率ベクトルについても同様に考えます。

例(周辺確率質量関数)
「コインを3回投げる」という試行を行います。\(i\ \left( =1,2,3\right) \)回目に出た面を\(\omega _{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( \omega _{1},\omega _{2},\omega _{3}\right) \ |\
\forall i\in \left\{ 1,2,3\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}です。各回において表が出た場合にはポイント\(1\)を得て、裏が出た場合にはポイント\(1\)を失うものとします。各回に得るポイントの関係性を分析したい場合には、各回に得るポイントを特定する3個の確率変数の多変量確率変数を利用することになります。具体的には、「1回目に得るポイント」を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)と「2回目に得るポイント」を特定する確率変数\(Y:\Omega \rightarrow \mathbb{R} \)と「3回目に得るポイント」を特定する確率変数\(Z:\Omega \rightarrow \mathbb{R} \)が与えられたとき、確率ベクトル\(\left( X,Y,Z\right) :\Omega\rightarrow \mathbb{R} ^{3}\)がそれぞれの標本点\(\left( \omega _{1},\omega _{2},\omega _{3}\right) \in \Omega \)に対して定める値は、\begin{eqnarray*}\left( X,Y,Z\right) \left( \omega _{1},\omega _{2},\omega _{3}\right)
&=&\left( X\left( \omega _{1},\omega _{2},\omega _{3}\right) ,Y\left( \omega
_{1},\omega _{2},\omega _{3}\right) ,Z\left( \omega _{1},\omega _{2},\omega
_{3}\right) \right) \\
&=&\left\{
\begin{array}{cc}
\left( 1,1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{表},\text{表}\right)
\right) \\
\left( 1,1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{表},\text{裏}\right)
\right) \\
\left( 1,-1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{裏},\text{表}\right)
\right) \\
\left( -1,1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{表},\text{表}\right)
\right) \\
\left( 1,-1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{表},\text{裏},\text{裏}\right)
\right) \\
\left( -1,1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{表},\text{裏}\right)
\right) \\
\left( -1,-1,1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{裏},\text{表}\right)
\right) \\
\left( -1,-1,-1\right) & \left( if\ \left( \omega _{1},\omega _{2},\omega
_{3}\right) =\left( \text{裏},\text{裏},\text{裏}\right)
\right)
\end{array}\right.
\end{eqnarray*}となります。\(\left( X,Y,Z\right) \)の値域は、\begin{eqnarray*}\left( X,Y,Z\right) \left( \Omega \right) &=&\left\{ \left( x,y,z\right)
\in \mathbb{R} ^{3}\ |\ x,y,z\in \left\{ 1,-1\right\} \right\} \\
&=&\left\{ 1,-1\right\} ^{3}
\end{eqnarray*}です。標本空間\(\Omega \)には\(2^{3}=8\)個の標本点が属しますが、仮に、これらがいずれも同じ程度の確かさで起こり得るのであれば、同時確率質量関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{8} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。確率ベクトル\(\left( X,Y\right) \)の値域は、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{2}
\end{equation*}であり、\(\left( X,Y\right) \)の同時周辺確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( x,y\right) \in\left( X,Y\right) \left( \Omega \right) \)に対して定める値は、\begin{eqnarray*}f_{XY}\left( 1,1\right) &=&f_{XYZ}\left( 1,1,1\right) +f_{XYZ}\left(
1,1,-1\right) \\
&=&\frac{1}{8}+\frac{1}{8} \\
&=&\frac{1}{4}
\end{eqnarray*}であり、\begin{eqnarray*}
f_{XY}\left( 1,-1\right) &=&f_{XYZ}\left( 1,-1,1\right) +f_{XYZ}\left(
1,-1,-1\right) \\
&=&\frac{1}{8}+\frac{1}{8} \\
&=&\frac{1}{4}
\end{eqnarray*}であり、\begin{eqnarray*}
f_{XY}\left( -1,1\right) &=&f_{XYZ}\left( -1,1,1\right) +f_{XYZ}\left(
-1,1,-1\right) \\
&=&\frac{1}{8}+\frac{1}{8} \\
&=&\frac{1}{4}
\end{eqnarray*}であり、\begin{eqnarray*}
f_{XY}\left( -1,-1\right) &=&f_{XYZ}\left( -1,-1,1\right) +f_{XYZ}\left(
-1,-1,-1\right) \\
&=&\frac{1}{8}+\frac{1}{8} \\
&=&\frac{1}{4}
\end{eqnarray*}です。また、\(\left( x,y\right) \not\in\left( X,Y\right) \left( \Omega \right) \)を満たす\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して定める値は、\begin{equation*}f_{XY}\left( x,y\right) =0
\end{equation*}です。結果をまとめると、\begin{equation*}
f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{4} & \left( if\ x=1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=1\wedge y=-1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=-1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}となります。\(\left( X,Y\right) \)とは異なる確率ベクトル、すなわち\(\left( X,Z\right) \)や\(\left( Y,Z\right) \)についても同様に考えます。

先の命題より、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば、そこから確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \ \left(m<n\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{m}}\)を導けることが明らかになりました。同時確率質量関数\(f_{X_{1}\cdots X_{m}}\)が同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)から導かれたものである場合には、\(f_{X_{1}\cdots X_{m}}\)のことを確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)に関する同時周辺確率質量関数(joint marginal probability mass function)と呼びます。また、同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)から同時周辺確率質量関数\(f_{X_{1}\cdots X_{m}}\)を導くプロセスを周辺化(marginalizing)と呼びます。

 

同時周辺確率分布としての同時周辺確率質量関数

繰り返しになりますが、離散型確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)が与えられた場合、そこから確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の同時周辺確率質量関数\(f_{X_{1}\cdots X_{m}}\)を導くことができるとともに、確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)が値\(\left( x_{1},\cdots ,x_{m}\right) \in \mathbb{R} ^{m}\)をとる確率に関して、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{m}=x_{m}\right) =f_{X_{1}\cdots
X_{m}}\left( x_{1},\cdots ,x_{m}\right)
\end{equation*}という関係が成り立ちます。以上を踏まえると、確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の値が集合\(A_{1}\times \cdots \times A_{m}\subset \mathbb{R} ^{m}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{m}\right) \in A_{1}\times \cdots \times
A_{m}\right) =\sum_{\left( x_{1},\cdots ,x_{m}\right) \in A_{1}\times \cdots
\times A_{m}}f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right)
\end{equation*}という形で表すことができます。つまり、集合\(A_{1}\times \cdots \times A_{m}\)に属するそれぞれの点\(\left(x_{1},\cdots ,x_{m}\right) \)に対する確率\(f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) \)をとり、それらの総和をとれば\(P\left( \left( X_{1},\cdots ,X_{m}\right) \in A_{1}\times \cdots \times A_{m}\right) \)が得られるということです。ただし、\(A_{1}\times \cdots \times A_{m}\)が無限可算集合である場合、右辺のは無限級数の和です。\(\left( X_{1},\cdots,X_{m}\right) \)とは異なる確率ベクトルについても同様に考えます。

命題(周辺確率分布としての周辺確率質量関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率ベクトル\(\left( X_{1},\cdots,X_{m}\right) :\Omega \rightarrow \mathbb{R} ^{m}\ \left( m<n\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{m}}:\mathbb{R} ^{m}\rightarrow \mathbb{R} \)が存在するとともに、集合\(A_{1}\times \cdots \times A_{m}\subset \mathbb{R} ^{m}\)を任意に選んだとき、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{m}\right) \in A_{1}\times \cdots \times
A_{m}\right) =\sum_{\left( x_{1},\cdots ,x_{m}\right) \in A_{1}\times \cdots
\times A_{m}}f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

確率ベクトル\(\left( X_{1},\cdots,X_{m}\right) \)の同時周辺確率質量関数\(f_{X_{1}\cdots X_{m}}\)が与えられれば任意の集合\(A_{1}\times \cdots \times A_{m}\subset \mathbb{R} ^{m}\)に関する確率\(P\left( \left(X_{1},\cdots ,X_{m}\right) \in A_{1}\times \cdots \times A_{m}\right) \)を以上の要領で特定できるため、同時周辺確率質量関数\(f_{X_{1}\cdots X_{m}}\)は確率ベクトル\(\left(X_{1},\cdots ,X_{m}\right) \)の同時周辺確率分布を表現する手段であることが明らかになりました。\(\left(X_{1},\cdots ,X_{m}\right) \)とは異なる確率ベクトルについても同様に考えます。

例(同時周辺確率分布としての同時周辺確率質量関数)
確率ベクトル\(\left( X,Y,Z\right) :\Omega\rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{3}
\end{equation*}であるとともに、\(\left(X,Y,Z\right) \)の同時確率質量関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{8} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率ベクトル\(\left(X,Y\right) \)の値域は、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時周辺確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( x,y\right) \in\left( X,Y\right) \left( \Omega \right) \)に対して定める値は、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{4} & \left( if\ x=1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=1\wedge y=-1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=-1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}です。例えば、「\(X\)の値と\(Y\)の値の和が非負である」という事象の確率は、\begin{eqnarray*}f_{XY}\left( 1,1\right) +f_{XY}\left( 1,-1\right) +f_{XY}\left( -1,1\right)
&=&\frac{1}{4}+\frac{1}{4}+\frac{1}{4} \\
&=&\frac{3}{4}
\end{eqnarray*}です。\(\left( X,Y\right) \)とは異なる確率ベクトル、すなわち\(\left( X,Z\right) \)や\(\left( Y,Z\right) \)についても同様に考えます。

 

同時周辺確率質量関数の非負性

同時周辺確率質量関数は非負の実数を値としてとります。特に、確率ベクトルの値域に属さない値に対して、同時周辺確率質量関数はゼロを値として定めます。

命題(同時周辺確率質量関数の非負性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率ベクトル\(\left( X_{1},\cdots,X_{m}\right) :\Omega \rightarrow \mathbb{R} ^{m}\ \left( m<n\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{m}}:\mathbb{R} ^{m}\rightarrow \mathbb{R} \)が存在するとともに、任意の\(\left( x_{1},\cdots ,x_{m}\right) \in \mathbb{R} ^{m}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) \geq 0
\end{equation*}が成り立つ。特に、\(\left( x_{1},\cdots ,x_{m}\right) \not\in \left( X_{1},\cdots ,X_{m}\right)\left( \Omega \right) \)である場合には、\begin{equation*}f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) =0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

\(\left( X_{1},\cdots ,X_{m}\right) \)とは異なる確率ベクトルについても同様です。

例(同時周辺確率質量関数の非負性)
確率ベクトル\(\left( X,Y,Z\right) :\Omega\rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{3}
\end{equation*}であるとともに、\(\left(X,Y,Z\right) \)の同時確率質量関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{8} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率ベクトル\(\left(X,Y\right) \)の値域は、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時周辺確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( x,y\right) \in\left( X,Y\right) \left( \Omega \right) \)に対して定める値は、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{4} & \left( if\ x=1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=1\wedge y=-1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=-1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}です。任意の\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) \geq 0
\end{equation*}が成立しています。\(\left( X,Y\right) \)とは異なる確率ベクトル、すなわち\(\left( X,Z\right) \)や\(\left( Y,Z\right) \)についても同様に考えます。

 

同時周辺確率質量関数の値の総和

確率ベクトルがとり得るそれぞれの値に対して同時周辺確率質量関数が定める値の総和をとると\(1\)になります。

命題(同時周辺確率質量関数の値の総和)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、確率ベクトル\(\left( X_{1},\cdots,X_{m}\right) :\Omega \rightarrow \mathbb{R} ^{m}\ \left( m<n\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{m}}:\mathbb{R} ^{m}\rightarrow \mathbb{R} \)が存在するとともに、任意の\(\left( x_{1},\cdots ,x_{m}\right) \in \mathbb{R} ^{m}\)に対して、\begin{equation*}\sum_{\left( x_{1},\cdots ,x_{m}\right) \in \left( X_{1},\cdots
,X_{m}\right) \left( \Omega \right) }f_{X_{1}\cdots X_{m}}\left(
x_{1},\cdots ,x_{m}\right) =1
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

\(\left( X_{1},\cdots ,X_{m}\right) \)とは異なる確率ベクトルについても同様です。

例(同時周辺確率質量関数の値の総和)
確率ベクトル\(\left( X,Y,Z\right) :\Omega\rightarrow \mathbb{R} ^{3}\)の値域が、\begin{equation*}\left( X,Y,Z\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{3}
\end{equation*}であるとともに、\(\left(X,Y,Z\right) \)の同時確率質量関数\(f_{XYZ}:\mathbb{R} ^{3}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{equation*}f_{XYZ}\left( x,y,z\right) =\left\{
\begin{array}{cl}
\frac{1}{8} & \left( if\ \left( x,y,z\right) \in \left( X,Y,Z\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率ベクトル\(\left(X,Y\right) \)の値域は、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ 1,-1\right\} ^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時周辺確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( x,y\right) \in\left( X,Y\right) \left( \Omega \right) \)に対して定める値は、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{4} & \left( if\ x=1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=1\wedge y=-1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=1\right) \\
\frac{1}{4} & \left( if\ x=-1\wedge y=-1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}です。このとき、\begin{eqnarray*}
\sum_{\left( x,y\right) \in \left( X,Y\right) \left( \Omega \right)
}f_{XY}\left( x,y\right) &=&f_{XY}\left( 1,1\right) +f_{XY}\left(
1,-1\right) +f_{XY}\left( -1,1\right) +f_{XY}\left( -1,-1\right) \\
&=&\frac{1}{4}+\frac{1}{4}+\frac{1}{4}+\frac{1}{4} \\
&=&1
\end{eqnarray*}が成り立ちます。\(\left(X,Y\right) \)とは異なる確率ベクトル、すなわち\(\left(X,Z\right) \)や\(\left( Y,Z\right) \)についても同様に考えます。

 

同時確率質量関数としての同時周辺確率質量関数

非負性を満たすとともに、値の総和が\(1\)であるような多変数関数を同時確率質量関数と定義しました。先に示した諸命題より、同時周辺確率質量関数もまた非負性を満たすとともに、値の総和が\(1\)になります。つまり、確率ベクトル\(\left( X_{1},\cdots ,X_{m}\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{m}}:\mathbb{R} ^{m}\rightarrow \mathbb{R} \)は以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \forall \left( x_{1},\cdots ,x_{m}\right) \in \mathbb{R} ^{m}:f_{X_{1}\cdots X_{m}}\left( x_{1},\cdots ,x_{m}\right) \geq 0 \\
&&\left( b\right) \ \sum_{\left( x_{1},\cdots ,x_{m}\right) \in \left(
X_{1},\cdots ,X_{m}\right) \left( \Omega \right) }f_{X_{1}\cdots
X_{m}}\left( x_{1},\cdots ,x_{m}\right) =1
\end{eqnarray*}を満たすということです。\(\left( X_{1},\cdots ,X_{m}\right) \)とは異なる確率ベクトルについても同様です。したがって、同時周辺確率質量関数もまた個々の確率ベクトルに関する同時確率質量関数であることが明らかになりました。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録