離散型確率ベクトルの同時確率質量関数

確率ベクトルの同時確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられている場合、\(\left( X_{1},\cdots ,X_{n}\right) \)の値がある集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right)
\end{equation*}または、\begin{equation*}
P\left( X_{1}\in A_{1}\wedge \cdots \wedge X_{n}\in A_{n}\right)
\end{equation*}で表記するものと定めます。これをどのように評価すればよいでしょうか。

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率ベクトル\(\left(X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\)に属する」という事象が起こる確率は、\(\left( X_{1},\cdots ,X_{n}\right) \left(\omega \right) \in A_{1}\times \cdots \times A_{n}\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{n}\right) \left(
\omega \right) \in A_{1}\times \cdots \times A_{n}\right\}
\end{equation*}として表現されます。したがって、「確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\)に属する」という事象が起こる確率は、\begin{eqnarray*}&&P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{n}\right)
\left( \omega \right) \in A_{1}\times \cdots \times A_{n}\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1}\left( \omega \right)
,\cdots ,X_{n}\left( \omega \right) \right) \in A_{1}\times \cdots \times
A_{n}\right\} \right) \quad \because \left( X_{1},\cdots ,X_{n}\right) \text{の定義} \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in
A_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) \in A_{n}\right\}
\right) \quad \because \text{直積の定義}
\end{eqnarray*}となります。

それぞれの集合\(A_{1}\times \cdots\times A_{n}\subset \mathbb{R} ^{n}\)に対して確率\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)が明らかになっている場合には、そのような情報の集まりを確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率分布（joint probability distribution）と呼びます。確率空間\(\left(\Omega ,\mathcal{F},P\right) \)が与えられている場合には、すなわち試行によって起こり得るそれぞれの事象の確率が分かっている場合には、何らかの確率ベクトルを導入したとき、その同時確率分布もまた明らかになるということです。

離散型確率ベクトルの同時確率質量関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとします。つまり、\(n\)個の確率変数\(X_{1},\cdots,X_{n}:\Omega \rightarrow \mathbb{R} \)がいずれも離散型であるということです。繰り返しになりますが、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率は、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega
\right) \in A_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) \in
A_{n}\right\} \right)
\end{equation*}と定義されます。より特殊なケースとして、確率ベクトル\(\left(X_{1},\cdots ,X_{n}\right) \)の値が特定のベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)と一致する確率を、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right)
\end{equation*}と表記した上で、これを\(\left( X_{1},\cdots ,X_{n}\right) \)の値が1点集合\(\left\{ \left( x_{1},\cdots ,x_{n}\right) \right\} \)に属する確率と同一視します。つまり、\begin{eqnarray*}&&P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{n}\right)
\left( \omega \right) \in \left\{ \left( x_{1},\cdots ,x_{n}\right) \right\}
\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right)
=x_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) =x_{n}\right\} \right)
\end{eqnarray*}です。以上を踏まえた上で、それぞれのベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、離散型の確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right) \)と一致する確率\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =P\left(
X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right)
\end{equation*}を定める\(n\)変数関数\begin{equation*}f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}を定義し、これを\(\left(X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数（joint probability mass function）や同時確率関数（joint probability function）などと呼びます。

例（同時確率質量関数）

「コインを\(n\)回投げる」という試行を行います。\(i\ \left( =1,\cdots ,n\right) \)回目に出た面を\(\omega _{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( \omega _{i}\right) _{i=1}^{n}\ |\ \forall i\in
\left\{ 1,\cdots ,n\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}です。各回において表が出た場合にはポイント\(1\)を得て、裏が出た場合にはポイント\(1\)を失うものとします。「各回に得るポイント」の関係性を分析したい場合には、それぞれの回に得るポイントを特定する確率変数に関する確率ベクトルを利用することになります。「\(i\)回目に得るポイント」を特定する確率変数\(X_{i}:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\omega =\left( \omega _{i}\right) _{i=1}^{n}\in \Omega \)に対して、\begin{equation*}X_{i}\left( \omega \right) =\left\{
\begin{array}{cc}
1 & \left( if\ \omega _{i}=\text{表}\right) \\
-1 & \left( if\ \omega _{i}=\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。この確率変数の値域は、\begin{equation*}
X_{i}\left( \Omega \right) =\left\{ 1,-1\right\}
\end{equation*}です。確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)はそれぞれの\(\omega =\left( \omega_{i}\right) _{i=1}^{n}\in \Omega \)に対して、\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right)
\end{equation*}を定めます。この確率ベクトルの値域は、\begin{eqnarray*}
\left( X_{1},\cdots ,X_{n}\right) \left( \Omega \right) &=&\left\{
1,-1\right\} ^{n} \\
&=&X_{1}\left( \Omega \right) \times \cdots \times X_{n}\left( \Omega
\right)
\end{eqnarray*}です。標本空間には\(2^{n}\)個の標本点が属しますが、仮に、これらがいずれも同じ程度の確かさで起こり得るのであれば、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。

同時確率分布としての同時確率質量関数

繰り返しになりますが、離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)が与えられている場合、\(\left( X_{1},\cdots ,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right)\in \mathbb{R} ^{n}\)と一致する確率に関しては、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) =f_{X_{1}\cdots
X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}という関係が成り立ちます。以上を踏まえると、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}という形で表すことができます。つまり、集合\(A_{1}\times \cdots \times A_{n}\)に属するそれぞれのベクトル\(\left( x_{1},\cdots ,x_{n}\right) \)に対する確率\(f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots,x_{n}\right) \)をとり、それらの総和をとれば\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)が得られるということです。ただし、\(A_{1}\times\cdots \times A_{n}\)が無限可算集合である場合、右辺は無限級数の和です。

命題（同時確率分布としての同時確率質量関数）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)と同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。集合\(A_{1}\times \cdots\times A_{n}\subset \mathbb{R} ^{n}\)を任意に選んだとき、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば任意の集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に対する確率\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)を以上の要領で特定できるため、同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)もまた離散型確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率分布を表現する手段の1つであるということになります。

例（同時確率分布としての同時確率質量関数）

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)の値域が、\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \Omega \right) =\left\{
1,-1\right\} ^{n}
\end{equation*}であるとともに、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先の命題より、「確率変数\(X_{1}\)の値が\(1\)である」という事象の確率は、\begin{eqnarray*}\sum_{\left( x_{2},\cdots ,x_{n}\right) \in A_{2}\times \cdots \times
A_{n}}f_{X_{1}\cdots X_{n}}\left( 1,x_{2},\cdots ,x_{n}\right)
&=&\sum_{\left( x_{2},\cdots ,x_{n}\right) \in A_{2}\times \cdots \times
A_{n}}\frac{1}{2^{n}} \\
&=&2^{n-1}\cdot \frac{1}{2^{n}} \\
&=&\frac{1}{2}
\end{eqnarray*}となります。また、「確率変数\(X_{1},X_{2}\)の値がともに\(1\)である」という事象の確率は、\begin{eqnarray*}\sum_{\left( x_{3},\cdots ,x_{n}\right) \in A_{3}\times \cdots \times
A_{n}}f_{X_{1}\cdots X_{n}}\left( 1,1,x_{3},\cdots ,x_{n}\right)
&=&\sum_{\left( x_{3},\cdots ,x_{n}\right) \in A_{3}\times \cdots \times
A_{n}}\frac{1}{2^{n}} \\
&=&2^{n-2}\cdot \frac{1}{2^{n}} \\
&=&\frac{1}{4}
\end{eqnarray*}となります。

同時確率質量関数の非負性

同時確率質量関数は非負の実数を値としてとります。特に、確率ベクトルの値域に属さない値に対して、同時確率質量関数はゼロを値として定めます。

命題（同時確率質量関数の非負性）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)とその同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、任意の\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) \geq 0
\end{equation*}が成り立つ。特に、\(\left( x_{1},\cdots ,x_{n}\right) \not\in \left( X_{1},\cdots ,X_{n}\right)\left( \Omega \right) \)である場合には、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =0
\end{equation*}を満たす。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

例（同時確率質量関数の非負性）

同時確率質量関数の値の総和

確率ベクトルがとり得るそれぞれの値に対して同時確率質量関数が定める値の総和をとると\(1\)になります。

命題（同時確率質量関数の値の総和）

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)とその同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が与えられているものとする。このとき、\begin{equation*}\sum_{\left( x_{1},\cdots ,x_{n}\right) \in \left( X_{1},\cdots
,X_{n}\right) \left( \Omega \right) }f_{X_{1}\cdots X_{n}}\left(
x_{1},\cdots ,x_{n}\right) =1
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

例（同時確率質量関数の値の総和）

確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)の値域が、\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \Omega \right) =\left\{
1,-1\right\} ^{n}
\end{equation*}であるとともに、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、\begin{eqnarray*}
\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots \times
A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
&=&\sum_{\left( x_{1},\cdots ,x_{n}\right) \in \left( X_{1},\cdots
,X_{n}\right) \left( \Omega \right) }f_{X_{1}\cdots X_{n}}\left(
x_{1},\cdots ,x_{n}\right) \\
&=&2^{n}\cdot \frac{1}{2^{n}} \\
&=&1
\end{eqnarray*}が成り立ちます。

公理主義にもとづく同時確率質量関数の定義

同時確率質量関数が満たす性質を明らかにしましたが、公理主義的な立場から、非負性を満たすとともに、値の総和が\(1\)であるような関数を同時確率質量関数と定義する考え方もあります。つまり、確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられたとき、関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \forall \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) :f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots
,x_{n}\right) \geq 0 \\
&&\left( b\right) \ \sum_{\left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) }f_{X_{1}\cdots
X_{n}}\left( x_{1},\cdots ,x_{n}\right) =1
\end{eqnarray*}を満たす場合、これを同時確率質量関数と定義するということです。詳細は場を改めて解説します。

演習問題

問題（同時確率質量関数）

「サイコロを3回投げる」という試行において、「1投目に出る目」を特定する確率変数\(X\)と「最初の2投の目の合計」を特定する確率変数\(Y\)および「3投の目の合計」を特定する確率変数\(Z\)に関する確率ベクトル\(\left(X,Y,Z\right) \)を定式化するとともに、その同時確率分布を描写する同時確率質量関数\(f_{XYZ}\)を特定してください。ただし、すべての標本点は等しい確率で起こるものとします。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

問題（同時確率質量関数）

「コインを4回投げる」という試行において、「1,2回目に表が出た回数」を特定する確率変数\(X\)と、「2,3回目に表が出た回数」を特定する確率変数\(Y\)と、「3,4回目に表が出た回数」を特定する確率変数\(Z\)の確率ベクトル\(\left( X,Y,Z\right) \)を定式化するとともに、その同時確率分布を描写する同時確率質量関数\(f_{XYZ}\)を特定してください。ただし、すべての標本点は等しい確率で起こるものとします。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

問題（同時確率質量関数）

「52枚のトランプを4人に対して13枚ずつ配る」という試行において、「プレイヤー\(1\)に配られるスペードの枚数」を特定する確率変数\(X_{1}\)と「プレイヤー\(2\)に配られるスペードの枚数」を特定する確率変数\(X_{2}\)および「プレイヤー\(3\)に配られるスペードの枚数」を特定する確率変数\(X_{3}\)の確率ベクトル\(\left( X_{1},X_{2},X_{3}\right) \)を定式化するとともに、その同時確率分布を描写する同時確率質量関数\(f_{X_{1}X_{2}X_{3}}\)を特定してください。ただし、すべての標本点は等しい確率で起こるものとします。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

WIIS

数学のコース

経済学のコース

アカウント

WIIS

離散型の確率分布

離散型確率ベクトルの同時確率質量関数

目次

関連知識

確率ベクトルの同時確率分布

離散型確率ベクトルの同時確率質量関数

同時確率分布としての同時確率質量関数

同時確率質量関数の非負性

同時確率質量関数の値の総和

公理主義にもとづく同時確率質量関数の定義

演習問題

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率