確率ベクトルの同時確率分布
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられている場合、\(\left( X_{1},\cdots ,X_{n}\right) \)の値がある集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right)
\end{equation*}または、\begin{equation*}
P\left( X_{1}\in A_{1}\wedge \cdots \wedge X_{n}\in A_{n}\right)
\end{equation*}で表記するものと定めます。これをどのように評価すればよいでしょうか。
確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)はそれぞれの標本点\(\omega \in \Omega \)に対してベクトル\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right) \in \mathbb{R} ^{n}
\end{equation*}を1つずつ定めるため、「確率ベクトル\(\left(X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\)に属する」という事象が起こる確率は、\(\left( X_{1},\cdots ,X_{n}\right) \left(\omega \right) \in A_{1}\times \cdots \times A_{n}\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{n}\right) \left(
\omega \right) \in A_{1}\times \cdots \times A_{n}\right\}
\end{equation*}として表現されます。したがって、「確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\)に属する」という事象が起こる確率は、\begin{eqnarray*}&&P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{n}\right)
\left( \omega \right) \in A_{1}\times \cdots \times A_{n}\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1}\left( \omega \right)
,\cdots ,X_{n}\left( \omega \right) \right) \in A_{1}\times \cdots \times
A_{n}\right\} \right) \quad \because \left( X_{1},\cdots ,X_{n}\right) \text{の定義} \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right) \in
A_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) \in A_{n}\right\}
\right) \quad \because \text{直積の定義}
\end{eqnarray*}となります。
それぞれの集合\(A_{1}\times \cdots\times A_{n}\subset \mathbb{R} ^{n}\)に対して確率\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)が明らかになっている場合には、そのような情報の集まりを確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の同時確率分布(joint probability distribution)と呼びます。確率空間\(\left(\Omega ,\mathcal{F},P\right) \)が与えられている場合には、すなわち試行によって起こり得るそれぞれの事象の確率が分かっている場合には、何らかの確率ベクトルを導入したとき、その同時確率分布もまた明らかになるということです。
離散型確率ベクトルの同時確率質量関数
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right):\Omega \rightarrow \mathbb{R} ^{n}\)が与えられているものとします。つまり、\(n\)個の確率変数\(X_{1},\cdots,X_{n}:\Omega \rightarrow \mathbb{R} \)がいずれも離散型であるということです。繰り返しになりますが、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率は、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega
\right) \in A_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) \in
A_{n}\right\} \right)
\end{equation*}と定義されます。より特殊なケースとして、確率ベクトル\(\left(X_{1},\cdots ,X_{n}\right) \)の値が特定のベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)と一致する確率を、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right)
\end{equation*}と表記した上で、これを\(\left( X_{1},\cdots ,X_{n}\right) \)の値が1点集合\(\left\{ \left( x_{1},\cdots ,x_{n}\right) \right\} \)に属する確率と同一視します。つまり、\begin{eqnarray*}&&P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X_{1},\cdots ,X_{n}\right)
\left( \omega \right) \in \left\{ \left( x_{1},\cdots ,x_{n}\right) \right\}
\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X_{1}\left( \omega \right)
=x_{1}\wedge \cdots \wedge X_{n}\left( \omega \right) =x_{n}\right\} \right)
\end{eqnarray*}です。以上を踏まえた上で、それぞれのベクトル\(\left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、離散型の確率ベクトル\(\left( X_{1},\cdots,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right) \)と一致する確率\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =P\left(
X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right)
\end{equation*}を定める\(n\)変数関数\begin{equation*}f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}を定義し、これを\(\left(X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数(joint probability mass function)や同時確率関数(joint probability function)などと呼びます。
\left\{ 1,\cdots ,n\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}です。各回において表が出た場合にはポイント\(1\)を得て、裏が出た場合にはポイント\(1\)を失うものとします。「各回に得るポイント」の関係性を分析したい場合には、それぞれの回に得るポイントを特定する確率変数に関する確率ベクトルを利用することになります。「\(i\)回目に得るポイント」を特定する確率変数\(X_{i}:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\omega =\left( \omega _{i}\right) _{i=1}^{n}\in \Omega \)に対して、\begin{equation*}X_{i}\left( \omega \right) =\left\{
\begin{array}{cc}
1 & \left( if\ \omega _{i}=\text{表}\right) \\
-1 & \left( if\ \omega _{i}=\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。この確率変数の値域は、\begin{equation*}
X_{i}\left( \Omega \right) =\left\{ 1,-1\right\}
\end{equation*}です。確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)はそれぞれの\(\omega =\left( \omega_{i}\right) _{i=1}^{n}\in \Omega \)に対して、\begin{equation*}\left( X_{1},\cdots ,X_{n}\right) \left( \omega \right) =\left( X_{1}\left(
\omega \right) ,\cdots ,X_{n}\left( \omega \right) \right)
\end{equation*}を定めます。この確率ベクトルの値域は、\begin{eqnarray*}
\left( X_{1},\cdots ,X_{n}\right) \left( \Omega \right) &=&\left\{
1,-1\right\} ^{n} \\
&=&X_{1}\left( \Omega \right) \times \cdots \times X_{n}\left( \Omega
\right)
\end{eqnarray*}です。標本空間には\(2^{n}\)個の標本点が属しますが、仮に、これらがいずれも同じ程度の確かさで起こり得るのであれば、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。
同時確率分布としての同時確率質量関数
繰り返しになりますが、離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)が与えられている場合、\(\left( X_{1},\cdots ,X_{n}\right) \)の値がベクトル\(\left( x_{1},\cdots ,x_{n}\right)\in \mathbb{R} ^{n}\)と一致する確率に関しては、\begin{equation*}P\left( X_{1}=x_{1}\wedge \cdots \wedge X_{n}=x_{n}\right) =f_{X_{1}\cdots
X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}という関係が成り立ちます。以上を踏まえると、確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の値が集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に属する確率を、\begin{equation*}P\left( \left( X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}という形で表すことができます。つまり、集合\(A_{1}\times \cdots \times A_{n}\)に属するそれぞれのベクトル\(\left( x_{1},\cdots ,x_{n}\right) \)に対する確率\(f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots,x_{n}\right) \)をとり、それらの総和をとれば\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)が得られるということです。ただし、\(A_{1}\times\cdots \times A_{n}\)が無限可算集合である場合、右辺は無限級数の和です。
A_{n}\right) =\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots
\times A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
\end{equation*}という関係が成り立つ。
同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)が与えられれば任意の集合\(A_{1}\times \cdots \times A_{n}\subset \mathbb{R} ^{n}\)に対する確率\(P\left( \left(X_{1},\cdots ,X_{n}\right) \in A_{1}\times \cdots \times A_{n}\right) \)を以上の要領で特定できるため、同時確率質量関数\(f_{X_{1}\cdots X_{n}}\)もまた離散型確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) \)の同時確率分布を表現する手段の1つであるということになります。
1,-1\right\} ^{n}
\end{equation*}であるとともに、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先の命題より、「確率変数\(X_{1}\)の値が\(1\)である」という事象の確率は、\begin{eqnarray*}\sum_{\left( x_{2},\cdots ,x_{n}\right) \in A_{2}\times \cdots \times
A_{n}}f_{X_{1}\cdots X_{n}}\left( 1,x_{2},\cdots ,x_{n}\right)
&=&\sum_{\left( x_{2},\cdots ,x_{n}\right) \in A_{2}\times \cdots \times
A_{n}}\frac{1}{2^{n}} \\
&=&2^{n-1}\cdot \frac{1}{2^{n}} \\
&=&\frac{1}{2}
\end{eqnarray*}となります。また、「確率変数\(X_{1},X_{2}\)の値がともに\(1\)である」という事象の確率は、\begin{eqnarray*}\sum_{\left( x_{3},\cdots ,x_{n}\right) \in A_{3}\times \cdots \times
A_{n}}f_{X_{1}\cdots X_{n}}\left( 1,1,x_{3},\cdots ,x_{n}\right)
&=&\sum_{\left( x_{3},\cdots ,x_{n}\right) \in A_{3}\times \cdots \times
A_{n}}\frac{1}{2^{n}} \\
&=&2^{n-2}\cdot \frac{1}{2^{n}} \\
&=&\frac{1}{4}
\end{eqnarray*}となります。
同時確率質量関数の非負性
同時確率質量関数は非負の実数を値としてとります。特に、確率ベクトルの値域に属さない値に対して、同時確率質量関数はゼロを値として定めます。
\end{equation*}が成り立つ。特に、\(\left( x_{1},\cdots ,x_{n}\right) \not\in \left( X_{1},\cdots ,X_{n}\right)\left( \Omega \right) \)である場合には、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =0
\end{equation*}を満たす。
1,-1\right\} ^{n}
\end{equation*}であるとともに、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。任意の\(\left( x_{1},\cdots ,x_{n}\right)\in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) \geq 0
\end{equation*}が成立しています。
同時確率質量関数の値の総和
確率ベクトルがとり得るそれぞれの値に対して同時確率質量関数が定める値の総和をとると\(1\)になります。
,X_{n}\right) \left( \Omega \right) }f_{X_{1}\cdots X_{n}}\left(
x_{1},\cdots ,x_{n}\right) =1
\end{equation*}という関係が成り立つ。
1,-1\right\} ^{n}
\end{equation*}であるとともに、同時確率質量関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x_{1},\cdots,x_{n}\right) \in \mathbb{R} ^{n}\)に対して、\begin{equation*}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right) =\left\{
\begin{array}{cl}
\frac{1}{2^{n}} & \left( if\ \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、\begin{eqnarray*}
\sum_{\left( x_{1},\cdots ,x_{n}\right) \in A_{1}\times \cdots \times
A_{n}}f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots ,x_{n}\right)
&=&\sum_{\left( x_{1},\cdots ,x_{n}\right) \in \left( X_{1},\cdots
,X_{n}\right) \left( \Omega \right) }f_{X_{1}\cdots X_{n}}\left(
x_{1},\cdots ,x_{n}\right) \\
&=&2^{n}\cdot \frac{1}{2^{n}} \\
&=&1
\end{eqnarray*}が成り立ちます。
公理主義にもとづく同時確率質量関数の定義
同時確率質量関数が満たす性質を明らかにしましたが、公理主義的な立場から、非負性を満たすとともに、値の総和が\(1\)であるような関数を同時確率質量関数と定義する考え方もあります。つまり、確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に離散型の確率ベクトル\(\left( X_{1},\cdots ,X_{n}\right) :\Omega \rightarrow \mathbb{R} ^{n}\)が与えられたとき、関数\(f_{X_{1}\cdots X_{n}}:\mathbb{R} ^{n}\rightarrow \mathbb{R} \)が以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \forall \left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) :f_{X_{1}\cdots X_{n}}\left( x_{1},\cdots
,x_{n}\right) \geq 0 \\
&&\left( b\right) \ \sum_{\left( x_{1},\cdots ,x_{n}\right) \in \left(
X_{1},\cdots ,X_{n}\right) \left( \Omega \right) }f_{X_{1}\cdots
X_{n}}\left( x_{1},\cdots ,x_{n}\right) =1
\end{eqnarray*}を満たす場合、これを同時確率質量関数と定義するということです。詳細は場を改めて解説します。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】