同時確率変数の同時確率分布
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)が与えられている場合、\(\left( X,Y\right) \)の値がある集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率を、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right)
\end{equation*}または、\begin{equation*}
P\left( X\in A\wedge Y\in B\right)
\end{equation*}で表記するものと定めます。これをどのように評価すればよいでしょうか。
同時確率変数\(\left( X,Y\right) \)はそれぞれの標本点\(\omega \in\Omega \)に対してベクトル\begin{equation*}\left( X,Y\right) \left( \omega \right) =\left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in \mathbb{R} ^{2}
\end{equation*}を1つずつ定めるため、「同時確率変数\(\left(X,Y\right) \)の値が集合\(A\times B\)に属する」という事象は、\(\left( X,Y\right) \left( \omega \right) \in A\times B\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in
A\times B\right\}
\end{equation*}として表現されます。したがって、「同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\)に属する」という事象が起こる確率は、\begin{eqnarray*}P\left( \left( X,Y\right) \in A\times B\right) &=&P\left( \left\{ \omega
\in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in A\times
B\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in A\times B\right\} \right) \quad \because
\left( X,Y\right) \text{の定義} \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge
Y\left( \omega \right) \in B\right\} \right) \quad \because \text{直積の定義}
\end{eqnarray*}となります。
それぞれの集合\(A\times B\subset \mathbb{R} ^{2}\)に対して確率\(P\left( \left(X,Y\right) \in A\times B\right) \)が明らかになっている場合には、そのような情報の集まりを同時確率変数\(\left( X,Y\right) \)の同時確率分布(joint probability distributioin)と呼びます。確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられている場合には、すなわち試行によって起こり得るそれぞれの事象の確率が分かっている場合には、何らかの同時確率変数を導入したとき、その同時確率分布もまた明らかになるということです。
連続型同時確率変数の確率分布を記述する際の問題点
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられているものとします。同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =P\left( \left\{ \omega \in
\Omega \ |\ X\left( \omega \right) \in A\wedge Y\left( \omega \right) \in
B\right\} \right)
\end{equation*}と定式化されますが、この値をどのように定義すればよいでしょうか。
同時確率変数\(\left( X,Y\right) \)が離散型の場合には、それぞれのベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(\left( x,y\right) \)と一致する確率\begin{equation*}f_{XY}\left( x,y\right) =P\left( X=x\wedge Y=y\right)
\end{equation*}を定める同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を定義し、その上で、\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =\sum_{\left( x,y\right) \in
A\times B}f_{XY}\left( x,y\right)
\end{equation*}として定まることを示しました。つまり、集合\(A\times B\)に属するそれぞれの点\(\left( x,y\right) \)に対する確率\(f_{XY}\left( x,y\right) \)をとり、それらの総和をとれば\(P\left( \left( X,Y\right) \in A\times B\right) \)が得られるということです。一方、同時確率変数\(\left( X,Y\right) \)が連続型である場合には、同時確率質量関数を用いて\(\left( X,Y\right) \)の同時確率分布を表現できません。以下の例より明らかです。
\end{equation*}という無限閉区間の直積であるものとします。この集合は非可算集合であるため、任意の標本点\(\omega \in \Omega \)に対して、その根元事象の確率は、\begin{equation}P\left( \left\{ \omega \right\} \right) =0 \quad \cdots (1)
\end{equation}となります。同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation}\left( X,Y\right) \left( \omega \right) =\omega \quad \cdots (2)
\end{equation}を定めるのであれば、\(\left( X,Y\right) \)の値域は、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =[0,+\infty )\times \lbrack
0,+\infty )
\end{equation*}となるため、\(\left( X,Y\right) \)は連続型の同時確率変数です。仮に同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を定義するのであれば、これはそれぞれの\(\omega \in \left( X,Y\right) \left( \Omega \right) \)に対して、\begin{eqnarray*}f_{XY}\left( \omega \right) &=&P\left( \left\{ \omega ^{\prime }\in \Omega
\ |\ \left( X,Y\right) \left( \omega ^{\prime }\right) =\omega \right\}
\right) \quad \because f\text{の定義} \\
&=&P\left( \left\{ \omega \right\} \right) \quad \because \left( 2\right) \\
&=&0\quad \because \left( 1\right)
\end{eqnarray*}を定めます。つまり、同時確率質量関数\(f_{XY}\)は\(0\)のみを値としてとるため、同時確率質量関数が満たすべき条件\begin{equation*}\sum_{x\in \left( X,Y\right) \left( \Omega \right) }f_{XY}\left( x,y\right)
=1
\end{equation*}が満たされません。したがって、以上のような連続型の同時確率変数\(\left( X,Y\right) \)の確率分布を同時確率質量関数\(f_{XY}\)を用いて表現することはできません。
繰り返しになりますが、同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)は、同時確率変数\(\left(X,Y\right) \)の値がベクトル\(\left(x,y\right) \in \mathbb{R} ^{2}\)と一致する確率\begin{equation*}f_{XY}\left( x,y\right) =P\left( X=x\wedge Y=y\right)
\end{equation*}を指定することを通じて\(\left( X,Y\right) \)の確率分布を記述しようとします。ただ、先の例が示唆するように、同時確率質量関数\(f_{XY}\)は連続型の同時確率変数\(\left( X,Y\right) \)の同時確率分布を上手く記述できません。そこで、連続型の同時確率変数\(\left( X,Y\right) \)の確率分布を記述する際には、同時確率分布の考え方の原点に戻り、それぞれの集合\(A\times B\subset \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(A\times B\)に属する確率\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =P\left( \left\{ \omega \in
\Omega \ |\ X\left( \omega \right) \in A\wedge Y\left( \omega \right) \in
B\right\} \right)
\end{equation*}を直接記述するアプローチを採用します。では、これをどのように評価すればよいでしょうか。
連続型の同時確率変数の同時確率密度関数
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられているものとします。\(\left( X,Y\right) \)の確率分布を記述するためには、任意の集合\(A\times B\subset \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(A\times B\)に属する確率\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =P\left( \left\{ \omega \in
\Omega \ |\ X\left( \omega \right) \in A\wedge Y\left( \omega \right) \in
B\right\} \right)
\end{equation*}を特定する必要があります。ただ、\(X\left( \Omega\right) \)および\(Y\left( \Omega \right) \)は区間もしくは互いに素な区間の和集合であるため、\(\left( X,Y\right) \)の確率分布を記述するためには、区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(I\times J\)に属する確率\begin{eqnarray*}P\left( \left( X,Y\right) \in I\times J\right) &=&P\left( \left\{ \omega
\in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in I\times
J\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in I\wedge
Y\left( \omega \right) \in J\right\} \right)
\end{eqnarray*}を記述すれば十分です。
以上を踏まえた上で、有界区間と無限区間のどちらであるかを問わず、任意の区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に対して、\begin{equation*}\left( a\right) \ P\left( \left( X,Y\right) \in I\times J\right) =\int
\int_{\left( x,y\right) \in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}を満たすとともに、\begin{eqnarray*}
&&\left( b\right) \ \forall \left( x,y\right) \in \mathbb{R} ^{2}:f_{XY}\left( x,y\right) \geq 0 \\
&&\left( c\right) \ \int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty
}f_{XY}\left( x,y\right) dxdy=1
\end{eqnarray*}をともに満たす関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が存在する場合には、これを\(\left( X,Y\right) \)の同時確率密度関数(jointprobability density function)と呼びます。
条件\(\left( a\right) \)は、連続型の同時確率変数\(\left( X,Y\right) \)がある集合\(I\times J\)に属する値をとる確率は、同時確率密度関数\(f_{XY}\)をその集合\(I\times J\)上で二重積分すれば得られることを意味します。条件\(\left( b\right) \)は同時確率密度関数が非負の実数を値としてとり得る関数であることを意味し、条件\(\left( c\right) \)は同時確率密度関数を\(\mathbb{R} ^{2}\)上で二重積分すると\(1\)になることを意味します。
同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が存在する場合、\(f_{XY}\)が正の値をとる点からなる集合\begin{equation*}\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ f\left( x,y\right) >0\right\}
\end{equation*}を\(\left( X,Y\right) \)の同時確率分布の台(support)と呼びます。
\end{equation*}です。「選ばれた点の\(x\)座標」と「選ばれた点の\(y\)座標」の関係性を分析したい場合には、それらを特定する2つの確率変数の同時確率変数を利用することになります。「選ばれた点の\(x\)座標」を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{equation*}X\left( x,y\right) =x
\end{equation*}を定め、「選ばれた点の\(y\)座標」を特定する確率変数\(Y:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{equation*}Y\left( x,y\right) =y
\end{equation*}を定めます。同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)はそれぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{eqnarray*}\left( X,Y\right) \left( x,y\right) &=&\left( X\left( x,y\right) ,Y\left(
x,y\right) \right) \\
&=&\left( x,y\right)
\end{eqnarray*}を定めますが、その値域は、\begin{equation*}
\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}です。同時確率密度関数\(f_{XY}:\mathbb{R} ^{2} \rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、\begin{equation*}
\forall \left( x,y\right) \in \mathbb{R} ^{2}:f_{XY}\left( x,y\right) \geq 0
\end{equation*}が明らかに成り立つとともに、\begin{eqnarray*}
\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right)
dxdy &=&\int \int_{\left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) }f_{XY}\left( x,y\right) dxdy \\
&=&\int_{0}^{1}\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dxdy \\
&=&\int_{0}^{1}\left[ \frac{1}{2}x^{2}+\frac{3}{2}y^{2}x\right] _{0}^{1}dy \\
&=&\int_{0}^{1}\left( \frac{1}{2}+\frac{3}{2}y^{2}\right) dy \\
&=&\left[ \frac{1}{2}y+\frac{1}{2}y^{3}\right] _{0}^{1} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}となるため、確かに\(f_{XY}\left( x,y\right) \)は同時確率密度関数としての要件を満たしています。このとき、例えば、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}\wedge 0\leq Y\leq \frac{1}{2}\right)
&=&\int_{0}^{\frac{1}{2}}\int_{0}^{\frac{1}{2}}\left( x+\frac{3}{2}y^{2}\right) dxdy \\
&=&\int_{0}^{\frac{1}{2}}\left[ \frac{1}{2}x^{2}+\frac{3}{2}y^{2}x\right] _{0}^{\frac{1}{2}}dy \\
&=&\int_{0}^{\frac{1}{2}}\left( \frac{1}{8}+\frac{3}{4}y^{2}\right) dy \\
&=&\left[ \frac{1}{8}y+\frac{1}{4}y^{3}\right] _{0}^{\frac{1}{2}} \\
&=&\frac{3}{32}
\end{eqnarray*}となります。
連続型の同時確率変数が特定の値をとる確率
連続型の同時確率変数\(\left( X,Y\right) \)の同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。点\(\left( a,b\right) \in \mathbb{R} ^{2}\)を任意に選んだとき、\begin{equation}\left[ a,a\right] \times \left[ b,b\right] =\left\{ a\right\} \times \left\{
b\right\} \quad \cdots (1)
\end{equation}という関係が成り立つため、\begin{eqnarray*}
P\left( X=a\wedge Y=b\right) &=&P\left( \left( X,Y\right) \in \left\{
a\right\} \times \left\{ b\right\} \right) \\
&=&P\left( a\leq X\leq a\wedge b\leq X\leq b\right) \quad \because \left(
1\right) \\
&=&\int_{a}^{a}\int_{b}^{b}f_{XY}\left( x,y\right) dxdy\quad \because f_{XY}\text{の定義} \\
&=&0\quad \because \text{点における積分}
\end{eqnarray*}すなわち、\begin{equation*}
P\left( X=a\wedge Y=b\right) =0
\end{equation*}となります。つまり、連続型の同時確率変数\(\left( X,Y\right) \)に関しては、それがある1つのベクトルを値としてとる確率は必ず\(0\)になるということです。この点において連続型の同時確率変数は離散型の同時確率変数とは異なります。ただ、以上の事実は「連続型の同時確率変数\(\left( X,Y\right) \)の値があるベクトル\(\left( a,b\right) \)と一致する」という事象が「空事象」であることを意味するわけではありません。
演習問題
\end{equation*}であるとともに、その同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cc}
\frac{1}{6} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( if\ \left( x,y\right) \not\in \left( X,Y\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。\(f_{XY}\)が同時確率密度関数としての性質を満たすことを確認するとともに、以下の確率\begin{equation*}P\left( 1\leq X\leq 3\wedge -1\leq Y\leq 1\right)
\end{equation*}を求めてください。
\begin{array}{cl}
x+cy^{2} & \left( if\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。ただし、\(c\in \mathbb{R} \)は定数です。\(f_{XY}\)が同時確率密度関数であるための\(c\)が満たすべき条件を特定してください。
\begin{array}{cl}
c\left( xy+x+y\right) & \left( if\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right)
\\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。ただし、\(c\in \mathbb{R} \)は定数です。\(f_{XY}\)が同時確率密度関数であるための\(c\)が満たすべき条件を特定するとともに、以下の確率\begin{equation*}P\left( X\geq Y\right)
\end{equation*}を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】