2つの確率変数の独立性
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて2つの確率変数\begin{eqnarray*}X &:&\Omega \rightarrow \mathbb{R} \\
Y &:&\Omega \rightarrow \mathbb{R} \end{eqnarray*}と同時確率変数\begin{equation*}
\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}が与えられているものとします。
確率変数\(X,Y\)から生成される\(\sigma \)-代数は、\begin{eqnarray*}\sigma \left( X\right) &=&\left\{ X^{-1}\left( B\right) \in 2^{\Omega }\ |\
B\in \mathcal{B}\left( \mathbb{R} \right) \right\} \\
\sigma \left( Y\right) &=&\left\{ Y^{-1}\left( B\right) \in 2^{\Omega }\ |\
B\in \mathcal{B}\left( \mathbb{R} \right) \right\}
\end{eqnarray*}と定義されます。\(X\)と\(Y\)が独立であることは、\(\sigma \left( X\right) \)と\(\sigma \left( Y\right) \)が事象族として独立であること、すなわち、\begin{equation*}\forall A\in \sigma \left( X\right) ,\ \forall B\in \sigma \left( Y\right)
:P\left( A\cap B\right) =P\left( A\right) \cdot P\left( B\right)
\end{equation*}が成り立つこととして定義されます。逆に、\(X\)と\(Y\)が独立ではない場合には、すなわち、\begin{equation*}\exists A\in \sigma \left( X\right) ,\ \exists B\in \sigma \left( Y\right)
:P\left( A\cap B\right) \not=P\left( A\right) \cdot P\left( B\right)
\end{equation*}が成り立つ場合には、\(X\)と\(Y\)は従属であると言います。以下の条件\begin{equation*}\forall A,B\in \mathcal{B}\left( \mathbb{R} \right) :P\left( X\in A\wedge Y\in B\right) =P\left( X\in A\right) \cdot
P\left( Y\in B\right)
\end{equation*}が成り立つことは、\(X\)と\(Y\)が独立であるための必要十分条件です。さらに、以下の条件\begin{equation*}\forall x,y\in \mathbb{R} :P\left( X\leq x\wedge Y\leq y\right) =P\left( X\leq x\right) \cdot P\left(
X\leq y\right)
\end{equation*}が成り立つ場合には、\(X\)と\(Y\)は独立です。
2つの連続型確率変数の独立性
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の同時確率変数\(\left( X,Y\right):\Omega \rightarrow \mathbb{R} ^{2}\)とその同時確率密度関数\begin{equation*}f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}が与えられているものとします。つまり、\(\left( X,Y\right) \)の実現値が集合\(E\in \mathcal{B}\left( \mathbb{R} ^{2}\right) \)に属する確率は、\begin{equation}P\left( \left( X,Y\right) \in E\right) =\int \int_{E}f_{XY}\left( x,y\right)
dxdy \quad \cdots (1)
\end{equation}であるということです。同時確率密度関数\(f_{XY}\)を周辺化することにより個々の確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)の周辺確率密度関数\begin{eqnarray*}f_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
f_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}が得られます。周辺確率密度関数の定義より、集合\(A,B\in \mathcal{B}\left( \mathbb{R} \right) \)を任意に選んだとき、\begin{eqnarray}P\left( X\in A\right) &=&\int_{A}f_{X}\left( x\right) dx \quad \cdots (2) \\
P\left( Y\in B\right) &=&\int_{B}f_{Y}\left( y\right) dy \quad \cdots (3)
\end{eqnarray}が成り立ちます。
確率関数\(X,Y\)が独立であることは、\begin{equation*}\forall A,B\in \mathcal{B}\left( \mathbb{R} \right) :P\left( X\in A\wedge Y\in B\right) =P\left( X\in A\right) \cdot
P\left( Y\in B\right)
\end{equation*}が成り立つことを意味しますが、\(\left( 1\right) ,\left(2\right) ,\left( 3\right) \)を用いると、これを、\begin{equation*}\forall A,B\in \mathcal{B}\left( \mathbb{R} \right) :\int \int_{A\times B}f_{XY}\left( x,y\right)
dxdy=\int_{A}f_{X}\left( x\right) dx\cdot \int_{B}f_{Y}\left( y\right) dy
\end{equation*}と表現できます。そこで、以上の条件によって絶対連続型の確率変数\(X,Y\)の独立性の定義とします。
絶対連続型確率変数の独立性を以下のように表現することもできます。
\end{equation*}が成り立つことは、\(X\)と\(Y\)が独立であるための必要十分条件である。
\begin{array}{cl}
4xy & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (1)
\end{equation}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{y=-\infty }^{+\infty }f_{XY}\left( x,y\right)
dy \\
&=&\int_{y=0}^{1}\left( 4xy\right) dy \\
&=&\left[ 2xy^{2}\right] _{y=0}^{1} \\
&=&2x
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{X}\left( x\right) =\left\{
\begin{array}{cl}
2x & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (2)
\end{equation}です。確率変数\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( y\right) &=&\int_{x=-\infty }^{+\infty }f_{XY}\left( x,y\right)
dx \\
&=&\int_{x=0}^{1}\left( 4xy\right) dx \\
&=&\left[ 2x^{2}y\right] _{x=0}^{1} \\
&=&2y
\end{eqnarray*}である一方、\(y\not\in Y\left( \Omega\right) \)を満たす任意の\(y\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{Y}\left( y\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{Y}\left( y\right) =\left\{
\begin{array}{cl}
2y & \left( if\ y\in Y\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (3)
\end{equation}です。\(x,y\in \mathbb{R} \)を任意に選んだとき、\(\left( x,y\right) \in \left( X\times Y\right) \left( \Omega \right) \)の場合には、\begin{eqnarray*}f_{XY}\left( x,y\right) &=&4xy\quad \because \left( 1\right) \\
&=&2x\cdot 2y \\
&=&f_{X}\left( x\right) \cdot f_{Y}\left( y\right) \quad \because \left(
2\right) ,\left( 3\right)
\end{eqnarray*}が成り立ち、\(\left( x,y\right) \not\in\left( X\times Y\right) \left( \Omega \right) \)の場合には、\begin{eqnarray*}f_{XY}\left( x,y\right) &=&0\quad \because \left( 1\right) \\
&=&0\cdot 0 \\
&=&f_{X}\left( x\right) \cdot f_{Y}\left( y\right) \quad \because \left(
2\right) ,\left( 3\right)
\end{eqnarray*}が成り立つため\(X\)と\(Y\)は独立です。
確率変数どうしは独立であるとは限りません。以下の例より明らかです。
\begin{array}{cl}
x+y & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (1)
\end{equation}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{y=-\infty }^{+\infty }f_{XY}\left( x,y\right)
dy \\
&=&\int_{y=0}^{1}\left( x+y\right) dy \\
&=&\left[ xy+\frac{1}{2}y^{2}\right] _{y=0}^{1} \\
&=&x+\frac{1}{2}
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{X}\left( x\right) =\left\{
\begin{array}{cl}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (2)
\end{equation}です。確率変数\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( y\right) &=&\int_{x=-\infty }^{+\infty }f_{XY}\left( x,y\right)
dx \\
&=&\int_{x=0}^{1}\left( x+y\right) dx \\
&=&\left[ xy+\frac{1}{2}y^{2}\right] _{x=0}^{1} \\
&=&y+\frac{1}{2}
\end{eqnarray*}である一方、\(y\not\in Y\left( \Omega\right) \)を満たす任意の\(y\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{Y}\left( y\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{Y}\left( y\right) =\left\{
\begin{array}{cl}
y+\frac{1}{2} & \left( if\ y\in Y\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (3)
\end{equation}です。点\(\left( \frac{1}{4},\frac{1}{4}\right) \in\left( X,Y\right) \left( \Omega \right) \)に注目したとき、\(\left( 1\right) ,\left( 2\right) ,\left(3\right) \)より、\begin{eqnarray*}f_{XY}\left( \frac{1}{4},\frac{1}{4}\right) &=&\frac{1}{4}+\frac{1}{4}=\frac{1}{2} \\
f_{X}\left( \frac{1}{4}\right) &=&\frac{1}{4}+\frac{1}{2}=\frac{3}{4} \\
f_{Y}\left( \frac{1}{4}\right) &=&\frac{1}{4}+\frac{1}{2}=\frac{3}{4}
\end{eqnarray*}であるため、\begin{equation*}
f_{XY}\left( \frac{1}{4},\frac{1}{4}\right) \not=f_{X}\left( \frac{1}{4}\right) \cdot f_{Y}\left( \frac{1}{4}\right)
\end{equation*}が成り立つため、\(X\)と\(Y\)は独立ではないこと、すなわち従属であることが明らかになりました。
分布関数を用いた連続型確率変数の独立性の表現
確率変数の独立性は分布関数を用いて表現することもできます。具体的には以下の通りです。
\end{equation*}が成り立つことは、\(X\)と\(Y\)が独立であるための必要十分条件である。
\begin{array}{cl}
0 & \left( if\ x<0\vee y<0\right) \\
\frac{1}{2}x^{2}y+\frac{1}{2}xy^{3} & \left( if\ 0\leq x\leq 1\wedge 0\leq
y\leq 1\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x\leq 1\wedge y>1\right)
\\
\frac{1}{2}y+\frac{1}{2}y^{3} & \left( if\ x>1\wedge 0\leq y\leq 1\right)
\\
1 & \left( if\ x>1\wedge y>1\right)
\end{array}\right. \quad \cdots (1)
\end{equation}を定めるものとします。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right. \quad \cdots (2)
\end{equation}を定めます。確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺分布関数\(F_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation}F_{Y}\left( y\right) =\left\{
\begin{array}{cl}
0 & \left( if\ y<0\right) \\
\frac{1}{2}y+\frac{1}{2}y^{3} & \left( if\ 0\leq y\leq 1\right) \\
1 & \left( if\ y>1\right)
\end{array}\right. \quad \cdots (3)
\end{equation}を定めます。点\(\left( \frac{1}{2},\frac{1}{2}\right) \in \mathbb{R} ^{2}\)に注目したとき、\(\left(1\right) ,\left( 2\right) ,\left( 3\right) \)より、\begin{eqnarray*}F_{XY}\left( \frac{1}{2},\frac{1}{2}\right) &=&\frac{1}{2}\left( \frac{1}{2}\right) ^{2}\left( \frac{1}{2}\right) +\frac{1}{2}\left( \frac{1}{2}\right)
\left( \frac{1}{2}\right) ^{3}=\frac{3}{32} \\
F_{X}\left( \frac{1}{2}\right) &=&\frac{1}{2}\left( \frac{1}{2}\right) ^{2}+\frac{1}{2}\left( \frac{1}{2}\right) =\frac{3}{8} \\
F_{Y}\left( \frac{1}{2}\right) &=&\frac{1}{2}\left( \frac{1}{2}\right) +\frac{1}{2}\left( \frac{1}{2}\right) ^{3}=\frac{5}{16}
\end{eqnarray*}であり、さらに、\begin{eqnarray*}
F_{X}\left( \frac{1}{2}\right) \cdot F_{Y}\left( \frac{1}{2}\right) &=&\frac{3}{8}\cdot \frac{5}{16} \\
&=&\frac{15}{128} \\
&\not=&F_{XY}\left( \frac{1}{2},\frac{1}{2}\right)
\end{eqnarray*}であるため、\(X\)と\(Y\)は独立ではないこと、すなわち従属であることが明らかになりました。
演習問題
\begin{array}{cl}
1 & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega \right)
\right) \\
0 & \left( if\ \left( x,y\right) \not\in \left( X,Y\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)と\(Y\)は独立でしょうか。議論してください。
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
24xy & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( if\ \left( x,y\right) \not\in \left( X,Y\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)と\(Y\)は独立でしょうか。議論してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】