WIIS

連続型の確率分布

同一分布にしたがう2つの連続型確率変数

目次

Twitter
Mailで保存

同一分布にしたがう2つの確率変数

問題としている試行に関する確率空間\(\left(\Omega ,\mathcal{F},P\right) \)に加えて確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられている場合、「確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}として表現されるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}となります。任意の集合\(A\subset \mathbb{R} \)に対して、確率変数\(X\)の値が\(A\)に属する確率\(P\left( X\in A\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X\)の確率分布と呼びました。

問題としている試行に関する同時確率変数\begin{equation*}
\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}が与えられている状況を想定します。集合\(A\subset \mathbb{R} \)を選んだとき、「確率変数\(X\)の値が集合\(A\)に属する確率」は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}であり、「確率変数\(Y\)の値が集合\(A\)に属する確率」は、\begin{equation*}P\left( Y\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ Y\left( \omega
\right) \in A\right\} \right)
\end{equation*}です。2つの確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)が同一の確率分布にしたがうこととは、どのような集合\(A\subset \mathbb{R} \)を選んだ場合でも、「確率変数\(X\)の値が集合\(A\)に属する確率」と「確率変数\(Y\)の値が集合\(A\)に属する確率」が一致すること、すなわち、\begin{equation*}\forall A\subset \mathbb{R} :P\left( X\in A\right) =P\left( Y\in A\right)
\end{equation*}が成り立つこととして定義されます。\(X\)と\(Y \)が同一の確率分布にしたがうことを同一分布にしたがう(identically distributed)と言うこともできます。

 

同一分布にしたがう2つの連続型確率変数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられている状況において、連続型の同時確率変数\begin{equation*}\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}の同時確率分布が同時確率密度関数\begin{equation*}
f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値が区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in I\times J\right) =\int \int_{\left( x,y\right)
\in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}であるということです。

同時確率密度関数\(f_{XY}\)を周辺化することにより個々の確率変数\begin{eqnarray*}X &:&\Omega \rightarrow \mathbb{R} \\
Y &:&\Omega \rightarrow \mathbb{R} \end{eqnarray*}の周辺確率分布を記述する周辺確率密度関数\begin{eqnarray*}
f_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
f_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}が得られます。周辺確率密度関数の定義より、区間\(I,J\subset \mathbb{R} \)を任意に選んだとき、\begin{eqnarray}P\left( X\in I\right) &=&\int_{x\in I}f_{X}\left( x\right) dx \quad \cdots (1) \\
P\left( Y\in J\right) &=&\int_{y\in J}f_{Y}\left( y\right) dy \quad \cdots (2)
\end{eqnarray}という関係が成り立つことに注意してください。

先に定義したように、確率関数\(X,Y\)が同一分布にしたがうことは、\begin{equation*}\forall A\subset \mathbb{R} :P\left( X\in A\right) =P\left( Y\in A\right)
\end{equation*}が成り立つことを意味します。ただ、確率変数\(X,Y\)が連続型である場合の\(X\left( \Omega \right) \)および\(Y\left( \Omega \right) \)は区間もしくは互いに素な区間の和集合であるため、\(X\)と\(Y\)が同一分布にしたがうためには、\begin{equation*}\forall I\subset \mathbb{R} :P\left( X\in I\right) =P\left( Y\in I\right)
\end{equation*}が満たされていれば十分です。ただし、\(I\)は区間です。\(\left( 1\right) ,\left(2\right) \)を用いると、これを、\begin{equation*}\forall I\subset \mathbb{R} :\int_{x\in I}f_{X}\left( x\right) dx=\int_{y\in I}f_{Y}\left( y\right) dy
\end{equation*}と表現できます。そこで、以上の条件によって連続型の確率変数\(X,Y\)が同一分布にしたがうことの定義とします。

連続型確率変数が同一分布にしたがうことを以下のように表現することもできます。

命題(同一分布にしたがう連続型確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)が与えられており、さらに\(\left( X,Y\right) \)の同時確率分布が連続な同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって表現されているものとする。また、個々の確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)の周辺確率分布が周辺確率密度関数\(f_{X},f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとする。このとき、以下の条件\begin{equation*}\forall x\in \mathbb{R} :f_{X}\left( x\right) =f_{Y}\left( x\right)
\end{equation*}が成り立つことは、すなわち、\begin{equation*}
f_{X}=f_{Y}
\end{equation*}が成り立つことは、\(X\)と\(Y\)が同一分布にしたがうための必要十分条件である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(同一分布にしたがう連続型確率変数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left[ 0,1\right] ^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
4xy & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\\
&=&\int_{0}^{1}\left( 4xy\right) dy \\
&=&\left[ 2xy^{2}\right] _{0}^{1} \\
&=&2x
\end{eqnarray*}である一方、\(x\not\in X\left( \Omega\right) \)を満たす任意の\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{X}\left( x\right) =\left\{
\begin{array}{cl}
2x & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (1)
\end{equation}です。確率変数\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( y\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dx
\\
&=&\int_{0}^{1}\left( 4xy\right) dx \\
&=&\left[ 2x^{2}y\right] _{0}^{1} \\
&=&2y
\end{eqnarray*}である一方、\(y\not\in Y\left( \Omega\right) \)を満たす任意の\(y\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{Y}\left( y\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{Y}\left( y\right) =\left\{
\begin{array}{cl}
2y & \left( if\ y\in Y\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (2)
\end{equation}です。\(x\in \mathbb{R} \)を任意に選んだとき、\(\left( 1\right) ,\left( 2\right) \)より、\begin{equation*}f_{X}\left( x\right) =f_{Y}\left( x\right)
\end{equation*}が成り立つため、\(X\)と\(Y\)は同一分布にしたがうことが明らかになりました。

確率変数どうしは同一分布にしたがうとは限りません。以下の例より明らかです。

例(同一分布にしたがわない離散型確率変数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\wedge x+y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
24xy & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( if\ \left( x,y\right) \not\in \left( X,Y\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in X\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dy
\\
&=&\int_{0}^{1-x}24xydy \\
&=&\left[ 12xy^{2}\right] _{0}^{1-x} \\
&=&12x\left( 1-x\right) ^{2}
\end{eqnarray*}であり、\(x\not\in X\left( \Omega \right) \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{X}\left( x\right) =\left\{
\begin{array}{cl}
12x\left( 1-x\right) ^{2} & \left( if\ x\in X\left( \Omega \right) \right)
\\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (1)
\end{equation}です。確率変数\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in Y\left( \Omega\right) \)に対して定める値は、\begin{eqnarray*}f_{Y}\left( y\right) &=&\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right) dx
\\
&=&\int_{0}^{1-y}24xydx \\
&=&\left[ 12x^{2}y\right] _{0}^{1-y} \\
&=&12y\left( 1-y\right) ^{2}
\end{eqnarray*}であり、\(y\not\in Y\left( \Omega \right) \)に対して定める値は、\begin{equation*}f_{Y}\left( y\right) =0
\end{equation*}です。つまり、\begin{equation}
f_{Y}\left( y\right) =\left\{
\begin{array}{cl}
112y\left( 1-y\right) ^{2} & \left( if\ y\in Y\left( \Omega \right) \right)
\\
0 & \left( otherwise\right)
\end{array}\right. \quad \cdots (2)
\end{equation}です。点\(\frac{1}{2}\in \mathbb{R} \)に注目したとき、\(\left(1\right) ,\left( 2\right) \)より、\begin{eqnarray*}f_{X}\left( \frac{1}{2}\right) &=&\frac{12}{2}\left( 1-\frac{1}{2}\right)
^{2}=\frac{3}{2} \\
f_{Y}\left( \frac{1}{2}\right) &=&\frac{112}{2}\left( 1-\frac{1}{2}\right)
^{2}=14
\end{eqnarray*}であり、したがって、\begin{equation*}
f_{X}\left( \frac{1}{2}\right) \not=f_{Y}\left( \frac{1}{2}\right)
\end{equation*}が成り立つため、\(X\)と\(Y\)は同一分布にしたがわないことが明らかになりました。

 

分布関数を用いた連続型確率変数が同一分布にしたがうことの表現

確率変数が同一分布にしたがうことを分布関数を用いて表現することもできます。具体的には以下の通りです。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられている状況において、連続型の同時確率変数\begin{equation*}\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}の同時確率分布が同時分布関数\begin{equation*}
F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値がベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)以下である確率は、\begin{equation*}P\left( X\leq x\wedge Y\leq y\right) =F_{XY}\left( x,y\right) =\int_{-\infty
}^{x}\int_{-\infty }^{y}f_{XY}\left( s,t\right) dsdt
\end{equation*}です。同時分布関数\(F_{XY}\)を周辺化することにより個々の確率変数\begin{eqnarray*}X &:&\Omega \rightarrow \mathbb{R} \\
Y &:&\Omega \rightarrow \mathbb{R} \end{eqnarray*}の周辺確率分布を記述する周辺分布関数\begin{eqnarray*}
F_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
F_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}が得られます。周辺分布関数の定義より、点\(x,y\in \mathbb{R} \)を任意に選んだとき、\begin{eqnarray*}F_{X}\left( x\right) &=&P\left( X\leq x\right) =\int_{-\infty
}^{x}f_{X}\left( s\right) ds \\
F_{Y}\left( x\right) &=&P\left( Y\leq y\right) =\int_{-\infty
}^{y}f_{Y}\left( t\right) dt
\end{eqnarray*}という関係が成り立つことに注意してください。以上を踏まえたとき、\begin{equation*}
\forall x\in \mathbb{R} :F_{X}\left( x\right) =F_{Y}\left( y\right)
\end{equation*}が成り立つことは、\(X\)と\(Y\)が独立であるための必要十分条件になります。

命題(同一分布にしたがう連続型確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)が与えられており、さらに\(\left( X,Y\right) \)の同時確率分布が連続な同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって表現されているものとする。\(\left(X,Y\right) \)の同時分布関数が\(F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)であり、個々の確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)の周辺分布関数が\(F_{X},F_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)であるものとする。このとき、以下の条件\begin{equation*}\forall x\in \mathbb{R} :F_{X}\left( x\right) =F_{Y}\left( y\right)
\end{equation*}が成り立つことは、\(X\)と\(Y\)が同一分布にしたがうための必要十分条件である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(同一分布にしたがう連続型確率変数)
同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left[ 0,1\right] ^{2}
\end{equation*}であるとともに、同時分布関数\(F_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}F_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\vee y<0\right) \\
\frac{1}{2}x^{2}y+\frac{1}{2}xy^{3} & \left( if\ 0\leq x\leq 1\wedge 0\leq
y\leq 1\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x\leq 1\wedge y>1\right)
\\
\frac{1}{2}y+\frac{1}{2}y^{3} & \left( if\ x>1\wedge 0\leq y\leq 1\right)
\\
1 & \left( if\ x>1\wedge y>1\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{1}{2}x^{2}+\frac{1}{2}x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right. \quad \cdots (1)
\end{equation}を定めます。確率変数\(Y:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であり、周辺分布関数\(F_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in \mathbb{R} \)に対して、\begin{equation}F_{Y}\left( y\right) =\left\{
\begin{array}{cl}
0 & \left( if\ y<0\right) \\
\frac{1}{2}y+\frac{1}{2}y^{3} & \left( if\ 0\leq y\leq 1\right) \\
1 & \left( if\ y>1\right)
\end{array}\right. \quad \cdots (2)
\end{equation}を定めます。点\(\frac{1}{2}\in \mathbb{R} \)に注目したとき、\(\left(1\right) ,\left( 2\right) \)より、\begin{eqnarray*}F_{X}\left( \frac{1}{2}\right) &=&\frac{1}{2}\left( \frac{1}{2}\right) ^{2}+\frac{1}{2}\left( \frac{1}{2}\right) =\frac{3}{8} \\
F_{Y}\left( \frac{1}{2}\right) &=&\frac{1}{2}\left( \frac{1}{2}\right) +\frac{1}{2}\left( \frac{1}{2}\right) ^{3}=\frac{5}{16}
\end{eqnarray*}であり、したがって、\begin{equation*}
F_{X}\left( \frac{1}{2}\right) \not=F_{Y}\left( \frac{1}{2}\right)
\end{equation*}が成り立つため、\(X\)と\(Y\)は同一分布にしたがわないことが明らかになりました。

 

演習問題

問題(同一分布にしたがう連続型確率変数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left[ 0,1\right] ^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
1 & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega \right)
\right) \\
0 & \left( if\ \left( x,y\right) \not\in \left( X,Y\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)と\(Y\)は同一分布にしたがうでしょうか。議論してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(同一分布にしたがう連続型確率変数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left[ 0,1\right] ^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+y & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)と\(Y\)は同一分布にしたがうでしょうか。議論してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

連続型の確率変数

それぞれの標本点に対して実数を1つずつ割り当てる写像を確率変数と呼びます。値域が区間もしくは互いに素な区間の和集合であるような確率変数を連続型の確率変数と呼びます。

連続型確率変数の確率密度関数

連続型の確率変数の確率分布を確率質量関数を通じて表現することはできません。連続型の確率変数の確率分布を描写する際には確率密度関数と呼ばれる概念を利用します。