教材一覧
教材一覧
教材検索

連続型の確率分布

連続型確率変数の分布関数(累積分布関数)

目次

Twitterで共有
メールで共有

連続型確率変数の確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が数直線\(\mathbb{R} \)上の区間であったり、互いに素な区間の和集合であるということです。確率変数\(X\)の確率分布を記述するためには、それぞれの区間\(I\subset \mathbb{R} \)に対して、\(X\)の値が\(I\)に属する確率\begin{equation*}P\left( X\in I\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in I\right\} \right)
\end{equation*}を特定すれば十分です。以上を踏まえた上で、任意の区間\(I\subset \mathbb{R} \)に対して、\begin{equation*}\left( a\right) \ P\left( X\in I\right) =\int_{I}f_{X}\left( x\right) dx
\end{equation*}を満たすとともに、\begin{eqnarray*}
&&\left( b\right) \ \forall x\in \mathbb{R} :f_{X}\left( x\right) \geq 0 \\
&&\left( c\right) \ \int_{-\infty }^{+\infty }f_{X}\left( x\right) dx=1
\end{eqnarray*}をともに満たす確率密度関数\begin{equation*}
f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義しました。つまり、確率密度関数は連続型の確率変数の確率分布を表現する手段の1つです。ただ、連続型の確率変数の確率分布は、確率密度関数とは異なる概念を用いて表現することもできます。順番に解説します。

 

連続型確率変数の分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。確率変数\(X\)が特定の実数\(x\in \mathbb{R} \)以下の値をとる確率を、\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}で表記します。これをどのように評価すればいいでしょうか。確率変数\(X\)はそれぞれの標本点\(\omega \in \Omega \)に対して実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定めるため、「確率変数\(X\)の値が\(x\)以下である」という事象は、\(X\left( \omega \right) \leq x\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が\(x\)以下である」という事象が起こる確率は、\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}となります。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、確率変数\(X\)が\(x\)以下の値をとる確率\begin{equation*}F_{X}\left( x\right) =P\left( X\leq x\right)
\end{equation*}を特定する関数\begin{equation*}
F_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義し、これを\(X\)の分布関数(distribution function)や累積分布関数(cumulative distribution function)などと呼びます。

連続型の確率変数\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられている場合には、点\(x\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt
\end{equation*}という関係が成り立つことが保証されます。つまり、確率密度関数\(f_{X}\)を無限閉区間\((-\infty ,x]\)上で積分すれば\(F_{X}\left( x\right) \)が得られるということです。言い換えると、連続型の確率変数\(X\)に関しては、分布関数\(F_{X}\)が確率密度関数\(f_{X}\)から導出可能であるということです。

命題(連続型の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。このとき、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題は、分布関数\(F_{X}\)が確率密度関数\(f_{X}\)から導出可能であることを示唆します。つまり、分布関数\(F_{X}\)が点\(x\)に対して定める値は、確率密度関数\(f_{X}\)を無限閉区間\((-\infty ,x]\)上で積分することで得られる値と一致します。

例(連続型の分布関数)
「\(0\)以上\(1\)以下の実数をランダムに\(1\)つ選ぶ」という試行の標本空間は、\begin{equation*}\Omega =\left[ 0,1\right] \end{equation*}となります。選ばれた数字を与える確率\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt
\end{equation*}を定めます。具体的には、\(x<0\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{x}0dt\quad \because x<0 \\
&=&0
\end{eqnarray*}となり、\(0\leq x\leq 1\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{0}f_{X}\left( t\right) dt+\int_{0}^{x}f_{X}\left(
t\right) dt\quad \because 0\leq x\leq 1 \\
&=&\int_{-\infty }^{0}0dt+\int_{0}^{x}1dt \\
&=&\left[ t\right] _{0}^{x} \\
&=&x-0 \\
&=&x
\end{eqnarray*}となり、\(x>1\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{0}f_{X}\left( t\right) dt+\int_{0}^{1}f_{X}\left(
t\right) dt+\int_{1}^{x}f_{X}\left( t\right) dt\quad \because x>1 \\
&=&\int_{-\infty }^{0}0dt+\int_{0}^{1}1dt+\int_{1}^{x}0dt \\
&=&\left[ t\right] _{0}^{1} \\
&=&1-0 \\
&=&1
\end{eqnarray*}となります。結果を整理すると、\begin{equation*}
F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}となります。

例(連続型の分布関数)
「エレベーターが到着するのが待つ」という試行において、エレベーターが到着するまでの経過時間を\(\omega \)で表記します。最長で\(2\)分間待つ必要があるのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left[ 0,2\right] \end{equation*}となります。エレベーターが到着するまでの経過時間を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,2\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
x & \left( if\ 0\leq x\leq 1\right) \\
2-x & \left( if\ 1<x\leq 2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt
\end{equation*}を定めます。具体的には、\(x<0\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{x}0dt\quad \because x<0 \\
&=&0
\end{eqnarray*}となり、\(0\leq x\leq 1\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{0}f_{X}\left( t\right) dt+\int_{0}^{x}f_{X}\left(
t\right) dt\quad \because 0\leq x\leq 1 \\
&=&\int_{-\infty }^{0}0dt+\int_{0}^{x}tdt \\
&=&\left[ \frac{t^{2}}{2}\right] _{0}^{x} \\
&=&\frac{x^{2}}{2}-0 \\
&=&\frac{x^{2}}{2}
\end{eqnarray*}となり、\(1<x\leq 2\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{0}f_{X}\left( t\right) dt+\int_{0}^{1}f_{X}\left(
t\right) dt+\int_{1}^{x}f_{X}\left( t\right) dt\quad \because 1<x\leq 2 \\
&=&\int_{-\infty }^{0}0dt+\int_{0}^{1}tdt+\int_{1}^{x}\left( 2-t\right) dt \\
&=&\left[ \frac{t^{2}}{2}\right] _{0}^{1}+\left[ 2t-\frac{t^{2}}{2}\right] _{1}^{x} \\
&=&\left( \frac{1}{2}-0\right) +\left( 2x-\frac{x^{2}}{2}\right) -\left( 2-\frac{1}{2}\right) \\
&=&-\frac{x^{2}}{2}+2x-1
\end{eqnarray*}となり、\(x>2\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F_{X}\left( x\right) &=&\int_{-\infty }^{x}f_{X}\left( t\right) dt \\
&=&\int_{-\infty }^{0}f_{X}\left( t\right) dt+\int_{0}^{1}f_{X}\left(
t\right) dt+\int_{1}^{2}f_{X}\left( t\right) dt+\int_{2}^{x}f_{X}\left(
t\right) dt\quad \because x>2 \\
&=&\int_{-\infty }^{0}0dt+\int_{0}^{1}tdt+\int_{1}^{2}\left( 2-t\right)
dt+\int_{2}^{x}0dt \\
&=&\left[ \frac{t^{2}}{2}\right] _{0}^{1}+\left[ 2t-\frac{t^{2}}{2}\right] _{1}^{2} \\
&=&\frac{1}{2}+\left( 4-2\right) -\left( 2-\frac{1}{2}\right) \\
&=&1
\end{eqnarray*}となります。結果を整理すると、\begin{equation*}
F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{x^{2}}{2} & \left( if\ 0\leq x\leq 1\right) \\
-\frac{x^{2}}{2}+2x-1 & \left( if\ 1<x\leq 2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}となります。

 

分布関数がとり得る値の範囲

連続型の確率変数の分布関数は\(0\)以上\(1\)以下の実数を値としてとります。

命題(分布関数がとり得る値の範囲)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}0\leq F_{X}\left( x\right) \leq 1
\end{equation*}を満たす。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数がとり得る値の範囲)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}を定めるものとします。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}0\leq F_{X}\left( x\right) \leq 1
\end{equation*}が成立しています。

 

分布関数は単調増加

連続型の確率変数の分布関数は単調増加(単調非減少)関数です。

命題(分布関数は単調増加)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは任意の\(x,y\in \mathbb{R} \)に対して、\begin{equation*}x\leq y\Rightarrow F_{X}\left( x\right) \leq F_{X}\left( y\right)
\end{equation*}を満たす。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数は単調増加)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}を定めるものとします。\begin{equation*}
0\leq x\leq 1
\end{equation*}であることを踏まえると、\(x\leq y\)を満たす\(x,y\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}F_{X}\left( x\right) \leq F_{X}\left( y\right)
\end{equation*}が成り立つため、\(F_{X}\)は\(\mathbb{R} \)上で単調増加です。

 

分布関数の連続性

連続型の確率変数の分布関数は定義域上の任意の点において連続です。離散型の確率変数の分布関数は右側連続である一方で左側連続であるとは限らないため、分布関数の連続性は連続型のケース特有の性質です。

命題(分布関数の連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは\(\mathbb{R} \)上において連続である。すなわち、点\(a\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}\lim_{x\rightarrow a}F_{X}\left( x\right) =F_{X}\left( a\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数の連続性)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(x<0\)を満たす\(x\)上で\(F_{X}\)は定数関数\(0\)であるため、\(F_{X}\)は\(x<0\)を満たす\(x\)上で連続です。点\(0\)については、\begin{eqnarray*}\lim_{x\rightarrow 0-}F_{X}\left( x\right) &=&\lim_{x\rightarrow 0-}0=0 \\
\lim_{x\rightarrow 0+}F_{X}\left( x\right) &=&\lim_{x\rightarrow 0+}x=0 \\
F_{X}\left( 0\right) &=&0
\end{eqnarray*}すなわち、\begin{equation*}
\lim_{x\rightarrow 0-}F_{X}\left( x\right) =\lim_{x\rightarrow
0+}F_{X}\left( x\right) =F_{X}\left( 0\right)
\end{equation*}が成り立つため、\(F_{X}\)は点\(0\)において連続です。\(0<x<1\)を満たす\(x\)上で\(F_{X}\)は恒等関数\(x\)であるため、\(F_{X}\)は\(0<x<1\)を満たす\(x\)上で連続です。点\(1\)については、\begin{eqnarray*}\lim_{x\rightarrow 1-}F_{X}\left( x\right) &=&\lim_{x\rightarrow 1-}x=1 \\
\lim_{x\rightarrow 1+}F_{X}\left( x\right) &=&\lim_{x\rightarrow 1+}1=1 \\
F_{X}\left( 1\right) &=&1
\end{eqnarray*}すなわち、\begin{equation*}
\lim_{x\rightarrow 1-}F_{X}\left( x\right) =\lim_{x\rightarrow
1+}F_{X}\left( x\right) =F_{X}\left( 1\right)
\end{equation*}が成り立つため、\(F_{X}\)は点\(1\)において連続です。\(x>1\)を満たす\(x\)上で\(F_{X}\)は定数関数\(1\)であるため、\(F_{X}\)は\(x>1\)を満たす\(x\)上で連続です。以上より、\(F_{X}\)は\(\mathbb{R} \)上で連続であることが明らかになりました。

 

分布関数の無限大における極限

連続型の確率変数の分布関数は正の無限大において\(1\)へ収束し、負の無限大において\(0\)へ収束します。

命題(分布関数の右側連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、\begin{eqnarray*}&&\left( a\right) \ \lim_{x\rightarrow +\infty }F_{X}\left( x\right) =1 \\
&&\left( b\right) \ \lim_{x\rightarrow -\infty }F_{X}\left( x\right) =0
\end{eqnarray*}がともに成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数の無限大における極限)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}を定めるものとします。正の無限大における\(F_{X}\)の極限は、\begin{eqnarray*}\lim_{x\rightarrow +\infty }F_{X}\left( x\right) &=&\lim_{x\rightarrow
+\infty }1\quad \because F_{X}\text{の定義} \\
&=&1\quad \because \text{定数関数の正の無限大における極限}
\end{eqnarray*}であり、負の無限大における\(F_{X}\)の極限は、\begin{eqnarray*}\lim_{x\rightarrow -\infty }F_{X}\left( x\right) &=&\lim_{x\rightarrow
-\infty }0\quad \because F_{X}\text{の定義} \\
&=&0\quad \because \text{定数関数の負の無限大における極限}
\end{eqnarray*}となります。

 

分布関数から確率密度関数を導く方法

繰り返しになりますが、連続型の確率変数\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられたとき、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation}F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt \quad \cdots (1)
\end{equation}を定めます。つまり、分布関数\(F_{X}\)が定義域上の点\(x\)に対して定める値は、確率密度関数\(f_{X}\)を無限閉区間\((-\infty ,x]\)上で積分することにより得られます。確率密度関数\(f_{X}\)が与えられれば、そこから分布関数\(F_{X}\)を導くことができるということです。

連続型の確率変数\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が点\(x\in \mathbb{R} \)において連続である場合には、\(\left( 1\right) \)および微分積分学の基本定理より、\begin{equation*}\frac{d}{dx}F_{X}\left( x\right) =f_{X}\left( x\right)
\end{equation*}が成り立ちます。つまり、確率密度関数\(f_{X}\)が定義域上の点\(x\)に対して定める値は、分布関数\(F_{X}\)の点\(x\)における微分係数と一致します。先とは逆に、分布関数\(F_{X}\)が与えられれば、そこから確率密度関数\(f_{X}\)を導くことができるということです。ただし、\(f_{X}\)が連続である点に限定されます。

命題(確率密度関数と分布関数の関係)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられており、さらに\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとする。\(f_{X}\)が点\(x\in \mathbb{R} \)において連続であるならば、これと分布関数\(F_{X}:\mathbb{R}