教材一覧
PROBABILITY DISTRIBUTION

連続型の分布関数(累積分布関数)

< 前のページ
次のページ >
Share on twitter
Twitterで共有
Share on email
メールで共有

連続型の分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率変数\(X:\Omega\rightarrow \mathbb{R} \)が与えられている場合、確率変数\(X\)の値が点集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}と定義されます。すべての点集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)がそれぞれ明らかになっている場合、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びました。

特に、連続型の確率変数\(X\)の値域\(X\left( \Omega \right) \)は区間もしくは互いに素な区間の和集合であるため、\(X\)の確率分布を記述するためには、それぞれの区間\(I\subset \mathbb{R} \)に対して、\(X\)の値が\(I\)に属する確率\begin{equation*}P\left( X\in I\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in I\right\} \right)
\end{equation*}を記述すれば十分です。そこで、それぞれの区間\(I\subset \mathbb{R} \)に対して、\begin{equation*}P\left( X\in I\right) =\int_{I}f\left( x\right) dx
\end{equation*}という関係を満たす関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)を定義し、これを\(X\)の確率密度関数と呼びました。つまり、確率密度関数は連続型の確率変数の確率分布を表現する手段の1つです。ただ、連続型の確率変数の確率分布は確率密度関数とは異なる概念を用いて表現することもできます。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられている場合、\(X\)の値がある値\(x\in \mathbb{R} \)以下である確率を\(P\left(X\leq x\right) \)と表記するのであれば、これは、\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}と定義されます。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、\begin{equation*}F\left( x\right) =P\left( X\leq x\right)
\end{equation*}を値として定める関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を\(X\)の分布関数(distribution function)や累積分布関数(cumulative distribution function)などと呼びました。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が区間もしくは互いに素な区間の和集合であるということです。さらに、確率変数\(X\)の確率分布が確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとします。この場合の分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は以下のような形をしています。

命題(離散型の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられており、さらに\(X\)の確率分布が確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとする。このとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F\left( x\right) =\int_{-\infty }^{x}f\left( t\right) dt
\end{equation*}を定める。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題より、分布関数\(F\)が定義域上の点\(x\)に対して定める値は、確率密度関数\(f\)を無限閉区間\((-\infty ,x]\)上で積分することで得られます。確率密度関数\(f\)が与えられれば、そこから分布関数\(F\)を導くことができるということです。

例(連続型の分布関数)
「\(0\)以上\(1\)以下の実数をランダムに\(1\)つ選ぶ」という試行の標本空間は、\begin{equation*}\Omega =\left[ 0,1\right] \end{equation*}となります。選ばれた数字を与える確率\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left[ 0,1\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F\left( x\right) =\int_{-\infty }^{x}f\left( t\right) dt
\end{equation*}を定めます。具体的には、\(x<0\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{-\infty }^{x}0dt\quad \because x<0 \\
&=&0
\end{eqnarray*}となり、\(0\leq x\leq 1\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{0}^{x}1dt \\
&=&\left[ t\right] _{0}^{x} \\
&=&x-0 \\
&=&x
\end{eqnarray*}となり、\(x>1\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{0}^{1}1dt \\
&=&\left[ t\right] _{0}^{1} \\
&=&1-0 \\
&=&1
\end{eqnarray*}となります。結果を整理すると、\begin{equation*}
F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}となります。
例(連続型の分布関数)
「エレベーターが到着するのが待つ」という試行において、エレベーターが到着するまでの経過時間を\(\omega \)で表記します。最長で\(2\)分間待つ必要があるのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left[ 0,2\right] \end{equation*}となります。エレベーターが到着するまでの経過時間を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left[ 0,2\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
x & \left( if\ 0\leq x\leq 1\right) \\
2-x & \left( if\ 1<x\leq 2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F\left( x\right) =\int_{-\infty }^{x}f\left( t\right) dt
\end{equation*}を定めます。具体的には、\(x<0\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{-\infty }^{x}0dt\quad \because x<0 \\
&=&0
\end{eqnarray*}となり、\(0\leq x\leq 1\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{0}^{x}tdt \\
&=&\left[ \frac{t^{2}}{2}\right] _{0}^{x} \\
&=&\frac{x^{2}}{2}-0 \\
&=&\frac{x^{2}}{2}
\end{eqnarray*}となり、\(1<x\leq 2\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{0}^{1}tdt+\int_{1}^{x}\left( 2-t\right) dt \\
&=&\left[ \frac{t^{2}}{2}\right] _{0}^{1}+\left[ 2t-\frac{t^{2}}{2}\right] _{1}^{x} \\
&=&\left( \frac{1}{2}-0\right) +\left( 2x-\frac{x^{2}}{2}\right) -\left( 2-\frac{1}{2}\right) \\
&=&-\frac{x^{2}}{2}+2x-1
\end{eqnarray*}となり、\(x>2\)を満たす任意の\(x\in \mathbb{R} \)に対しては、\begin{eqnarray*}F\left( x\right) &=&\int_{-\infty }^{x}f\left( t\right) dt \\
&=&\int_{0}^{1}tdt+\int_{1}^{2}\left( 2-t\right) dt \\
&=&\left[ \frac{t^{2}}{2}\right] _{0}^{1}+\left[ 2t-\frac{t^{2}}{2}\right] _{1}^{2} \\
&=&\frac{1}{2}+\left( 4-2\right) -\left( 2-\frac{1}{2}\right) \\
&=&1
\end{eqnarray*}となります。結果を整理すると、\begin{equation*}
F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{x^{2}}{2} & \left( if\ 0\leq x\leq 1\right) \\
-\frac{x^{2}}{2}+2x-1 & \left( if\ 1<x\leq 2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}となります。

 

分布関数がとり得る値の範囲

分布関数は\(0\)以上\(1\)以下の実数を値としてとります。

命題(分布関数がとり得る値の範囲)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}0\leq F\left( x\right) \leq 1
\end{equation*}を満たす。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

分布関数は単調増加

分布関数\(F\)は単調増加(単調非減少)関数です。

命題(分布関数は単調増加)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは任意の\(x,y\in \mathbb{R} \)に対して、\begin{equation*}x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right)
\end{equation*}を満たす。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

分布関数の連続性

連続型の確率変数の分布関数は定義域上の任意の点において連続です。離散型の確率変数の分布関数は右側連続である一方で左側連続であるとは限らないため、分布関数の連続性は連続型のケース特有の性質です。

命題(分布関数の連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは\(\mathbb{R} \)上において連続である。すなわち、点\(a\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}\lim_{x\rightarrow a}F\left( x\right) =F\left( a\right)
\end{equation*}が成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

分布関数の無限大における極限

分布関数\(F\left( x\right) \)は\(x\rightarrow+\infty \)の場合には\(1\)へ収束し、\(x\rightarrow -\infty \)の場合には\(0\)へ収束します。

命題(分布関数の右側連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、\begin{eqnarray*}&&\left( a\right) \ \lim_{x\rightarrow +\infty }F\left( x\right) =1 \\
&&\left( b\right) \ \lim_{x\rightarrow -\infty }F\left( x\right) =0
\end{eqnarray*}がともに成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

公理主義にもとづく分布関数の定義

分布関数\(F\)が満たす性質を明らかにしましたが、得られた結果を整理します。

命題(分布関数の性質)

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、\begin{eqnarray*}&&\left( a\right) \ \forall x\in \mathbb{R} :F\left( x\right) =\int_{-\infty }^{x}f\left( x\right) dx \\
&&\left( b\right) \ \forall x\in \mathbb{R} :0\leq F\left( x\right) \leq 1 \\
&&\left( c\right) \ \forall x,y\in \mathbb{R} :\left( x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right) \right) \\
&&\left( d\right) \ F\text{は}\mathbb{R} \text{上で連続} \\
&&\left( e\right) \ \lim_{x\rightarrow +\infty }F\left( x\right) =1,\
\lim_{x\rightarrow -\infty }F\left( x\right) =0
\end{eqnarray*}が成り立つ。ただし、\(f:\mathbb{R} \rightarrow \mathbb{R} \)は確率密度関数である。

以上の性質を命題とみなすのではなく、逆に、以上の性質を満たす関数を分布関数と定義する場合もあります。つまり、公理主義的な旅から議論を行う場合、連続型の確率変数に関して、以上の性質を分布関数という概念を規定する公理として位置づけるということです。

例(分布関数)
「\(0\)以上\(1\)以下の実数をランダムに\(1\)つ選ぶ」という試行に関連して、\begin{equation*}F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}を満たす分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を先に定義しましたが、任意の\(x\in \mathbb{R} \)について、\begin{equation*}0\leq F\left( x\right) \leq 1
\end{equation*}が確かに成立しています。また、任意の\(x,y\in \mathbb{R} \)について、\begin{equation*}x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right)
\end{equation*}が成立するとともに、\(F\)は\(\mathbb{R} \)上において連続です。また、\begin{eqnarray*}\lim_{x\rightarrow +\infty }F\left( x\right) &=&1 \\
\lim_{x\rightarrow -\infty }F\left( x\right) &=&0
\end{eqnarray*}がともに成立しています。したがって、\(F\)は分布関数であることが確認されました。
例(分布関数)
「エレベーターが到着するのが待つ」という試行に関連して、\begin{equation*}
F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{x^{2}}{2} & \left( if\ 0\leq x\leq 1\right) \\
-\frac{x^{2}}{2}+2x-1 & \left( if\ 1<x\leq 2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}を満たす分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を先に定義しましたが、任意の\(x\in \mathbb{R} \)について、\begin{equation*}0\leq F\left( x\right) \leq 1
\end{equation*}が確かに成立しています。また、任意の\(x,y\in \mathbb{R} \)について、\begin{equation*}x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right)
\end{equation*}が成立するとともに、\(F\)は\(\mathbb{R} \)上において連続です。また、\begin{eqnarray*}\lim_{x\rightarrow +\infty }F\left( x\right) &=&1 \\
\lim_{x\rightarrow -\infty }F\left( x\right) &=&0
\end{eqnarray*}がともに成立しています。したがって、\(F\)は分布関数であることが確認されました。

 

確率密度関数と分布関数の関係

先に確認したように、連続型の確率変数\(X\)の確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が与えられたとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation}F\left( x\right) =\int_{-\infty }^{x}f\left( t\right) dt \quad \cdots (1)
\end{equation}を定めます。つまり、分布関数\(F\)が定義域上の点\(x\)に対して定める値は、確率密度関数\(f\)を無限閉区間\((-\infty ,x]\)上で積分することにより得られます。確率密度関数\(f\)が与えられれば、そこから分布関数\(F\)を導くことができるということです。

確率密度関数\(f\)が点\(x\in \mathbb{R} \)において連続である場合には、\(\left( 1\right) \)と微分積分学の基本定理より、\begin{equation*}\frac{d}{dx}F\left( x\right) =f\left( x\right)
\end{equation*}という関係が成り立ちます。つまり、確率密度関数\(f\)が定義域上の点\(x\)に対して定める値は、分布関数\(F\)を点\(x\)において微分することで得られます。先とは逆に、分布関数\(F\)が与えられれば、そこから確率密度関数\(f\)を導くことができるということです。ただし、\(f\)が連続である点に限定されます。

命題(確率密度関数と分布関数の関係)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられており、さらに\(X\)の確率分布が確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとする。\(f\)が点\(x\in \mathbb{R} \)において連続であるならば、これと分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)の間には、\begin{equation*}\frac{d}{dx}F\left( x\right) =f\left( x\right)
\end{equation*}という関係が成り立つ。
例(確率密度関数と分布関数の関係)
「\(0\)以上\(1\)以下の実数をランダムに\(1\)つ選ぶ」という試行に関連して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を満たす確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)から、\begin{equation*}F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
x & \left( if\ 0\leq x\leq 1\right) \\
1 & \left( if\ x>1\right)
\end{array}\right.
\end{equation*}を満たす分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を導きました。\(f\)は点\(0,1\)以外の任意の点\(x\)において連続であるため、先の命題より、それらの点において\(F\left( x\right) \)を微分すれば\(f\left(x\right) \)が得られるはずです。実際、\(x<0\)を満たす任意の点\(x\in \mathbb{R} \)において、\begin{eqnarray*}\frac{d}{dx}F\left( x\right) &=&\frac{d}{dx}0\quad \because x<0 \\
&=&0 \\
&=&f\left( x\right) \quad \because x<0
\end{eqnarray*}が成り立ち、\(0<x<1\)を満たす任意の点\(x\in \mathbb{R} \)において、\begin{eqnarray*}\frac{d}{dx}F\left( x\right) &=&\frac{d}{dx}x\quad \because 0<x<1 \\
&=&1 \\
&=&f\left( x\right) \quad \because 0<x<1
\end{eqnarray*}が成り立ち、\(x>1\)を満たす任意の点\(x\in \mathbb{R} \)において、\begin{eqnarray*}\frac{d}{dx}F\left( x\right) &=&\frac{d}{dx}1\quad \because x>1 \\
&=&0 \\
&=&f\left( x\right) \quad \because x>1
\end{eqnarray*}が成り立ちます。ちなみに、点\(0,1\)において\(F\)は微分可能ではありません。
例(確率密度関数と分布関数の関係)
「エレベーターが到着するのが待つ」という試行に関連して、\begin{equation*}
f\left( x\right) =\left\{
\begin{array}{cl}
x & \left( if\ 0\leq x\leq 1\right) \\
2-x & \left( if\ 1<x\leq 2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を満たす確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)から、\begin{equation*}F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{x^{2}}{2} & \left( if\ 0\leq x\leq 1\right) \\
-\frac{x^{2}}{2}+2x-1 & \left( if\ 1<x\leq 2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}を満たす分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を導きました。\(f\)は\(\mathbb{R} \)上の任意の点において連続であるため、先の命題より、\(F\)を微分すれば\(f\)が得られるはずです(確認してください)。

次回は分布関数を用いて様々な確率を求める方法を解説します。

< 前のページ
次のページ >
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

分布関数

離散型確率変数の分布関数(累積分布関数)

離散型の確率変数の確率分布は確率(質量)関数によって表現されますが、分布関数と呼ばれる概念を用いて表現することもできます。これは確率変数の値がある一定の値以下をとる確率を与える関数です。

ベルヌーイ分布

ベルヌーイ分布

ある確率変数が1と0の二つの値のみをとり得るとともに、1を値としてとる確率がpで、0を値としてとる確率が1-pである場合には、その確率変数はパラメーターpのベルヌーイ分布にしたがうと言います。

確率変数

連続型の確率変数

値域が区間もしくは互いに素な区間の和集合であるような確率変数を連続型の確率変数と呼びます。

確率密度関数

確率密度関数

連続型の確率変数の確率分布を確率(質量)関数を通じて表現することはできません。そこで、連続型の確率関数の確率分布を描写する際には確率密度関数と呼ばれる概念を利用します。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録