教材一覧
教材一覧
教材検索

離散型の確率分布

離散型確率変数の分布関数(累積分布関数)

目次

Twitterで共有
メールで共有

離散型確率変数の確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}であり、特に、確率変数\(X\)が特定の値\(x\in \mathbb{R} \)をとる確率は、\begin{eqnarray*}P\left( X=x\right) &=&P\left( X\in \left\{ x\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) =x\right\}
\right)
\end{eqnarray*}です。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =P\left( X=x\right)
\end{equation*}を定める確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を定義し、さらに、集合\(A\subset \mathbb{R} \)を任意に選んだとき、\begin{equation}P\left( X\in A\right) =\sum_{x\in A}f_{X}\left( x\right) \quad \cdots (1)
\end{equation}という関係が成り立つことを示しました。

それぞれの集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)が明らかになっている場合、そのような情報の集まりを確率変数\(X\)の確率分布と呼びます。離散型の確率変数\(X\)に対して確率質量関数\(f_{X}\)が与えられれば、上の関係を用いて任意の集合\(A\)に関する確率\(P\left( X\in A\right) \)を特定できるため、確率質量関数は離散型の確率変数の確率分布を表現する手段の1つです。ただ、離散型の確率変数の確率分布は、確率質量関数とは異なる概念を用いて表現することもできます。順番に解説します。

 

離散型確率変数の分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。確率変数\(X\)が特定の実数\(x\in \mathbb{R} \)以下の値をとる確率を、\begin{equation*}P\left( X\leq x\right)
\end{equation*}で表記します。これをどのように評価すればよいでしょうか。確率変数\(X\)はそれぞれの標本点\(\omega \in \Omega \)に対して実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定めるため、「確率変数\(X\)の値が\(x\)以下である」という事象は、\(X\left( \omega \right) \leq x\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が\(x\)以下である」という事象が起こる確率は、\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}となります。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、確率変数\(X\)が\(x\)以下の値をとる確率\begin{equation*}F_{X}\left( x\right) =P\left( X\leq x\right)
\end{equation*}を特定する関数\begin{equation*}
F_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義し、これを\(X\)の分布関数(distribution function)や累積分布関数(cumulative distribution function)などと呼びます。

離散型の確率変数\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられている場合には、点\(x\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}F_{X}\left( x\right) =\sum_{x_{i}\leq x}f_{X}\left( x_{i}\right)
\end{equation*}という関係が成り立つことが保証されます。つまり、\(x\)以下のそれぞれの値\(x_{i}\)に対して\(f_{X}\)が定める値を特定し、それらの総和をとれば\(F_{X}\left( x\right) \)が得られるということです。言い換えると、離散型の確率変数\(X\)に関しては、分布関数\(F_{X}\)が確率質量関数\(f_{X}\)から導出可能であるということです。

命題(離散型の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。このとき、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\sum_{x_{i}\leq x}f_{X}\left( x_{i}\right)
\end{equation*}を定める。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題は、分布関数\(F_{X}\)が確率質量関数\(f_{X}\)から導出可能であることを示唆します。つまり、分布関数\(F_{X}\)が点\(x\)に対して定める値は、確率関数\(f_{X}\)が\(x\)以下のそれぞれの点に対して定める値の総和と一致します。

例(離散型の分布関数)
「コインを1回投げて出た面を観察する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}となります。表が出た回数を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\left\{
\begin{array}{cc}
1 & \left( if\ \omega =\text{表}\right) \\
0 & \left( if\ \omega =\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}という有限集合であるため\(X\)は離散型の確率変数です。表が出る確率を表す定数を\(p\in \left[ 0,1\right] \)とするとき、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}f_{X}\left( 1\right) &=&p \\
f_{X}\left( 0\right) &=&1-p
\end{eqnarray*}を満たすとともに、それ以外の任意の\(x\in \mathbb{R} \backslash \left\{ 0,1\right\} \)に対して、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}を定めるものとします。すると、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を満たします。

例(離散型の分布関数)
ある部品を製造している工場の製造ラインから「3つの製品をランダムに選んで不良品かチェックする」という試行において、\(i\ \left( =1,2,3\right) \)個目の製品の状態を\(x_{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( x_{1},x_{2},x_{3}\right) \ |\ \forall i\in \left\{
1,2,3\right\} :x_{i}\in \left\{ \text{正常品},\text{不良品}\right\} \right\}
\end{equation*}となります。不良品の個数を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\left(x_{1},x_{2},x_{3}\right) \in \Omega \)に対して、\begin{equation*}X\left( x_{1},x_{2},x_{3}\right) =\left\vert \left\{ x_{i}\ |\ x_{i}=\text{不良品}\right\} \right\vert
\end{equation*}を定めます。ただし、\(\left\vert A\right\vert \)は集合\(A\)の要素の個数を表します。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}という有限集合であるため\(X\)は離散型の確率変数です。さらに、\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されており、これは、\begin{eqnarray*}f_{X}\left( 0\right) &=&0.550 \\
f_{X}\left( 1\right) &=&0.250 \\
f_{X}\left( 2\right) &=&0.175 \\
f_{X}\left( 3\right) &=&0.025
\end{eqnarray*}を満たすとともに、それ以外の任意の\(x\in \mathbb{R} \backslash \left\{ 0,1,2,3\right\} \)に対して、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}を定めるものとします。すると、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
0.550 & \left( if\ 0\leq x<1\right) \\
0.800 & \left( if\ 1\leq x<2\right) \\
0.975 & \left( if\ 2\leq x<3\right) \\
1 & \left( if\ x\geq 3\right)
\end{array}\right.
\end{equation*}を満たします。

例(定数確率変数の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて定数関数であるような確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、ある\(c\in \mathbb{R} \)が存在して、任意の\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =c
\end{equation*}が成り立つということです。\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=c\right) \\
0 & \left( if\ x\not=c\right)
\end{array}\right.
\end{equation*}を定めるため、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<c\right) \\
1 & \left( if\ x\geq c\right)
\end{array}\right.
\end{equation*}を満たします。

例(ほとんど確実に一定の確率変数の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)とほとんど確実に一定の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、ある\(c\in \mathbb{R} \)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=c\right) \\
0 & \left( if\ x\not=c\right)
\end{array}\right.
\end{equation*}と表すことができるということです。先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<c\right) \\
1 & \left( if\ x\geq c\right)
\end{array}\right.
\end{equation*}を満たします。つまり、ほとんど確実に一定の確率変数と定数関数であるような確率変数は同一の分布関数を持っています。

 

分布関数がとり得る値の範囲

離散型の確率変数の分布関数は\(0\)以上\(1\)以下の実数を値としてとります。

命題(分布関数がとり得る値の範囲)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}0\leq F_{X}\left( x\right) \leq 1
\end{equation*}を満たす。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数がとり得る値の範囲)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して定める値がある定数\(p\in \left[ 0,1\right] \)を用いて、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}と表されるものとします。任意\(x\in \mathbb{R} \)に対して、\begin{equation*}0\leq F_{X}\left( x\right) \leq 1
\end{equation*}が成立しています。

 

分布関数は単調増加

離散型の確率変数の分布関数は単調増加(単調非減少)関数です。

命題(分布関数は単調増加)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、任意の\(x,y\in \mathbb{R} \)に対して、\begin{equation*}x\leq y\Rightarrow F_{X}\left( x\right) \leq F_{X}\left( y\right)
\end{equation*}を満たす。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数は単調増加)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して定める値がある定数\(p\in \left[ 0,1\right] \)を用いて、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}と表されるものとします。\begin{equation*}
0\leq 1-p\leq 1
\end{equation*}であることを踏まえると、\(x\leq y\)を満たす\(x,y\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}F_{X}\left( x\right) \leq F_{X}\left( y\right)
\end{equation*}が成り立つため、\(F_{X}\)は\(\mathbb{R} \)上で単調増加です。

 

分布関数は右側連続

離散型の確率変数の分布関数は定義域上の任意の点において右側連続です。

命題(分布関数の右側連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは\(\mathbb{R} \)上において右側連続である。すなわち、点\(a\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}\lim_{x\rightarrow a+}F_{X}\left( x\right) =F_{X}\left( a\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数は右側連続)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して定める値がある定数\(p\in \left[ 0,1\right] \)を用いて、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}と表されるものとします。\(x<0\)を満たす\(x\)上で\(F_{X}\)は定数関数\(0\)であるため、\(F_{X}\)は\(x<0\)を満たす\(x\)上で右側連続です。点\(0\)については、\begin{eqnarray*}\lim_{x\rightarrow 0+}F_{X}\left( x\right) &=&\lim_{x\rightarrow 0+}\left(
1-p\right) \quad \because F_{X}\text{の定義} \\
&=&1-p \\
&=&F_{X}\left( 0\right) \quad \because F_{X}\text{の定義}
\end{eqnarray*}が成り立つため、\(F_{X}\)は点\(0\)において右側連続です。\(0<x<1\)を満たす\(x\)上で\(F_{X}\)は定数関数\(1-p\)であるため、\(F_{X}\)は\(0<x<1\)を満たす\(x\)上で右側連続です。点\(1\)については、\begin{eqnarray*}\lim_{x\rightarrow 1+}F_{X}\left( x\right) &=&\lim_{x\rightarrow 1+}1\quad
\because F_{X}\text{の定義} \\
&=&1 \\
&=&F_{X}\left( 1\right) \quad \because F_{X}\text{の定義}
\end{eqnarray*}が成り立つため、\(F_{X}\)は点\(1\)において右側連続です。\(x>1\)を満たす\(x\)上で\(F_{X}\)は定数関数\(1\)であるため、\(F_{X}\)は\(x>1\)を満たす\(x\)上で右側連続です。以上より、\(F_{X}\)は\(\mathbb{R} \)上で右側連続であることが明らかになりました。

離散型の確率変数に関して、分布関数は定義域上のそれぞれの点において左側連続であるとは限りません。以下の例より明らかです。

例(左側連続ではない分布関数)
「コインを1回投げて出た面を観察する」という試行において表が出た回数を与える確率変数\(X\)を導入したとき、表が出る確率が\(p\in \left( 0,1\right) \)である場合、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}となることを先に確認しました。この分布関数は点\(0\)において左側連続ではありません。\(F_{X}\)の点\(0\)における左側極限は、\begin{eqnarray*}\lim_{x\rightarrow 0-}F_{X}\left( x\right) &=&\lim_{x\rightarrow 0-}0\quad
\because F_{X}\text{の定義} \\
&=&0\quad \because \text{定数関数の左側極限}
\end{eqnarray*}である一方で、\(F_{X}\)の点\(0\)における値は、\begin{equation*}F_{X}\left( 0\right) =1-p
\end{equation*}であるため、これと\(p\in \left( 0,1\right) \)より、\begin{equation*}\lim_{x\rightarrow 0-}F_{X}\left( x\right) \not=F_{X}\left( 0\right)
\end{equation*}が成り立つからです。

 

分布関数の無限大における極限

離散型の確率変数の分布関数は正の無限大において\(1\)へ収束し、負の無限大において\(0\)へ収束します

命題(分布関数の無限大における極限)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、\begin{eqnarray*}&&\left( a\right) \ \lim_{x\rightarrow +\infty }F_{X}\left( x\right) =1 \\
&&\left( b\right) \ \lim_{x\rightarrow -\infty }F_{X}\left( x\right) =0
\end{eqnarray*}がともに成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(分布関数の無限大における極限)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}であるとともに、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して定める値がある定数\(p\in \left[ 0,1\right] \)を用いて、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}と表されるものとします。このとき、正の無限大における\(F_{X}\)の極限は、\begin{eqnarray*}\lim_{x\rightarrow +\infty }F_{X}\left( x\right) &=&\lim_{x\rightarrow
+\infty }1\quad \because F_{X}\text{の定義} \\
&=&1\quad \because \text{定数関数の正の無限大における極限}
\end{eqnarray*}であり、負の無限大における\(F_{X}\)の極限は、\begin{eqnarray*}\lim_{x\rightarrow -\infty }F_{X}\left( x\right) &=&\lim_{x\rightarrow
-\infty }0\quad \because F_{X}\text{の定義} \\
&=&0\quad \because \text{定数関数の負の無限大における極限}
\end{eqnarray*}となります。

 

演習問題

問題(分布関数)