教材一覧
PROBABILITY DISTRIBUTION

離散型確率変数の分布関数(累積分布関数)

Share on twitter
Twitterで共有
Share on email
メールで共有

離散型の分布関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率変数\(X:\Omega\rightarrow \mathbb{R} \)が与えられている場合、確率変数\(X\)の値が点集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}と定義されます。すべての点集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)がそれぞれ明らかになっている場合、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びました。

離散型の確率変数\(X\)に対しては、それぞれの実数\(x\in \mathbb{R} \)に対して、\(X\)が値\(x\)をとる確率\begin{eqnarray*}f\left( x\right) &=&P\left( X=x\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) =x\right\}
\right)
\end{eqnarray*}を値として定める確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)を定義し、その上で、\(X\)の値が点集合\(A\subset \mathbb{R} \)に入る確率が、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f\left( x\right)
\end{equation*}として与えられることを明らかにしました。つまり、確率関数は離散型の確率変数の確率分布を表現する手段の1つです。ただ、離散型の確率変数の確率分布は、確率関数とは異なる概念を用いて表現することもできます。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられている場合、\(X\)の値がある値\(x\in \mathbb{R} \)以下である確率を\(P\left(X\leq x\right) \)と表記するのであれば、これは、\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}と定義されます。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、\begin{equation*}F\left( x\right) =P\left( X\leq x\right)
\end{equation*}を値として定める関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を\(X\)の分布関数(distribution function)や累積分布関数(cumulative distribution function)などと呼びます。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。さらに、確率変数\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとします。この場合の分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は以下のような形をしています。

命題(離散型の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられており、さらに\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとする。このとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F\left( x\right) =\sum_{x_{i}\leq x}f\left( x_{i}\right)
\end{equation*}を定める。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題は、分布関数\(F\)は確率関数\(f\)から定義可能であることを示唆します。つまり、分布関数\(F\)が定義域の点\(x\)に対して定める値は、確率関数\(f\)が\(x\)以下のそれぞれの点に対して定める値の総和と一致します。

例(離散型の分布関数)
「コインを1回投げて出た面を観察する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}となります。表が出た回数を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\left\{
\begin{array}{cc}
1 & \left( if\ \omega =\text{表}\right) \\
0 & \left( if\ \omega =\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1\right\}
\end{equation*}という有限集合であるため\(X\)は離散型の確率変数です。さらに、\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されており、これは、\begin{eqnarray*}f\left( 1\right) &=&p \\
f\left( 0\right) &=&1-p
\end{eqnarray*}を満たすとともに、それ以外の任意の\(x\in \mathbb{R} \backslash \left\{ 0,1\right\} \)に対して、\begin{equation*}f\left( x\right) =0
\end{equation*}を定めるものとします。このとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を満たします。
例(離散型の分布関数)
ある部品を製造している工場の製造ラインから「3つの製品をランダムに選んで不良品かチェックする」という試行において、\(i\ \left( =1,2,3\right) \)個目の製品の状態を\(x_{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( x_{1},x_{2},x_{3}\right) \ |\ \forall i\in \left\{
1,2,3\right\} :x_{i}\in \left\{ \text{正常品},\text{不良品}\right\} \right\}
\end{equation*}となります。不良品の個数を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\left(x_{1},x_{2},x_{3}\right) \in \Omega \)に対して、\begin{equation*}X\left( x_{1},x_{2},x_{3}\right) =\left\vert \left\{ x_{i}\ |\ x_{i}=\text{不良品}\right\} \right\vert
\end{equation*}を定めます。ただし、\(\left\vert A\right\vert \)は集合\(A\)の要素の個数を表します。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}という有限集合であるため\(X\)は離散型の確率変数です。さらに、\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されており、これは、\begin{eqnarray*}f\left( 0\right) &=&0.550 \\
f\left( 1\right) &=&0.250 \\
f\left( 2\right) &=&0.175 \\
f\left( 3\right) &=&0.025
\end{eqnarray*}を満たすとともに、それ以外の任意の\(x\in \mathbb{R} \backslash \left\{ 0,1,2,3\right\} \)に対して、\begin{equation*}f\left( x\right) =0
\end{equation*}を定めるものとします。このとき、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
0.550 & \left( if\ 0\leq x<1\right) \\
0.800 & \left( if\ 1\leq x<2\right) \\
0.975 & \left( if\ 2\leq x<3\right) \\
1 & \left( if\ x\geq 3\right)
\end{array}\right.
\end{equation*}を満たします。
例(定数確率変数の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と定数確率変数\(X:\Omega\rightarrow \mathbb{R} \)が与えられているものとします。つまり、ある\(c\in \mathbb{R} \)が存在して、任意の\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =c
\end{equation*}が成り立つということです。\(X\)の確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=c\right) \\
0 & \left( if\ x\not=c\right)
\end{array}\right.
\end{equation*}を定めるため、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<c\right) \\
1 & \left( if\ x\geq c\right)
\end{array}\right.
\end{equation*}を満たします。
例(ほとんど確実に一定の確率変数の分布関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)とほとんど確実に一定の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の確率変数\(f:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、ある\(c\in \mathbb{R} \)を用いて、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=c\right) \\
0 & \left( if\ x\not=c\right)
\end{array}\right.
\end{equation*}と表すことができるということです。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<c\right) \\
1 & \left( if\ x\geq c\right)
\end{array}\right.
\end{equation*}を満たします。つまり、ほとんど確実に一定の確率変数と定数関数は同一の分布関数を持っています。

 

分布関数がとり得る値の範囲

分布関数は\(0\)以上\(1\)以下の実数を値としてとります。

命題(分布関数がとり得る値の範囲)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}0\leq F\left( x\right) \leq 1
\end{equation*}を満たす。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

分布関数は単調増加

分布関数\(F\)は単調増加(単調非減少)関数です。

命題(分布関数は単調増加)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは任意の\(x,y\in \mathbb{R} \)に対して、\begin{equation*}x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right)
\end{equation*}を満たす。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

分布関数は右側連続

分布関数は定義域上の任意の点において右側連続です。

命題(分布関数の右側連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、これは\(\mathbb{R} \)上において右側連続である。すなわち、点\(a\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}\lim_{x\rightarrow a+}F\left( x\right) =F\left( a\right)
\end{equation*}が成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

離散型の確率変数に関して、分布関数は定義域上のそれぞれの点において左側連続であるとは限りません。以下の例より明らかです。

例(分布関数の左側連続性)
「コインを1回投げて出た面を観察する」という試行において表が出た回数を与える確率変数\(X\)を導入したとき、表が出る確率が\(p\in \left( 0,1\right) \)である場合、分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}となることを先に確認しました。この分布関数は、例えば点\(0\)において左側連続ではありません。実際、数列\(\left\{ x_{n}\right\} \)を、\begin{equation*}x_{n}=-\frac{1}{n}
\end{equation*}と定義したとき、\(\left\{x_{n}\right\} \)は\(0\)以下の点を項とするとともに\(0\)へ収束しますが、その一方で数列\(\left\{ F\left( x_{n}\right) \right\} \)の極限は、\begin{eqnarray*}\lim_{n\rightarrow \infty }F\left( x_{n}\right) &=&\lim_{n\rightarrow
\infty }0\quad \because x_{n}<0\text{および}F\text{の定義} \\
&=&0 \\
&\not=&1-p\quad \because p\in \left( 0,1\right) \\
&=&F\left( 0\right) \quad \because F\text{の定義}
\end{eqnarray*}すなわち、\begin{equation*}
\lim_{n\rightarrow \infty }F\left( x_{n}\right) \not=F\left( 0\right)
\end{equation*}を満たすからです。

 

分布関数の無限大における極限

分布関数\(F\left( x\right) \)は\(x\rightarrow+\infty \)の場合には\(1\)へ収束し、\(x\rightarrow -\infty \)の場合には\(0\)へ収束します。

命題(分布関数の右側連続性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、\begin{eqnarray*}&&\left( a\right) \ \lim_{x\rightarrow +\infty }F\left( x\right) =1 \\
&&\left( b\right) \ \lim_{x\rightarrow -\infty }F\left( x\right) =0
\end{eqnarray*}がともに成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

公理主義にもとづく分布関数の定義

分布関数\(F\)が満たす性質を明らかにしましたが、得られた結果を整理します。

命題(分布関数の性質)

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)と離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとする。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)が存在するならば、\begin{eqnarray*}&&\left( a\right) \ \forall x\in \mathbb{R} :F\left( x\right) =\sum_{x_{i}\leq x}f\left( x_{i}\right) \\
&&\left( b\right) \ \forall x\in \mathbb{R} :0\leq F\left( x\right) \leq 1 \\
&&\left( c\right) \ \forall x,y\in \mathbb{R} :\left( x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right) \right) \\
&&\left( d\right) \ F\text{は}\mathbb{R} \text{上で右側連続} \\
&&\left( e\right) \ \lim_{x\rightarrow +\infty }F\left( x\right) =1,\
\lim_{x\rightarrow -\infty }F\left( x\right) =0
\end{eqnarray*}が成り立つ。ただし、\(f:\mathbb{R} \rightarrow \mathbb{R} \)は確率関数である。

以上の性質を命題とみなすのではなく、逆に、以上の性質を満たす関数を分布関数と定義する場合もあります。つまり、公理主義的な旅から議論を行う場合、離散型の確率変数に関して、以上の性質を分布関数という概念を規定する公理として位置づけるということです。

例(分布関数)
「コインを1回投げて出た面を観察する」という試行に関連して、\begin{equation*}
F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
1-p & \left( if\ 0\leq x<1\right) \\
1 & \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を満たす分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を先に定義しましたが、任意の\(x\in \mathbb{R} \)について、\begin{equation*}0\leq F\left( x\right) \leq 1
\end{equation*}が確かに成立しています。また、任意の\(x,y\in \mathbb{R} \)について、\begin{equation*}x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right)
\end{equation*}が成立するとともに、\(F\)は\(\mathbb{R} \)上において右側連続です。一方、\(F\)は点\(0\)や点\(1\)において左側連続ではありません。また、\begin{eqnarray*}\lim_{x\rightarrow +\infty }F\left( x\right) &=&1 \\
\lim_{x\rightarrow -\infty }F\left( x\right) &=&0
\end{eqnarray*}がともに成立しています。したがって、\(F\)は分布関数であることが確認されました。
例(分布関数)
ある部品を製造している工場の製造ラインから「3つの製品をランダムに選んで不良品かチェックする」という試行に関連して、\begin{equation*}
F\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
0.550 & \left( if\ 0\leq x<1\right) \\
0.800 & \left( if\ 1\leq x<2\right) \\
0.975 & \left( if\ 2\leq x<3\right) \\
1 & \left( if\ x\geq 3\right)
\end{array}\right.
\end{equation*}を満たす分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を先に定義しましたが、任意の\(x\in \mathbb{R} \)について、\begin{equation*}0\leq F\left( x\right) \leq 1
\end{equation*}が確かに成立しています。また、任意の\(x,y\in \mathbb{R} \)について、\begin{equation*}x\leq y\Rightarrow F\left( x\right) \leq F\left( y\right)
\end{equation*}が成立するとともに、\(F\)は\(\mathbb{R} \)上において右側連続です。一方、\(F\)は点\(0,1,2,3\)において左側連続ではありません。また、\begin{eqnarray*}\lim_{x\rightarrow +\infty }F\left( x\right) &=&1 \\
\lim_{x\rightarrow -\infty }F\left( x\right) &=&0
\end{eqnarray*}がともに成立しています。したがって、\(F\)は分布関数であることが確認されました。

 

演習問題

問題(分布関数)
離散型の確率変数\(X\)の確率分布が、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{5-x}{10} & \left( if\ x=1,2,3,4\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定める確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって表されているものとします。分布関数\(F:\mathbb{R} \rightarrow \mathbb{R} \)を特定してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(分布関数)
三つ子が産まれる予定ですが性別はわかりません。「産まれた子供の性別を観察する」という試行において、男の子の人数を与える確率変数を定式化してください。さらに、男女は同じ程度の確かさで産まれるという前提のもと、先の確率変数の確率分布を描写する確率関数および分布関数を特定してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(分布関数)
「表が出るまで1枚のコインを繰り返し投げる」という試行において、はじめて表が出る回を与える確率変数を定式化してください。さらに、各回において表と裏が同じ程度の確かさで出るという前提のもと、先の確率変数の確率分布を描写する確率関数および分布関数を特定してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は分布関数を用いて様々な確率を求める方法を解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

確率変数

離散型の確率変数

確率に関して定量的な分析を行うためには、それぞれの標本点を数値として表現できれば何かと便利です。そこで、それぞれの標本点に対して実数を1つずつ定める写像を確率変数と呼びます。値域が有限集合または可算集合であるような確率変数を離散型の確率変数と呼びます。

確率質量関数

確率関数(確率質量関数)

離散型の確率変数が与えられたとき、それぞれの実数に対して、確率変数がその実数を値としてとる確率を特定する関数を確率関数や確率質量関数などと呼びます。

期待値

離散型確率変数の期待値

確率変数がとり得るそれぞれの値に対して、その値が実現する確率との積をとった上で、得られた積の総和をとると期待値と呼ばれる指標が得られます。

ベルヌーイ分布

ベルヌーイ分布

ある確率変数が1と0の二つの値のみをとり得るとともに、1を値としてとる確率がpで、0を値としてとる確率が1-pである場合には、その確率変数はパラメーターpのベルヌーイ分布にしたがうと言います。

分布関数

連続型の分布関数(累積分布関数)

連続型の確率変数の確率分布は確率密度関数によって表現されますが、分布関数と呼ばれる概念を用いて表現することもできます。これは確率変数の値がある一定の値以下をとる確率を与える関数です。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録