教材一覧
教材一覧
教材検索

離散型の確率分布

離散型確率変数の確率質量関数

目次

Twitterで共有
メールで共有

離散型確率変数の確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。\(X\)の値がある集合\(A\subset \mathbb{R} \)に属する確率を、\begin{equation*}P\left( X\in A\right)
\end{equation*}と表記するものと定めます。これをどのように評価すればよいでしょうか。

確率変数\(X\)はそれぞれの標本点\(\omega \in \Omega \)に対して実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定めるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}となります。

それぞれの集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)が明らかになっている場合には、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びます。確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられている場合には、すなわち試行によって起こり得るそれぞれの事象の確率が分かっている場合には、何らかの確率変数を導入したとき、その確率変数の確率分布もまた明らかになるということです。

 

離散型確率変数の確率質量関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。繰り返しになりますが、確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}と定義されます。より特殊なケースとして、確率変数\(X\)が特定の値\(x\in \mathbb{R} \)をとる確率を、\begin{equation*}P\left( X=x\right)
\end{equation*}と表記した上で、これを\(X\)の値が1点集合\(\left\{x\right\} \)に属する確率と同一視します。つまり、\begin{eqnarray*}P\left( X=x\right) &=&P\left( X\in \left\{ x\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in \left\{
x\right\} \right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) =x\right\}
\right)
\end{eqnarray*}です。以上を踏まえた上で、それぞれの実数\(x\in \mathbb{R} \)に対して、離散型の確率変数\(X\)が値\(x\)をとる確率\begin{equation*}f_{X}\left( x\right) =P\left( X=x\right)
\end{equation*}を特定する関数\begin{equation*}
f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}を定義し、これを\(X\)の確率質量関数(probability mass function)や確率関数(probability function)などと呼びます。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)を構成する確率測度\(P\)もまた確率関数と呼ばれることもありますが、これは上の意味での確率関数\(f\)とは異なる概念です。確率関数という用語がどちらの意味で使われているかは文脈から判断する必要があります。

例(確率質量関数)
「コインを1回投げて出た面を観察する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}となります。「表が出れば1万円をもらえる一方で裏が出れば1万円を支払う」というギャンブルを想定する場合、ギャンブルの結果を表現する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\left\{
\begin{array}{cc}
10000 & \left( if\ \omega =\text{表}\right) \\
-10000 & \left( if\ \omega =\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 10000,-10000\right\}
\end{equation*}です。標本空間\(\Omega \)には\(2\)個の標本点が属しますが、仮に、これらが同じ程度の確かさで起こり得るのであれば(コインの表と裏が等確率で出るならば)、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{2} & \left( if\ x=10000,-10000\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。

例(確率質量関数)
「コインを3回投げて表が出た回数を観察する」という試行において、1回目に出た面を\(x_{1}\)で、2回目に出た面を\(x_{2}\)で、3回目に出た面を\(x_{3}\)でそれぞれ表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( x_{1},x_{2},x_{3}\right) \ |\ \forall i\in \left\{
1,2,3\right\} :x_{i}\in \left\{ \text{表},\text{裏}\right\}
\right\}
\end{equation*}となります。それぞれの標本点\(\left( x_{1},x_{2},x_{3}\right) \in\Omega \)に対して、\begin{equation*}X\left( x_{1},x_{2},x_{3}\right) =\left( x_{1},x_{2},x_{3}\right) \text{において表が出た回数}
\end{equation*}を定める確率変数\(X:\Omega\rightarrow \mathbb{R} \)を定義します。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}です。標本空間\(\Omega \)には\(2^{3}\)個の標本点が属しますが、仮に、これらがいずれも同じ程度の確かさで起こり得るのであれば、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\binom{3}{x}\left( \frac{1}{2}\right) ^{3} & \left( if\ x=0,1,2,3\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。

例(確率質量関数)
「表が出るまでコインを投げ続ける」という試行の標本空間は、\begin{equation*}
\Omega =\{\text{表},\text{裏表},\text{裏裏表},\text{裏裏裏表},\cdots \}
\end{equation*}となります。それぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega \text{において初めて表が出た回数}
\end{equation*}を定める確率変数\(X:\Omega\rightarrow \mathbb{R} \)を定義します。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1,2,3,\cdots \right\}
\end{equation*}です。仮に、各回のコイン投げにおいて表と裏が等確率で出るのであれば、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\left( \frac{1}{2}\right) ^{x-1}\left( \frac{1}{2}\right) & \left( if\
x=1,2,3,\cdots \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。

例(定数確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて定数関数であるような確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、ある\(c\in \mathbb{R} \)が存在して、任意の\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =c
\end{equation*}が成り立つということです。確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=c\right) \\
0 & \left( if\ x\not=c\right)
\end{array}\right.
\end{equation*}を定めます。

例(ほとんど確実に一定の確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。先の例とは異なり、\(X\)は定数関数である必要はありません。確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、ある\(c\in \mathbb{R} \)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=c\right) \\
0 & \left( if\ x\not=c\right)
\end{array}\right.
\end{equation*}という形で表すことができる場合、このような確率変数\(X\)をほとんど確実に一定の確率変数(almost surely random variable)と呼びます。定数確率変数とほとんど確実に一定の確率変数は形式的に同一の確率質量関数を持っていますが、厳密には、これらは異なる種類の確率変数です。定数確率変数は定数関数である一方、ほとんど確実に一定の確率変数は定数関数である必要はなく、異なる値をとり得ます。ただ、実際に実現する値は1つの値\(c\)だけです。

 

確率分布としての確率質量関数

繰り返しになりますが、離散型確率変数\(X\)の確率質量関数\(f_{X}\)が与えられている場合、確率変数\(X\)が値\(x\in \mathbb{R} \)をとる確率に関して、\begin{equation*}P\left( X=x\right) =f_{X}\left( x\right)
\end{equation*}という関係が成り立ちます。以上を踏まえると、確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率を、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f_{X}\left( x\right)
\end{equation*}という形で表すことができます。つまり、集合\(A\)に属するそれぞれの値\(x\)に対する確率\(f_{X}\left( x\right) \)をとり、それらの総和をとれば\(P\left( X\in A\right) \)が得られるということです。ただし、\(A\)が無限可算集合である場合、右辺は無限級数の和です。

命題(確率分布としての確率関数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。集合\(A\subset \mathbb{R} \)を任意に選んだとき、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f_{X}\left( x\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

確率質量関数\(f\)が与えられれば任意の点集合\(A\subset \mathbb{R} \)に対する確率\(P\left( X\in A\right) \)を以上の要領で特定できるため、確率関数\(f\)もまた離散型確率変数\(X\)の確率分布を表現する手段の1つであるということになります。

例(確率分布としての確率質量関数)
「コインを3回投げて表が出た回数を観察する」という試行に関連して、値域が、\begin{equation*}
X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}であるような確率変数\(X:\Omega \rightarrow \mathbb{R} \)に加えて、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\binom{3}{x}\left( \frac{1}{2}\right) ^{3} & \left( if\ x=0,1,2,3\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定める確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を先に定義しましたが、先の命題より、「表が奇数回出る」という事象の確率は、\begin{eqnarray*}P\left( X\in \left\{ 1,3\right\} \right) &=&f_{X}\left( 1\right)
+f_{X}\left( 3\right) \\
&=&\frac{3}{8}+\frac{1}{8} \\
&=&\frac{1}{2}
\end{eqnarray*}となります。また、「表が\(2\)回以上出る」という事象の確率は、\begin{eqnarray*}P\left( X\in \left\{ 2,3\right\} \right) &=&f_{X}\left( 2\right)
+f_{X}\left( 3\right) \\
&=&\frac{3}{8}+\frac{1}{8} \\
&=&\frac{1}{2}
\end{eqnarray*}となります。

例(確率分布としての確率質量関数)
「表が出るまでコインを投げ続ける」という試行に関連して、値域が、\begin{equation*}
X\left( \Omega \right) =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるような確率変数\(X:\Omega \rightarrow \mathbb{R} \)に加えて、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\left( \frac{1}{2}\right) ^{x-1}\left( \frac{1}{2}\right) & \left( if\
x=1,2,3,\cdots \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定める確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を先に定義しましたが、先の命題より、「3回までに表が出る」という事象の確率は、\begin{eqnarray*}P\left( X\in \left\{ 1,2,3\right\} \right) &=&f_{X}\left( 1\right)
+f_{X}\left( 2\right) +f_{X}\left( 3\right) \\
&=&\frac{1}{2}+\left( \frac{1}{2}\right) ^{2}+\left( \frac{1}{2}\right) ^{3}
\\
&=&\frac{7}{8}
\end{eqnarray*}となります。また、「奇数回目に表が出る」という事象の確率は、\begin{eqnarray*}
P\left( X\in \left\{ 1,3,5,\cdots \right\} \right) &=&f_{X}\left( 1\right)
+f_{X}\left( 3\right) +f_{X}\left( 5\right) +\cdots \\
&=&\sum_{k=1}^{+\infty }f_{X}\left( 2k-1\right) \\
&=&\sum_{k=1}^{+\infty }\left( \frac{1}{2}\right) ^{\left( 2k-1\right)
-1}\left( \frac{1}{2}\right) \quad \because f_{X}\text{の定義} \\
&=&\sum_{k=1}^{+\infty }\left( \frac{1}{2}\right) ^{2k-1} \\
&=&\lim_{n\rightarrow \infty }\sum_{k=1}^{n}\left( \frac{1}{2}\right)
^{2k-1}\quad \because \text{無限級数の和}
\\
&=&\lim_{n\rightarrow \infty }\left[ \frac{2}{3}-\frac{2}{3}\left( \frac{1}{4}\right) ^{n}\right] \\
&=&\frac{2}{3}
\end{eqnarray*}となります。

 

確率質量関数の非負性

確率質量関数は非負の実数を値としてとります。特に、確率変数の値域に属さない値に対して、確率質量関数はゼロを値として定めます。

命題(確率質量関数の非負性)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。このとき、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成り立つ。特に、\(x\not\in X\left( \Omega \right) \)である場合には、\begin{equation*}f_{X}\left( x\right) =0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率質量関数の非負性)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}であるとともに、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\binom{3}{x}\left( \frac{1}{2}\right) ^{3} & \left( if\ x=0,1,2,3\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。

例(確率質量関数の非負性)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるとともに、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\left( \frac{1}{2}\right) ^{x-1}\left( \frac{1}{2}\right) & \left( if\
x=1,2,3,\cdots \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が成立しています。

 

確率質量関数の値の総和

確率変数がとり得るそれぞれの値に対して確率質量関数が定める値の総和をとると\(1\)になります。

命題(確率質量関数の値の総和)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。このとき、\begin{equation*}\sum_{x\in X\left( \Omega \right) }f_{X}\left( x\right) =1
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率質量関数の値の総和)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}であるとともに、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\binom{3}{x}\left( \frac{1}{2}\right) ^{3} & \left( if\ x=0,1,2,3\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、\begin{eqnarray*}
\sum_{x\in X\left( \Omega \right) }f_{X}\left( x\right) &=&\sum_{x=0}^{3}\binom{3}{x}\left( \frac{1}{2}\right) ^{3} \\
&=&\left( \frac{1}{2}\right) ^{3}\sum_{x=0}^{3}\binom{3}{x} \\
&=&\left( \frac{1}{2}\right) ^{3}\cdot 2^{3}\quad \because \text{二項係数の和} \\
&=&1
\end{eqnarray*}が成り立ちます。

例(確率質量関数の値の総和)
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるとともに、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\left( \frac{1}{2}\right) ^{x-1}\left( \frac{1}{2}\right) & \left( if\
x=1,2,3,\cdots \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、\begin{eqnarray*}
\sum_{x\in X\left( \Omega \right) }f_{X}\left( x\right)
&=&\sum_{x=1}^{+\infty }\left( \frac{1}{2}\right) ^{x-1}\left( \frac{1}{2}\right) \\
&=&\left( \frac{1}{2}\right) \sum_{x=1}^{+\infty }\left( \frac{1}{2}\right)
^{x-1} \\
&=&\left( \frac{1}{2}\right) \lim_{n\rightarrow \infty }\sum_{x=1}^{n}\left(
\frac{1}{2}\right) ^{x-1}\quad \because \text{無限級数の和} \\
&=&\left( \frac{1}{2}\right) \lim_{n\rightarrow \infty }\left[ 2-2\left(
\frac{1}{2}\right) ^{n}\right] \\
&=&\frac{1}{2}\cdot 2 \\
&=&1
\end{eqnarray*}が成り立ちます。

 

公理主義にもとづく確率質量関数の定義

確率質量関数が満たす性質を明らかにしましたが、公理主義的な立場から、非負性を満たすとともに、値の総和が\(1\)であるような関数を確率質量関数と定義する考え方もあります。つまり、確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられたとき、関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \forall x\in \mathbb{R} :f\left( x\right) \geq 0 \\
&&\left( b\right) \ \sum_{x\in X\left( \Omega \right) }f\left( x\right) =1
\end{eqnarray*}を満たす場合、これを確率質量関数と定義するということです。詳細は場を改めて解説します。

 

演習問題

問題(確率質量関数)
「2つのサイコロを振って出た目を観察する」という試行において、出た目の差の絶対値を与える確率変数を定式化した上で、その値域を明らかにしてください。さらに、サイコロはいずれも偏りがなく、1から6の目が等確率で出るという前提のもと、先の確率変数の確率分布を描写する確率質量関数を定式化してください。ただし、2つのサイコロは区別可能であるものとします。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録