WIIS

連続型の確率分布

連続型の確率変数

目次

前のページ:
Twitter
Mailで保存

連続型の確率変数

「コインを1回投げる」という試行標本空間が、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}であるように、試行において起こり得る標本点は数値であるとは限りません。確率に関して定量的な分析を行うためには、それぞれの標本点を数値として表現できれば何かと便利です。そこで、それぞれの標本点\(\omega \in \Omega \)に対して、実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定める写像\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}を導入し、これを確率変数(random variable)と呼びます。

確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値がとり得る範囲が非可算集合である場合には、すなわち、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が数直線\(\mathbb{R} \)上の区間であったり、互いに素な区間の和集合などの非可算集合である場合には、\(X\)を連続型の確率変数(continuous random variable)と呼びます。

例(連続型の確率変数)
「ある電球の寿命を測定する」という試行の標本空間は、\begin{equation*}
\Omega =[0,+\infty )
\end{equation*}です。電球の寿命が切れた時点を表現する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。例えば、\begin{eqnarray*}
X\left( 0\right) &=&0 \\
X\left( 10\right) &=&10 \\
X\left( 111\right) &=&111
\end{eqnarray*}などが成り立ちます。この確率変数の値域は、\begin{equation*}
X\left( \Omega \right) =[0,+\infty )
\end{equation*}という無限閉区間であるため、\(X\)は連続型の確率変数です。
例(連続型の確率変数)
「2匹のマウスの寿命を測定する」という試行について考えます。ただし、2匹のマウスは区別可能です。マウス\(1\)の寿命を\(x_{1}\)で、マウス\(2\)の寿命を\(x_{2}\)でそれぞれ表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( x_{1},x_{2}\right) \in \mathbb{R} ^{2}\ |\ 0\leq x_{1}\wedge 0\leq x_{2}\right\}
\end{equation*}となります。それぞれの標本点\(\left( x_{1},x_{2}\right) \in\Omega \)に対して、2匹のマウスの寿命の平均\begin{equation*}X\left( x_{1},x_{2}\right) =\frac{x_{1}+x_{2}}{2}
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ \frac{x_{1}+x_{2}}{2}\in \mathbb{R} \ |\ 0\leq x_{1}\wedge 0\leq x_{2}\right\} \\
&=&[0,+\infty )
\end{eqnarray*}という無限閉区間であるため、\(X\)は連続型の確率変数です。また、それぞれの標本点\(\left( x_{1},x_{2}\right) \in \Omega \)に対して、2匹のマウスの寿命の差\begin{equation*}Y\left( x_{1},x_{2}\right) =\left\vert x_{2}-x_{1}\right\vert
\end{equation*}を値として定める確率変数\(Y:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \left\vert x_{2}-x_{1}\right\vert \in \mathbb{R} \ |\ 0\leq x_{1}\wedge 0\leq x_{2}\right\} \\
&=&[0,+\infty )
\end{eqnarray*}という無限閉区間であるため、\(Y\)もまた連続型の確率変数です。上の例に関して言えば、寿命の平均に興味があれば確率変数\(X\)を採用し、寿命の差に興味があれば確率変数\(Y\)を採用することになります。目的に応じて適切な確率変数を導入することが重要です。
例(連続型の確率変数)
「半径\(r>0\)の円上の弦をランダムに選ぶ」という試行について考えます。弦を特定するためにはその両端の点を特定すれば良いため、この試行の標本点は円上の2つの点からなる組として表現されます。したがって、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( x,y\right) \ |\ x\text{と}y\text{は円上の点}\right\}
\end{equation*}となります。それぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{equation*}X\left( x,y\right) =x,y\text{を両端の点とする弦の長さ}
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、最短の弦の長さは\(0\)であり、最長の弦の長さは円周\(2\pi r\)であるため、その値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,2\pi r\right] \end{equation*}という有界閉区間になります。したがって、\(X\)は連続型の確率変数です。

確率変数は連続型であるとは限りません。以下の例より明らかです。

例(連続型ではない確率変数)
「コインを1回投げて出た面を観察する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}となります。「表が出れば1万円をもらえる一方で裏が出れば1万円を支払う」というギャンブルを想定する場合、ギャンブルの結果を表現する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\left\{
\begin{array}{cc}
10000 & \left( if\ \omega =\text{表}\right) \\
-10000 & \left( if\ \omega =\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。この確率変数の値域は、\begin{equation*}
X\left( \Omega \right) =\left\{ 10000,-10000\right\}
\end{equation*}という有限集合であるため、\(X\)は連続型の確率変数ではありません。

以上の例のように、確率変数の値域が有限集合ないし可算集合である場合、それを離散型の確率変数と呼びます。離散型の確率変数については別のセクションで解説しているため、以降では連続型の確率変数のみを考察対象とします。

 

連続型の確率変数の確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。\(X\)の値がある集合\(A\subset \mathbb{R} \)に属する確率を、\begin{equation*}P\left( X\in A\right)
\end{equation*}と表記するものと定めます。これをどのように評価すればよいでしょうか。

確率変数\(X\)はそれぞれの標本点\(\omega \in \Omega \)に対して実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定めるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}となります。

すべての集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)が明らかになっている場合には、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びます。ただ、後ほど明らかになるように、すべての実数\(x\in \mathbb{R} \)に対して、\(X\)が\(x\)以下の値をとる確率\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}が明らかであれば、\(X\)の確率分布を完全に記述できます。

 

確率変数の厳密な定義

確率空間\(\left( \Omega ,\mathcal{F},,P\right) \)が与えられた状況において、確率変数を\(\Omega \)から\(\mathbb{R} \)への写像\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}と定義しましたが、\(\Omega \)から\(\mathbb{R} \)への任意の写像を確率変数として採用できるのでしょうか。

先の議論より、確率変数\(X\)の確率分布を完全に記述するためには、任意の実数\(x\in \mathbb{R} \)について、\(X\)が\(x\)以下の値をとる確率\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}を特定できることが保証されている必要があります。言い換えると、任意の\(x\in \mathbb{R} \)について、以下の事象\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\}
\end{equation*}が可測である必要があります。つまり、確率変数\(X:\Omega \rightarrow \mathbb{R} \)は以下の条件\begin{equation*}\forall x\in \mathbb{R} :\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\} \in
\mathcal{F}
\end{equation*}を満たす写像である必要があります。

関数\(X:\Omega \rightarrow \mathbb{R} \)が与えられた状況において、それぞれの集合\(A\subset \mathbb{R} \)に対して、以下の集合\begin{equation*}X^{-1}\left( A\right) =\left\{ \omega \in \Omega \ |\ X\left( \omega \right)
\in A\right\}
\end{equation*}を定める対応\(X^{-1}:\mathbb{R} \rightarrow \Omega \)を定義するのであれば、関数\(X\)が確率変数であるために満たすべき先の条件を、\begin{equation*}\forall x\in \mathbb{R} :X^{-1}\left( \left( -\infty ,x\right] \right) \in \mathcal{F}
\end{equation*}と表現することもできます。

 

演習問題

問題(連続型の確率変数)
「通話記録の中から1つをランダムに選んだ上で通話時間を観察する」という試行において、通話時間を与える確率変数を定式化してください。また、その値域を明らかにして下さい。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(連続型の確率変数)
「ある町の1年間の降雨量を計測する」という試行において、降雨量を与える確率変数を定式化してください。また、その値域を明らかにして下さい。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(連続型の確率変数)
「5人をランダムに選んで身長を計測する」という試行において、5人の身長の平均を与える確率変数を定式化してください。また、その値域を明らかにしてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

前のページ:
Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

連続型の一様分布

連続型の確率変数の確率分布を記述する確率密度関数が定数関数である場合、その確率変数は連続型の一様分布にしたがうと言います。連続型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

指数分布

何らかの出来事が起こるまでの経過時点を表す連続型の確率変数の確率分布を指数分布と呼びます。指数分布を定義するとともに、その基本的な性質について解説します。

連続型確率変数の確率密度関数

連続型の確率変数の確率分布を確率質量関数を通じて表現することはできません。連続型の確率変数の確率分布を描写する際には確率密度関数と呼ばれる概念を利用します。

連続型確率変数の期待値

連続型の確率変数の値と確率密度関数の値の積を全区間上で積分することにより得られる値を確率変数の期待値と呼びます。期待値は確率変数の実現値の見込みの値を表す指標です。

連続型確率変数の分散と標準偏差

連続型の確率変数がとり得るそれぞれの値と期待値の差の平方をとった上で、得られた平方を積分すると分散と呼ばれる指標が得られます。分散の正の平方根を標準偏差と呼びます。