連続型の確率変数
「コインを1回投げる」という試行の標本空間が、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}であるように、試行において起こり得る標本点は数値であるとは限りません。確率に関して定量的な分析を行うためには、それぞれの標本点を数値として表現できれば何かと便利です。そこで、それぞれの標本点\(\omega \in \Omega \)に対して、実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定める写像\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}を導入し、これを確率変数(random variable)と呼びます。
確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値がとり得る範囲が非可算集合である場合には、すなわち、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が数直線\(\mathbb{R} \)上の区間であったり、互いに素な区間の和集合などの非可算集合である場合には、\(X\)を連続型の確率変数(continuous random variable)と呼びます。
\Omega =[0,+\infty )
\end{equation*}です。電球の寿命が切れた時点を表現する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。例えば、\begin{eqnarray*}
X\left( 0\right) &=&0 \\
X\left( 10\right) &=&10 \\
X\left( 111\right) &=&111
\end{eqnarray*}などが成り立ちます。この確率変数の値域は、\begin{equation*}
X\left( \Omega \right) =[0,+\infty )
\end{equation*}という無限閉区間であるため、\(X\)は連続型の確率変数です。
\end{equation*}となります。それぞれの標本点\(\left( x_{1},x_{2}\right) \in\Omega \)に対して、2匹のマウスの寿命の平均\begin{equation*}X\left( x_{1},x_{2}\right) =\frac{x_{1}+x_{2}}{2}
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ \frac{x_{1}+x_{2}}{2}\in \mathbb{R} \ |\ 0\leq x_{1}\wedge 0\leq x_{2}\right\} \\
&=&[0,+\infty )
\end{eqnarray*}という無限閉区間であるため、\(X\)は連続型の確率変数です。また、それぞれの標本点\(\left( x_{1},x_{2}\right) \in \Omega \)に対して、2匹のマウスの寿命の差\begin{equation*}Y\left( x_{1},x_{2}\right) =\left\vert x_{2}-x_{1}\right\vert
\end{equation*}を値として定める確率変数\(Y:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \left\vert x_{2}-x_{1}\right\vert \in \mathbb{R} \ |\ 0\leq x_{1}\wedge 0\leq x_{2}\right\} \\
&=&[0,+\infty )
\end{eqnarray*}という無限閉区間であるため、\(Y\)もまた連続型の確率変数です。上の例に関して言えば、寿命の平均に興味があれば確率変数\(X\)を採用し、寿命の差に興味があれば確率変数\(Y\)を採用することになります。目的に応じて適切な確率変数を導入することが重要です。
\end{equation*}となります。それぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{equation*}X\left( x,y\right) =x,y\text{を両端の点とする弦の長さ}
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、最短の弦の長さは\(0\)であり、最長の弦の長さは円周\(2\pi r\)であるため、その値域は、\begin{equation*}X\left( \Omega \right) =\left[ 0,2\pi r\right] \end{equation*}という有界閉区間になります。したがって、\(X\)は連続型の確率変数です。
確率変数は連続型であるとは限りません。以下の例より明らかです。
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}となります。「表が出れば1万円をもらえる一方で裏が出れば1万円を支払う」というギャンブルを想定する場合、ギャンブルの結果を表現する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\left\{
\begin{array}{cc}
10000 & \left( if\ \omega =\text{表}\right) \\
-10000 & \left( if\ \omega =\text{裏}\right)
\end{array}\right.
\end{equation*}を定めます。この確率変数の値域は、\begin{equation*}
X\left( \Omega \right) =\left\{ 10000,-10000\right\}
\end{equation*}という有限集合であるため、\(X\)は連続型の確率変数ではありません。
以上の例のように、確率変数の値域が有限集合ないし可算集合である場合、それを離散型の確率変数と呼びます。離散型の確率変数については別のセクションで解説しているため、以降では連続型の確率変数のみを考察対象とします。
連続型の確率変数の確率分布
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。\(X\)の値がある集合\(A\subset \mathbb{R} \)に属する確率を、\begin{equation*}P\left( X\in A\right)
\end{equation*}と表記するものと定めます。これをどのように評価すればよいでしょうか。
確率変数\(X\)はそれぞれの標本点\(\omega \in \Omega \)に対して実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定めるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}となります。
すべての集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)が明らかになっている場合には、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びます。ただ、後ほど明らかになるように、すべての実数\(x\in \mathbb{R} \)に対して、\(X\)が\(x\)以下の値をとる確率\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}が明らかであれば、\(X\)の確率分布を完全に記述できます。
確率変数の厳密な定義
確率空間\(\left( \Omega ,\mathcal{F},,P\right) \)が与えられた状況において、確率変数を\(\Omega \)から\(\mathbb{R} \)への写像\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}と定義しましたが、\(\Omega \)から\(\mathbb{R} \)への任意の写像を確率変数として採用できるのでしょうか。
先の議論より、確率変数\(X\)の確率分布を完全に記述するためには、任意の実数\(x\in \mathbb{R} \)について、\(X\)が\(x\)以下の値をとる確率\begin{equation*}P\left( X\leq x\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \leq x\right\} \right)
\end{equation*}を特定できることが保証されている必要があります。言い換えると、任意の\(x\in \mathbb{R} \)について、以下の事象\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\}
\end{equation*}が可測である必要があります。つまり、確率変数\(X:\Omega \rightarrow \mathbb{R} \)は以下の条件\begin{equation*}\forall x\in \mathbb{R} :\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq x\right\} \in
\mathcal{F}
\end{equation*}を満たす写像である必要があります。
関数\(X:\Omega \rightarrow \mathbb{R} \)が与えられた状況において、それぞれの集合\(A\subset \mathbb{R} \)に対して、以下の集合\begin{equation*}X^{-1}\left( A\right) =\left\{ \omega \in \Omega \ |\ X\left( \omega \right)
\in A\right\}
\end{equation*}を定める対応\(X^{-1}:\mathbb{R} \rightarrow \Omega \)を定義するのであれば、関数\(X\)が確率変数であるために満たすべき先の条件を、\begin{equation*}\forall x\in \mathbb{R} :X^{-1}\left( \left( -\infty ,x\right] \right) \in \mathcal{F}
\end{equation*}と表現することもできます。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】