確率変数を導入する動機
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)は確率空間の公理を満たすものとして定義されているため、その要素である\(\left( \Omega ,\mathcal{F}\right) \)は可測空間としての以下の性質\begin{eqnarray*}&&\left( a\right) \ \mathcal{F}\subset 2^{\Omega } \\
&&\left( b\right) \ \mathcal{F}\not=\phi \\
&&\left( c\right) \ \forall A\in \mathcal{F}:A^{c}\in \mathcal{F} \\
&&\left( d\right) \ \forall A_{1},A_{2},\cdots \in \mathcal{F}:\bigcup_{n\in \mathbb{N} }A_{n}\in \mathcal{F}
\end{eqnarray*}を満たす必要があります。つまり、事象空間\(\mathcal{F}\)は標本空間\(\Omega \)の部分集合を要素としてもつ\(\sigma \)-代数です。標本空間\(\Omega \)が非可算集合である場合などを考慮すると、標本空間\(\Omega \)のすべての部分集合を事象として扱うことはできず、以上の性質を満たす事象空間\(\mathcal{F}\)に属する事象だけが確率の測定対象となります。
さて、「コインを1回投げる」という試行の標本空間が、\begin{equation*}
\Omega =\left\{ \text{表},\text{裏}\right\}
\end{equation*}であるように、試行において起こり得る標本点は数値であるとは限りません。確率に関して定量的な分析を行うためには、それぞれの標本点を数値として表現できれば何かと便利です。そこで、それぞれの標本点\(\omega \in \Omega \)に対して、実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定める写像\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}を導入し、これを確率変数(random variable)と呼びます。ただ、先述のように、可測空間\(\left( \Omega ,\mathcal{F}\right) \)は測度空間の公理を満たす必要があるため、確率変数\(X:\Omega \rightarrow \mathbb{R} \)もまた公理と整合的である必要があります。つまり、\(\Omega \)から\(\mathbb{R} \)への任意の写像を確率変数として採用できるわけではないということです。では、\(\Omega \)から\(\mathbb{R} \)への写像がどのような性質を満たしていれば、それを確率変数として採用できるのでしょうか。必要な概念を整備しながら順番に解説します。
確率変数の定義
可測空間\(\left( \Omega ,\mathcal{F}\right) \)が与えられているものとします。つまり、事象空間\(\mathcal{F}\)は標本空間\(\Omega \)の部分集合を要素として持つ\(\sigma \)-代数です。実数空間\(\mathbb{R} \)上のボレル集合族\(\mathcal{B}\)は\(\mathbb{R} \)の部分集合を要素として持つ\(\sigma \)-代数であるため、\(\left( \mathbb{R} ,\mathcal{B}\right) \)もまた可測空間です。その上で、写像\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}を定義します。つまり、もとの可測空間\(\left( \Omega ,\mathcal{F}\right) \)において標本点\(\omega \in \Omega \)が実現した場合、その事実を、もう一方の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)上の標本点である実数\(X\left( \omega \right) \in \mathbb{R} \)に変換して表現するということです。
変換後の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)において可測な事象、すなわちボレル集合\(B\in \mathcal{B}\)を任意に選びます。もとの可測空間\(\left( \Omega ,\mathcal{F}\right) \)においてこの事象\(B\)に対応する事象は、写像\(X:\Omega\rightarrow \mathbb{R} \)のもとでの実現値\(X\left(\omega \right) \)がその事象\(B\)に属するという事象、すなわち写像\(X\)のもとでの集合\(B\)の逆像\begin{equation*}X^{-1}\left( B\right) =\left\{ \omega \in \Omega \ |\ X\left( \omega \right)
\in B\right\}
\end{equation*}に他なりません。したがって、変換後の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)において可測な事象\(B\)が与えられたとき、もとの可測空間\(\left( \Omega ,\mathcal{F}\right) \)においてこの事象\(B\)に対応する事象が可測であるためには、以下の条件\begin{equation*}X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}が満たされている必要があります。
以上を踏まえた上で、変換後の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)において可測な事象\(B\in \mathcal{B}\)を任意に選んだ場合、もとの可測空間\(\left( \Omega ,\mathcal{F}\right) \)においてこの事象\(B\)の逆像が可測であることが保証されるならば、すなわち、以下の条件\begin{equation*}\forall B\in \mathcal{B}:X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}が成り立つ場合には、この写像\(X:\Omega \rightarrow \mathbb{R} \)を確率変数(random variable)と呼びます。またこのとき、\(X\)は\(\mathcal{F}\)-可測(\(\mathcal{F}\)-measurable)であると言います。
確率変数であるための必要十分条件
変換後の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)を構成する事象空間、すなわちボレル集合族\(\mathcal{B}\)は\(\sigma \)-代数であるため、\begin{equation*}\sigma \left( \mathcal{B}\right) =\mathcal{B}
\end{equation*}が成り立ちます。さらに、\begin{equation*}
\mathcal{B}\subset 2^{\mathbb{R} }
\end{equation*}が成り立つため、\(\mathcal{B}\)を生成する\(\mathbb{R} \)の部分集合族が存在することが明らかになりました。
以上を踏まえた上で、ボレル集合族\(\mathcal{B}\)を生成する\(\mathbb{R} \)の部分集合族\(\mathcal{A}\subset 2^{\mathbb{R} }\)を任意に選びます。つまり、以下の条件\begin{equation*}\sigma \left( \mathcal{A}\right) =\mathcal{B}
\end{equation*}を満たす\(\mathcal{A}\)を選ぶということです。先の議論より、\(\mathcal{B}\)自身は\(\mathcal{A}\)の具体例の1つです。その上で、この集合族\(\mathcal{A}\)の要素\(B\in \mathcal{A}\)を任意に選んだとき、もとの可測空間\(\left(\Omega ,\mathcal{F}\right) \)においてその逆像が可測であることは、すなわち、\begin{equation*}\forall B\in \mathcal{A}:X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}が成り立つことは、写像\(X:\Omega \rightarrow \mathbb{R} \)が確率変数であるための必要十分条件になります。
\end{equation*}を満たす集合族\(\mathcal{A}\subset 2^{\mathbb{R} }\)について、\begin{equation*}\forall B\in \mathcal{A}:X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}が成り立つことは、\(X\)が確率変数であるための必要十分条件である。
可測空間\(\left( \Omega ,\mathcal{F}\right) ,\left( \mathbb{R} ,\mathcal{B}\right) \)と写像\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。上の命題より、以下の条件\begin{equation*}\sigma \left( \mathcal{A}\right) =\mathcal{B}
\end{equation*}を満たす集合族\(\mathcal{A}\subset 2^{\mathbb{R} }\)について、\begin{equation*}\forall B\in \mathcal{A}:X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}が成り立つならば、\(X\)は確率変数になります。
ボレル集合族は様々な区間族から生成可能です。具体例を挙げると、以下の区間族\begin{eqnarray*}
\mathcal{A}_{1} &=&\left\{ \left( -\infty ,x\right] \ |\ x\in \mathbb{R} \right\} \\
\mathcal{A}_{2} &=&\left\{ \left( -\infty ,x\right) \ |\ x\in \mathbb{R} \right\} \\
\mathcal{A}_{3} &=&\left\{ \left[ x,+\infty \right) \ |\ x\in \mathbb{R} \right\} \\
\mathcal{A}_{4} &=&\left\{ \left( x,+\infty \right) \ |\ x\in \mathbb{R} \right\}
\end{eqnarray*}などに関して、\begin{equation*}
\mathcal{B}=\sigma \left( \mathcal{A}_{1}\right) =\sigma \left( \mathcal{A}_{2}\right) =\sigma \left( \mathcal{A}_{3}\right) =\sigma \left( \mathcal{A}_{4}\right)
\end{equation*}が成り立つため、以上の事実と先の命題を利用することにより、確率変数を以下のように様々な形で表現できます。
&&\left( b\right) \ \forall x\in \mathbb{R} :X^{-1}\left( \left( -\infty ,x\right] \right) \in \mathcal{F}\text{が成り立つ} \\
&&\left( c\right) \ \forall x\in \mathbb{R} :X^{-1}\left( \left( -\infty ,x\right) \right) \in \mathcal{F}\text{が成り立つ} \\
&&\left( d\right) \ \forall x\in \mathbb{R} :X^{-1}\left( \left[ x,+\infty \right) \right) \in \mathcal{F}\text{が成り立つ} \\
&&\left( e\right) \ \forall x\in \mathbb{R} :X^{-1}\left( \left( x,+\infty \right) \right) \in \mathcal{F}\text{が成り立つ}
\end{eqnarray*}はお互いに必要十分である。
写像が生成するσ-代数
可測空間\(\left( \Omega ,\mathcal{F}\right) ,\left( \mathbb{R} ,\mathcal{B}\right) \)が与えられたとき、それに対して以下の条件\begin{equation*}\forall B\in \mathcal{B}:X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}を満たす写像\(X:\Omega \rightarrow \mathbb{R} \)を確率変数と定義しました。さらに、以下の条件\begin{equation*}\sigma \left( \mathcal{A}\right) =\mathcal{B}
\end{equation*}を満たす何らかの集合族\(\mathcal{A}\subset 2^{\mathbb{R} }\)について、\begin{equation*}\forall B\in \mathcal{A}:X^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}が成り立つことは、\(X\)が確率変数であるための必要十分条件であることを示しました。いずれにせよ、与えられた写像\(X\)が以上の条件を満たすことを確認するのは面倒です。そこで、可測空間\(\left( \Omega ,\mathcal{F}\right) \)を構成する事象空間\(\mathcal{F}\)を別の\(\sigma \)-代数へ代替することにより、写像\(X:\Omega \rightarrow \mathbb{R} \)が必ず確率変数になる形へ舞台を整えます。順番に考えます。
可測空間\(\left( \Omega ,\mathcal{F}\right) ,\left( \mathbb{R} ,\mathcal{B}\right) \)に加えて写像\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。その上で、以下のような\(\Omega \)の部分集合族\begin{eqnarray*}\sigma \left( X\right) &=&\left\{ A\in 2^{\Omega }\ |\ \exists B\in
\mathcal{B}:A=X^{-1}\left( B\right) \right\} \\
&=&\left\{ X^{-1}\left( B\right) \in 2^{\Omega }\ |\ B\in \mathcal{B}\right\}
\end{eqnarray*}を定義し、これを写像\(X\)が生成する\(\sigma \)-代数(\(\sigma \)-algebra generated by \(X\))と呼びます。集合\(A\in2^{\Omega }\)を任意に選んだとき、以下の関係\begin{equation*}A\in \sigma \left( X\right) \Leftrightarrow \exists B\in \mathcal{B}:A=X^{-1}\left( B\right) \quad \because \sigma \left( X\right) \text{の定義}
\end{equation*}が成り立ちます。つまり、変換後の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)上に存在する何らかの可測事象\(B\)の逆像をすべて集めることにより得られる事象族が\(\sigma \left( X\right) \)です。
その名の通り、\(\sigma \left(X\right) \)は\(\sigma \)-代数であるため、可測空間\(\left( \Omega ,\mathcal{F}\right) \)の事象空間を\(\mathcal{F}\)から\(\sigma \left( X\right) \)へ変更して\(\left( \Omega ,\sigma \left( X\right) \right) \)としても可測空間の公理に抵触しません。加えて、可測空間を\(\mathcal{F}\)から\(\sigma \left( X\right) \)へと変更することにより、写像\(X:\Omega \rightarrow \mathbb{R} \)は確率変数になります。つまり、\begin{equation*}\forall B\in \mathcal{B}:X^{-1}\left( B\right) \in \sigma \left( X\right)
\end{equation*}が成り立つということです。しかも、\(\sigma\left( X\right) \)は写像\(X\)を確率変数にする最小の\(\sigma \)-代数です。つまり、以下の条件\begin{equation*}\forall B\in \mathcal{B}:X^{-1}\left( B\right) \in \mathcal{F}_{\lambda }
\end{equation*}を満たす\(\sigma \)-代数\(\mathcal{F}_{\lambda }\subset 2^{\Omega }\)を任意に選んだとき、\begin{equation*}\sigma \left( X\right) \subset \mathcal{F}_{\lambda }
\end{equation*}が成り立ちます。
\end{equation*}を定義する。\(\sigma \left( X\right) \)は\(\sigma \)-代数であるとともに、\begin{equation*}\forall B\in \mathcal{B}:X^{-1}\left( B\right) \in \sigma \left( X\right)
\end{equation*}が成り立つ。さらに、以下の条件\begin{equation*}
\forall B\in \mathcal{B}:X^{-1}\left( B\right) \in \mathcal{F}_{\lambda }
\end{equation*}を満たす\(\sigma \)-代数\(\mathcal{F}_{\lambda }\subset 2^{\Omega }\)を任意に選んだとき、\begin{equation*}\sigma \left( X\right) \subset \mathcal{F}_{\lambda }
\end{equation*}が成り立つ。
写像が確率変数であるための必要十分条件を踏まえると、写像が生成する\(\sigma \)-代数を以下のように表現できます。
\end{equation*}を満たす集合族\(\mathcal{A}\subset2^{\mathbb{R} }\)について、\begin{eqnarray*}\sigma \left( X\right) &=&\left\{ A\in 2^{\Omega }\ |\ \exists B\in
\mathcal{A}:A=X^{-1}\left( B\right) \right\} \\
&=&\left\{ X^{-1}\left( B\right) \in 2^{\Omega }\ |\ B\in \mathcal{A}\right\}
\end{eqnarray*}が成り立つ。
繰り返しになりますが、ボレル集合族は以下の区間族\begin{eqnarray*}
\mathcal{A}_{1} &=&\left\{ \left( -\infty ,x\right] \ |\ x\in \mathbb{R} \right\} \\
\mathcal{A}_{2} &=&\left\{ \left( -\infty ,x\right) \ |\ x\in \mathbb{R} \right\} \\
\mathcal{A}_{3} &=&\left\{ \left[ x,+\infty \right) \ |\ x\in \mathbb{R} \right\} \\
\mathcal{A}_{4} &=&\left\{ \left( x,+\infty \right) \ |\ x\in \mathbb{R} \right\}
\end{eqnarray*}などから生成可能です。つまり、\begin{equation*}
\mathcal{B}=\sigma \left( \mathcal{A}_{1}\right) =\sigma \left( \mathcal{A}_{2}\right) =\sigma \left( \mathcal{A}_{3}\right) =\sigma \left( \mathcal{A}_{4}\right)
\end{equation*}が成り立ちます。以上の事実と先の命題を利用することにより、写像が生成する\(\sigma \)-代数を以下のように様々な形で表現できます。
&=&\left\{ X^{-1}\left( \left( -\infty ,x\right) \right) \ |\ x\in \mathbb{R} \right\} \\
&=&\left\{ X^{-1}\left( \left[ x,+\infty \right) \right) \ |\ x\in \mathbb{R} \right\} \\
&=&\left\{ X^{-1}\left( \left( x,+\infty \right) \right) \ |\ x\in \mathbb{R} \right\}
\end{eqnarray*}が成り立つ。
確率変数の分布
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられているものとします。可測空間である\(\left( \Omega ,\mathcal{F}\right) \)から\(\left( \mathbb{R} ,\mathcal{B}\right) \)への写像\(X:\Omega \rightarrow \mathbb{R} \)が与えられたとき、変換前の可測空間\(\left(\Omega ,\mathcal{F}\right) \)を\(\left( \Omega ,\sigma \left( X\right)\right) \)へ制限すれば\(X\)は確率変数になるため、可測事象\(B\in \mathcal{B}\)を任意に選んだとき、その逆像がもとの可測空間\(\left( \Omega ,\mathcal{F}\right) \)において可測であること、すなわち、\begin{equation*}X^{-1}\left( B\right) \in \sigma \left( X\right)
\end{equation*}が成り立つことが保証されます。したがって、確率測度\(P:\sigma \left(X\right) \rightarrow \mathbb{R} \)はこの逆像が起こる確率\begin{equation*}P\left( X^{-1}\left( B\right) \right) \in \mathbb{R} \end{equation*}を常に特定します。これを、確率変数\(X\)の値が\(B\)に属する確率として採用し、\begin{equation*}P\left( X\in B\right) =P\left( X^{-1}\left( B\right) \right)
\end{equation*}で表記します。
このような事情を踏まえると、それぞれの可測事象\(B\in \mathcal{B}\)に対して、確率変数\(X\)の値が\(B\)に属する確率\begin{eqnarray*}\mu \left( B\right) &=&P\left( X\in B\right) \\
&=&P\left( X^{-1}\left( B\right) \right)
\end{eqnarray*}を特定する写像\begin{equation*}
\mu :\mathcal{B}\rightarrow \mathbb{R} \end{equation*}が定義可能です。これを確率変数\(X\)の分布(distribution)と呼びます。
確率変数\(X:\Omega \rightarrow \mathbb{R} \)からその分布\(\mu :\mathcal{B}\rightarrow \mathbb{R} \)を定義したとき、これは変換後の可測空間\(\left( \mathbb{R} ,\mathcal{B}\right) \)における確率測度になります。つまり、以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall B\in \mathcal{B}:\mu \left( B\right) \geq 0 \\
&&\left( b\right) \ \mu \left( \Omega \right) =1 \\
&&\left( c\right) \ \forall \text{排反な}B_{1},B_{2},\cdots \in \mathcal{B}:\mu \left( \bigcup_{i\in \mathbb{N} }B_{i}\right) =\sum_{i\in \mathbb{N} }\mu \left( B_{i}\right)
\end{eqnarray*}が成り立つということです。したがって、\begin{equation*}
\left( \mathbb{R} ,\mathcal{B},\mu \right)
\end{equation*}は確率空間になります。
演習問題
\end{equation*}が成り立つことは、\(X\)が確率変数であるための必要十分条件であることを示してください。
\end{equation*}が成り立つものとします。\(X\)が生成する\(\sigma \)-代数\(\sigma \left( X\right) \)を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】