連続型確率変数の中央化
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と定義されます。
確率変数を変換することにより、期待値が\(0\)であるような確率変数を得ることができます。期待値が\(0\)になるように確率変数を変換する操作を中央化(centering)と呼び、中央化することで得られる新たな確率変数を中央化された(centered)確率変数と呼びます。
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の中央化された確率変数であることが保証されます。つまり、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つということです。
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つ。
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq x\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{100}\frac{x}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{200}\right] _{0}^{100} \\
&=&\frac{100^{2}}{200}-\frac{0^{2}}{200} \\
&=&50
\end{eqnarray*}です。\(X\)を中央化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&X\left( \omega \right) -E\left( X\right) \\
&=&X\left( \omega \right) -50
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ X\left( \omega \right) -50\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ x-50\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ x-50\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ -50,50\right] \end{eqnarray*}です。先の命題より、\begin{equation*}
E\left( Y\right) =0
\end{equation*}となります。
連続型確率変数の標準化
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と定義され、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}と定義され、\(X\)の標準偏差は、\begin{equation*}\mathrm{SD}\left( X\right) =\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}と定義されます。
確率変数を変換することにより、期待値が\(0\)であるとともに分散が\(1\)であるような確率変数を得ることができます。期待値が\(0\)であるとともに分散が\(1\)であるように確率変数を変換する操作を標準化(standardizing)や基準化、または規格化などと呼び、標準化することで得られる新たな確率変数を標準化された(standardized)確率変数と呼びます。
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)と標準偏差\(\mathrm{SD}\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の標準化された確率変数であることが保証されます。つまり、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つということです。
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つ。
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq x\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{100}\frac{x}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{200}\right] _{0}^{100} \\
&=&\frac{100^{2}}{200}-\frac{0^{2}}{200} \\
&=&50
\end{eqnarray*}であり、\(X^{2}\)の期待値は、\begin{eqnarray*}E\left( X^{2}\right) &=&\int_{-\infty }^{+\infty }x^{2}f_{X}\left( x\right)
dx\quad \because \text{LOTUS} \\
&=&\int_{0}^{100}\frac{x^{2}}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{3}}{300}\right] _{0}^{100} \\
&=&\frac{100^{3}}{300}-\frac{0^{3}}{300} \\
&=&\frac{10000}{3}
\end{eqnarray*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}\quad \because \text{期待値と分散の関係} \\
&=&\frac{10000}{3}-50^{2} \\
&=&\frac{2500}{3}
\end{eqnarray*}であり、\(X\)の標準偏差は、\begin{eqnarray*}\mathrm{SD}\left( X\right) &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because
\text{標準偏差の定義} \\
&=&\sqrt{\frac{2500}{3}} \\
&=&\frac{50\sqrt{3}}{3}
\end{eqnarray*}です。\(X\)を標準化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }\quad \because \text{標準化の定義} \\
&=&\frac{X\left( \omega \right) -50}{\frac{50\sqrt{3}}{3}}
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{X\left( \omega \right) -50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ \frac{x-50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ \frac{x-50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ -\sqrt{3},\sqrt{3}\right] \end{eqnarray*}です。先の命題より、\begin{eqnarray*}
E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}となります。
確率変数の正規化
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}と定義されますが、これは\(X\)がとり得る値からなる集合です。
確率変数を変換することにより、確率変数がとり得る値の範囲が\(0\)以上\(1\)以下に限定することができます。確率変数がとり得る値の範囲が\(0\)以上\(1 \)以下になるように確率変数を変換する操作を正規化(normalizing)と呼び、正規化することで得られる新たな確率変数を正規化された(normalized)確率変数と呼びます。
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の正規化された確率変数であることが保証されます。つまり、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right]
\end{equation*}が成り立つということです。
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つ。
\max X\left( \Omega \right) &=&100 \\
\min X\left( \Omega \right) &=&0
\end{eqnarray*}です。\(X\)を正規化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -0}{100-0}\quad
\because \text{正規化の定義} \\
&=&\frac{X\left( \omega \right) }{100}
\end{eqnarray*}を定めますが、先の命題より、\begin{equation*}
Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}が成り立ちます。実際、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{X\left( \omega \right) }{100}\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ \frac{x}{100}\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ \frac{x}{100}\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ 0,1\right] \end{eqnarray*}であり、正規化が実現しています。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】