教材一覧
教材一覧
教材検索

離散型の確率分布

離散型確率変数の中央化・標準化・正規化

目次

Twitter
Mailで保存

離散型確率変数の中央化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }xf\left( x\right)
\end{equation*}と定義されます。

確率変数を変換することにより、期待値が\(0\)であるような確率変数を得ることができます。期待値が\(0\)になるように確率変数を変換する操作を中央化(centering)と呼び、中央化することで得られる新たな確率変数を中央化された(centered)確率変数と呼びます。

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める新たな確率変数\(Y:\Omega \rightarrow \mathbb{R} \)が定義可能ですが、この確率変数は\(X\)の中央化された確率変数であることが保証されます。つまり、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つということです。

命題(確率変数の中央化)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されており、その場合に\(X\)の期待値\(E\left( X\right) \)が存在するものとする。このとき、それぞれの\(\omega \in\Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の中央化)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の標本空間が、\begin{equation*}\Omega =\left\{ 1,2,3,4,5,6,7,8,9,10\right\}
\end{equation*}であるとともに、確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めるものとします。\(X\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ 1,2,3,4,5,6,7,8,9,10\right\} \\
&=&\Omega
\end{eqnarray*}です。\(X\)の確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{10} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\frac{1}{10}\left( 1+2+3+4+5+6+7+8+9+10\right) \\
&=&5.5
\end{eqnarray*}です。\(X\)を中央化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&X\left( \omega \right) -E\left( X\right) \quad
\because \text{中央化の定義} \\
&=&\omega -5.5
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left\{
-4.5,-3.5,-2.5,-1.5,-0.5,0.5,1.5,2.5,3.5,4.5\right\}
\end{equation*}です。先の命題より、\begin{equation*}
E\left( Y\right) =0
\end{equation*}が成り立ちます。

 

離散型確率変数の標準化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }xf\left( x\right)
\end{equation*}と定義され、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f\left( x\right)
\end{equation*}と定義され、\(X\)の標準偏差は、\begin{equation*}\mathrm{SD}\left( X\right) =\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}と定義されます。

確率変数を変換することにより、期待値が\(0\)であるとともに分散が\(1\)であるような確率変数を得ることができます。期待値が\(0\)であるとともに分散が\(1\)であるように確率変数を変換する操作を標準化(standardizing)や基準化、または規格化などと呼び、標準化することで得られる新たな確率変数を標準化された(standardized)確率変数と呼びます。

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)と標準偏差\(\mathrm{SD}\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める新たな確率変数\(Y:\Omega \rightarrow \mathbb{R} \)が定義可能ですが、この確率変数は\(X\)の標準化された確率変数であることが保証されます。つまり、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つということです。

命題(確率変数の標準化)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されており、その場合に\(X\)の期待値\(E\left( X\right) \)と標準偏差\(\mathrm{SD}\left( X\right) \)が存在するものとする。このとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の標準化)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の標本空間が、\begin{equation*}\Omega =\left\{ 1,2,3,4,5,6,7,8,9,10\right\}
\end{equation*}であるとともに、確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めるものとします。\(X\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ 1,2,3,4,5,6,7,8,9,10\right\} \\
&=&\Omega
\end{eqnarray*}です。\(X\)の確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{10} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\frac{1}{10}\left( 1+2+3+4+5+6+7+8+9+10\right) \\
&=&5.5
\end{eqnarray*}です。さらに、\begin{eqnarray*}
E\left( X^{2}\right) &=&\frac{1}{10}\left(
1^{2}+2^{2}+3^{2}+4^{2}+5^{2}+6^{2}+7^{2}+8^{2}+9^{2}+10^{2}\right) \\
&=&38.5
\end{eqnarray*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}\quad \because \text{期待値と分散の関係} \\
&=&38.5-\left( 5.5\right) ^{2} \\
&=&8.25
\end{eqnarray*}です。したがって、\(X\)の標準偏差は、\begin{eqnarray*}\mathrm{SD}\left( X\right) &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because
\text{標準偏差の定義} \\
&=&\sqrt{8.25}
\end{eqnarray*}です。\(X\)を標準化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }\quad \because \text{標準化の定義} \\
&=&\frac{\omega -5.5}{\sqrt{8.25}}
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{equation*}Y\left( \Omega \right) =\left\{ \frac{-4.5}{\sqrt{8.25}},\frac{-3.5}{\sqrt{8.25}},\frac{-2.5}{\sqrt{8.25}},\frac{-1.5}{\sqrt{8.25}},\frac{-0.5}{\sqrt{8.25}},\frac{0.5}{\sqrt{8.25}},\frac{1.5}{\sqrt{8.25}},\frac{2.5}{\sqrt{8.25}},\frac{3.5}{\sqrt{8.25}},\frac{4.5}{\sqrt{8.25}}\right\}
\end{equation*}です。先の命題より、\begin{eqnarray*}
E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}が成り立ちます。

 

確率変数の正規化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}と定義されますが、これは\(X\)がとり得る値からなる集合です。

確率変数を変換することにより、確率変数がとり得る値の範囲が\(0\)以上\(1\)以下に限定することができます。確率変数がとり得る値の範囲が\(0\)以上\(1\)以下になるように確率変数を変換する操作を正規化(normalizing)と呼び、正規化することで得られる新たな確率変数を正規化された(normalized)確率変数と呼びます。

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める新たな確率変数\(Y:\Omega \rightarrow \mathbb{R} \)が定義可能ですが、この確率変数は\(X\)の正規化された確率変数であることが保証されます。つまり、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つということです。

命題(確率変数の正規化)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在するものとする。このとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の正規化)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の標本空間が、\begin{equation*}\Omega =\left\{ 1,2,3,4,5,6,7,8,9,10\right\}
\end{equation*}であるとともに、確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めるものとします。\(X\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ 1,2,3,4,5,6,7,8,9,10\right\} \\
&=&\Omega
\end{eqnarray*}であるため、その最大値と最小値は、\begin{eqnarray*}
\max X\left( \Omega \right) &=&10 \\
\min X\left( \Omega \right) &=&1
\end{eqnarray*}です。\(X\)を正規化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }\quad
\because \text{正規化の定義} \\
&=&\frac{X\left( \omega \right) -1}{10-1} \\
&=&\frac{X\left( \omega \right) -1}{9}
\end{eqnarray*}を定めますが、先の命題より、\begin{equation*}
Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}が成り立ちます。実際、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{1-1}{9},\frac{2-1}{9},\frac{3-1}{9},\frac{4-1}{9},\frac{5-1}{9},\frac{6-1}{9},\frac{7-1}{9},\frac{8-1}{9},\frac{9-1}{9},\frac{10-1}{9}\right\} \\
&=&\left\{ 0,\frac{1}{9},\frac{2}{9},\frac{3}{9},\frac{4}{9},\frac{5}{9},\frac{6}{9},\frac{7}{9},\frac{8}{9},1\right\}
\end{eqnarray*}であり、正規化が実現してます。

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識