WIIS

連続型の確率分布

連続型確率変数の中央化・標準化・正規化

目次

Twitter
Mailで保存

連続型確率変数の中央化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と定義されます。

確率変数を変換することにより、期待値が\(0\)であるような確率変数を得ることができます。期待値が\(0\)になるように確率変数を変換する操作を中央化(centering)と呼び、中央化することで得られる新たな確率変数を中央化された(centered)確率変数と呼びます。

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の中央化された確率変数であることが保証されます。つまり、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つということです。

命題(確率変数の中央化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されており、その場合に\(X\)の期待値\(E\left( X\right) \)が存在するものとする。このとき、それぞれの\(\omega \in\Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の中央化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,100\right] \end{equation*}であり、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq x\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{100}\frac{x}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{200}\right] _{0}^{100} \\
&=&\frac{100^{2}}{200}-\frac{0^{2}}{200} \\
&=&50
\end{eqnarray*}です。\(X\)を中央化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&X\left( \omega \right) -E\left( X\right) \\
&=&X\left( \omega \right) -50
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ X\left( \omega \right) -50\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ x-50\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ x-50\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ -50,50\right] \end{eqnarray*}です。先の命題より、\begin{equation*}
E\left( Y\right) =0
\end{equation*}となります。

 

連続型確率変数の標準化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と定義され、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}と定義され、\(X\)の標準偏差は、\begin{equation*}\mathrm{SD}\left( X\right) =\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}と定義されます。

確率変数を変換することにより、期待値が\(0\)であるとともに分散が\(1\)であるような確率変数を得ることができます。期待値が\(0\)であるとともに分散が\(1\)であるように確率変数を変換する操作を標準化(standardizing)や基準化、または規格化などと呼び、標準化することで得られる新たな確率変数を標準化された(standardized)確率変数と呼びます。

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)と標準偏差\(\mathrm{SD}\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の標準化された確率変数であることが保証されます。つまり、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つということです。

命題(確率変数の標準化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されており、その場合に\(X\)の期待値\(E\left( X\right) \)と標準偏差\(\mathrm{SD}\left( X\right) \)が存在するものとする。このとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の標準化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,100\right] \end{equation*}であり、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq x\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{100}\frac{x}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{200}\right] _{0}^{100} \\
&=&\frac{100^{2}}{200}-\frac{0^{2}}{200} \\
&=&50
\end{eqnarray*}であり、\(X^{2}\)の期待値は、\begin{eqnarray*}E\left( X^{2}\right) &=&\int_{-\infty }^{+\infty }x^{2}f_{X}\left( x\right)
dx\quad \because \text{LOTUS} \\
&=&\int_{0}^{100}\frac{x^{2}}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{3}}{300}\right] _{0}^{100} \\
&=&\frac{100^{3}}{300}-\frac{0^{3}}{300} \\
&=&\frac{10000}{3}
\end{eqnarray*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}\quad \because \text{期待値と分散の関係} \\
&=&\frac{10000}{3}-50^{2} \\
&=&\frac{2500}{3}
\end{eqnarray*}であり、\(X\)の標準偏差は、\begin{eqnarray*}\mathrm{SD}\left( X\right) &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because
\text{標準偏差の定義} \\
&=&\sqrt{\frac{2500}{3}} \\
&=&\frac{50\sqrt{3}}{3}
\end{eqnarray*}です。\(X\)を標準化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }\quad \because \text{標準化の定義} \\
&=&\frac{X\left( \omega \right) -50}{\frac{50\sqrt{3}}{3}}
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{X\left( \omega \right) -50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ \frac{x-50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ \frac{x-50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ -\sqrt{3},\sqrt{3}\right] \end{eqnarray*}です。先の命題より、\begin{eqnarray*}
E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}となります。

 

確率変数の正規化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}と定義されますが、これは\(X\)がとり得る値からなる集合です。

確率変数を変換することにより、確率変数がとり得る値の範囲が\(0\)以上\(1\)以下に限定することができます。確率変数がとり得る値の範囲が\(0\)以上\(1 \)以下になるように確率変数を変換する操作を正規化(normalizing)と呼び、正規化することで得られる新たな確率変数を正規化された(normalized)確率変数と呼びます。

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の正規化された確率変数であることが保証されます。つまり、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つということです。

命題(確率変数の正規化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在するものとする。このとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の正規化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,100\right] \end{equation*}であるものとします。その最大値と最小値は、\begin{eqnarray*}
\max X\left( \Omega \right) &=&100 \\
\min X\left( \Omega \right) &=&0
\end{eqnarray*}です。\(X\)を正規化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -0}{100-0}\quad
\because \text{正規化の定義} \\
&=&\frac{X\left( \omega \right) }{100}
\end{eqnarray*}を定めますが、先の命題より、\begin{equation*}
Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}が成り立ちます。実際、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{X\left( \omega \right) }{100}\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ \frac{x}{100}\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ \frac{x}{100}\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ 0,1\right] \end{eqnarray*}であり、正規化が実現しています。

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

離散型確率変数の期待値

確率変数がとり得るそれぞれの値に対して、その値が実現する確率との積をとった上で、得られた積の総和をとると期待値と呼ばれる指標が得られます。

離散型の一様分布

離散型の確率変数がすべての値を等しい確率でとる場合、そのような確率変数は離散型の一様分布にしたがうと言います。離散型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型確率変数の分散と標準偏差

離散型の確率変数がとり得るそれぞれの値に対して、その値と期待値の差の平方をとった上で、得られた平方の総和をとると分散と呼ばれる指標が得られます。分散の正の平方根を標準偏差と呼びます。

離散型確率変数の中央化・標準化・正規化

期待値が0になるように確率変数を変換する操作を中央化と呼び、期待値が0で分散が1になるように確率変数を変換する操作を標準化と呼び、確率変数がとり得る値の範囲が0以上1以下になるように確率変数を変換する操作を正規化と呼びます。

連続型の一様分布

連続型の確率変数の確率分布を記述する確率密度関数が定数関数である場合、その確率変数は連続型の一様分布にしたがうと言います。連続型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型同時確率変数の期待値

離散型の同時確率変数の期待値を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の期待値を求める方法を解説します。また、独立な確率変数の積の期待値は個々の確率変数の期待値の積と一致することを示します。

離散型同時確率変数の分散と標準偏差

離散型の同時確率変数の分散を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の分散を求める方法を解説します。また、独立な確率変数の和の分散は個々の確率変数の分散の和と一致することを示します。

連続型の確率変数

それぞれの標本点に対して実数を1つずつ割り当てる写像を確率変数と呼びます。値域が区間もしくは互いに素な区間の和集合であるような確率変数を連続型の確率変数と呼びます。

連続型確率変数の確率密度関数

連続型の確率変数の確率分布を確率質量関数を通じて表現することはできません。連続型の確率変数の確率分布を描写する際には確率密度関数と呼ばれる概念を利用します。

連続型確率変数の期待値

連続型の確率変数の値と確率密度関数の値の積を全区間上で積分することにより得られる値を確率変数の期待値と呼びます。期待値は確率変数の実現値の見込みの値を表す指標です。

連続型確率変数の分散と標準偏差

連続型の確率変数がとり得るそれぞれの値と期待値の差の平方をとった上で、得られた平方を積分すると分散と呼ばれる指標が得られます。分散の正の平方根を標準偏差と呼びます。

連続型同時確率変数の期待値

連続型の同時確率変数の期待値を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の期待値を求める方法を解説します。また、独立な確率変数の積の期待値は個々の確率変数の期待値の積と一致することを示します。

連続型同時確率変数の分散と標準偏差

連続型の同時確率変数の分散を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の分散を求める方法を解説します。また、独立な確率変数の和の分散は個々の確率変数の分散の和と一致することを示します。