WIIS

連続型の確率分布

連続型確率変数の中央化・標準化・正規化

目次

関連知識

Mailで保存
Xで共有

連続型確率変数の中央化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と定義されます。

確率変数を変換することにより、期待値が\(0\)であるような確率変数を得ることができます。期待値が\(0\)になるように確率変数を変換する操作を中央化(centering)と呼び、中央化することで得られる新たな確率変数を中央化された(centered)確率変数と呼びます。

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の中央化された確率変数であることが保証されます。つまり、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つということです。

命題(確率変数の中央化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されており、その場合に\(X\)の期待値\(E\left( X\right) \)が存在するものとする。このとき、それぞれの\(\omega \in\Omega \)に対して、\begin{equation*}Y\left( \omega \right) =X\left( \omega \right) -E\left( X\right)
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}E\left( Y\right) =0
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の中央化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,100\right] \end{equation*}であり、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq x\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{100}\frac{x}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{200}\right] _{0}^{100} \\
&=&\frac{100^{2}}{200}-\frac{0^{2}}{200} \\
&=&50
\end{eqnarray*}です。\(X\)を中央化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&X\left( \omega \right) -E\left( X\right) \\
&=&X\left( \omega \right) -50
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ X\left( \omega \right) -50\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ x-50\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ x-50\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ -50,50\right] \end{eqnarray*}です。先の命題より、\begin{equation*}
E\left( Y\right) =0
\end{equation*}となります。

 

連続型確率変数の標準化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として記述されている場合、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と定義され、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}と定義され、\(X\)の標準偏差は、\begin{equation*}\mathrm{SD}\left( X\right) =\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}と定義されます。

確率変数を変換することにより、期待値が\(0\)であるとともに分散が\(1\)であるような確率変数を得ることができます。期待値が\(0\)であるとともに分散が\(1\)であるように確率変数を変換する操作を標準化(standardizing)や基準化、または規格化などと呼び、標準化することで得られる新たな確率変数を標準化された(standardized)確率変数と呼びます。

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値\(E\left( X\right) \in \mathbb{R} \)と標準偏差\(\mathrm{SD}\left( X\right) \in \mathbb{R} \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の標準化された確率変数であることが保証されます。つまり、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つということです。

命題(確率変数の標準化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されており、その場合に\(X\)の期待値\(E\left( X\right) \)と標準偏差\(\mathrm{SD}\left( X\right) \)が存在するものとする。このとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{eqnarray*}E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}がともに成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の標準化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,100\right] \end{equation*}であり、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq x\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{100}\frac{x}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{200}\right] _{0}^{100} \\
&=&\frac{100^{2}}{200}-\frac{0^{2}}{200} \\
&=&50
\end{eqnarray*}であり、\(X^{2}\)の期待値は、\begin{eqnarray*}E\left( X^{2}\right) &=&\int_{-\infty }^{+\infty }x^{2}f_{X}\left( x\right)
dx\quad \because \text{LOTUS} \\
&=&\int_{0}^{100}\frac{x^{2}}{100}dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{3}}{300}\right] _{0}^{100} \\
&=&\frac{100^{3}}{300}-\frac{0^{3}}{300} \\
&=&\frac{10000}{3}
\end{eqnarray*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}\quad \because \text{期待値と分散の関係} \\
&=&\frac{10000}{3}-50^{2} \\
&=&\frac{2500}{3}
\end{eqnarray*}であり、\(X\)の標準偏差は、\begin{eqnarray*}\mathrm{SD}\left( X\right) &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because
\text{標準偏差の定義} \\
&=&\sqrt{\frac{2500}{3}} \\
&=&\frac{50\sqrt{3}}{3}
\end{eqnarray*}です。\(X\)を標準化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -E\left( X\right) }{\mathrm{SD}\left( X\right) }\quad \because \text{標準化の定義} \\
&=&\frac{X\left( \omega \right) -50}{\frac{50\sqrt{3}}{3}}
\end{eqnarray*}を定めるため、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{X\left( \omega \right) -50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ \frac{x-50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ \frac{x-50}{\frac{50\sqrt{3}}{3}}\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ -\sqrt{3},\sqrt{3}\right] \end{eqnarray*}です。先の命題より、\begin{eqnarray*}
E\left( Y\right) &=&0 \\
\mathrm{Var}\left( Y\right) &=&1
\end{eqnarray*}となります。

 

確率変数の正規化

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}と定義されますが、これは\(X\)がとり得る値からなる集合です。

確率変数を変換することにより、確率変数がとり得る値の範囲が\(0\)以上\(1\)以下に限定することができます。確率変数がとり得る値の範囲が\(0\)以上\(1 \)以下になるように確率変数を変換する操作を正規化(normalizing)と呼び、正規化することで得られる新たな確率変数を正規化された(normalized)確率変数と呼びます。

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在する場合、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める新たな確率変数\begin{equation*}
Y:\Omega \rightarrow \mathbb{R} \end{equation*}が定義可能ですが、この確率変数は\(X\)の正規化された確率変数であることが保証されます。つまり、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つということです。

命題(確率変数の正規化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域\(X\left( \Omega \right) \)の最大値\(\max X\left( \Omega \right) \)と最小値\(\min X\left( \Omega \right) \)が存在するものとする。このとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\frac{X\left( \omega \right) -\min X\left( \Omega
\right) }{\max X\left( \Omega \right) -\min X\left( \Omega \right) }
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)が定義可能であるとともに、\begin{equation*}Y\left( \Omega \right) \subset \left[ 0,1\right] \end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(確率変数の正規化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,100\right] \end{equation*}であるものとします。その最大値と最小値は、\begin{eqnarray*}
\max X\left( \Omega \right) &=&100 \\
\min X\left( \Omega \right) &=&0
\end{eqnarray*}です。\(X\)を正規化して得られる確率変数\(Y:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\frac{X\left( \omega \right) -0}{100-0}\quad
\because \text{正規化の定義} \\
&=&\frac{X\left( \omega \right) }{100}
\end{eqnarray*}を定めますが、先の命題より、\begin{equation*}
Y\left( \Omega \right) =\left[ 0,1\right] \end{equation*}が成り立ちます。実際、\(Y\)の値域は、\begin{eqnarray*}Y\left( \Omega \right) &=&\left\{ \frac{X\left( \omega \right) }{100}\in \mathbb{R} \ |\ \omega \in \Omega \right\} \\
&=&\left\{ \frac{x}{100}\in \mathbb{R} \ |\ x\in X\left( \Omega \right) \right\} \\
&=&\left\{ \frac{x}{100}\in \mathbb{R} \ |\ x\in \left[ 0,100\right] \right\} \\
&=&\left[ 0,1\right] \end{eqnarray*}であり、正規化が実現しています。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録