WIIS

連続型の確率分布

連続型確率変数の分散と標準偏差

目次

Twitter
Mailで保存

期待値の欠点

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が数直線\(\mathbb{R} \)上の区間であったり、互いに素な区間の和集合であるということです。加えて、確率変数\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。つまり、確率変数\(X\)の値が区間\(I\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in I\right) =\int_{I}f_{X}\left( x\right) dx
\end{equation*}であるということです。

問題としている試行のもとで確率変数\(X\)が取り得る値の範囲\(X\left(\Omega \right) \)は分かっていますが、試行はランダムネスによって支配されているため、\(X\left(\Omega \right) \)の中のどの値が実際に実現するかを事前に特定できません。したがって、何らかの手段を通じて\(X\left( \Omega \right) \)の中のどの値が実際に実現するかを予測する必要があります。以上の問題意識のもと、確率変数\(X\)の期待値\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}と呼ばれる指標を導入しました。これは確率変数\(X\)の実現値の見込み値を表す指標です。

ただ、確率変数の確率分布を表現する指標として期待値に欠点がないわけではありません。実際、確率変数の確率分布が明らかに異なるにも関わらず、それらの期待値が一致するような状況は起こり得ます。期待値は確率分布の違いを上手く表現できると限らないということです。以下の例より明らかです。

例(期待値の欠点)
「事業を行った上で収益を観察する」という試行の標本空間が、\begin{equation*}
\Omega =\left[ -1,1\right] \end{equation*}であるものとします。事業の結果から得られる収益を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めるものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ -1,1\right] \end{equation*}という有界閉区間であるため、これは連続型の確率変数です。ある事業\(A\)を行った場合、確率変数\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{3}{4}\left( 1-x^{2}\right) & \left( if\ x\in X\left( \Omega \right)
\right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を満たす一方で、別の事業\(B\)を行った場合、確率変数\(X\)の確率密度関数\(g_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}g_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{9}{16}\left( 1-x^{8}\right) & \left( if\ x\in X\left( \Omega \right)
\right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を満たすものとします。\(f_{X},g_{X}\)のグラフの形状から明らかであるように、事業\(A\)は低リスク・低リターン型であり、事業\(B\)は高リスク・高リターン型です。両者は確率分布として明らかに異なります。その一方で、どちらの事業を採用した場合においても、確率変数\(X\)の期待値、すなわち事業から得られる収益の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}で等しくなります(確認してください)。つまり、確率変数\(X\)の確率分布を描写する指標として期待値だけに頼った場合、この2つの事業のタイプの違いを表現できないことになってしまいます。では、どのような指標を導入すれば2つの確率分布の違いを上手く表現できるでしょうか。事業\(A\)では期待値\(E\left( X\right) \)の近くにある\(X\)の値が起こりやすい傾向があり、逆に、事業\(B\)では期待値\(E\left( X\right) \)から離れている\(X\)の値が起こりやすい傾向があります。このような違いを表現するために、確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表現する新たな指標が要請されます。

 

連続型確率変数の分散と標準偏差

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているとともに、\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。加えて、\(X\)の期待値\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}が有限な実数として定まるものとします。確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表現するために、\(X\)がとり得るそれぞれの値\(x\in X\left( \Omega \right) \)と期待値の差\(x-E\left( X\right) \)をとります。符号を正に統一するために平方\(\left[ x-E\left( X\right) \right] ^{2}\)をとった上で、この値の期待値\begin{equation*}E\left[ \left[ X-E\left( X\right) \right] ^{2}\right] \end{equation*}を散らばりの指数として採用します。具体的には、\begin{equation*}
E\left[ \left[ X-E\left( X\right) \right] ^{2}\right] =\int_{-\infty
}^{+\infty }\left[ x-E\left( X\right) \right] ^{2}f_{X}\left( x\right)
dx\quad \because \text{LOTUS}
\end{equation*}となります。この指標を確率変数\(X\)の分散(variance)と呼び、\begin{equation*}\mathrm{Var}\left( X\right)
\end{equation*}で表記します。つまり、\begin{equation*}
\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}を満たすものとして分散は定義されます。

繰り返しになりますが、分散\(\mathrm{Var}\left( X\right) \)は確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表す指標です。確率変数\(X\)の値\(x\)の多くが期待値\(E\left( X\right) \)から離れた場所に分布している場合には分散\(\mathrm{Var}\left( X\right) \)は大きく評価され、逆に、確率変数\(X\)の値\(x\)の多くが期待値\(E\left( X\right) \)の近くに分布している場合には分散\(\mathrm{Var}\left( X\right) \)は小さく評価されます。

例(連続型確率変数の分散)
先ほどの例について再び考えます。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left[ -1,1\right] \end{equation*}です。低リスク・低リターン型事業\(A\)のもとでの確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{3}{4}\left( 1-x^{2}\right) & \left( if\ x\in X\left( \Omega \right)
\right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}であり、この場合の\(X\)の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx \\
&=&\int_{-1}^{1}\left( x-0\right) ^{2}\frac{3}{4}\left( 1-x^{2}\right) dx \\
&=&\int_{-1}^{1}\frac{3}{4}x^{2}\left( 1-x^{2}\right) dx \\
&=&\frac{1}{5}
\end{eqnarray*}です。一方、高リスク・高リターン型事業\(B\)のもとでの確率密度関数\(g_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}g_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{9}{16}\left( 1-x^{8}\right) & \left( if\ x\in X\left( \Omega \right)
\right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}であり、この場合の\(X\)の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}g_{X}\left( x\right) dx \\
&=&\int_{-1}^{1}\left( x-0\right) ^{2}\frac{9}{16}\left( 1-x^{8}\right) dx \\
&=&\int_{-1}^{1}\frac{9}{16}x^{2}\left( 1-x^{8}\right) dx \\
&=&\frac{3}{11}
\end{eqnarray*}です。低リスク・低リターン型の事業\(A\)では期待値\(E\left( X\right) \)の近くにある\(X\)の値が起こりやすい傾向があり、逆に、高リスク・高リターン型の事業\(B\)では期待値\(E\left( X\right) \)から離れている\(X\)の値が起こりやすい傾向がありますが、その違いが分散の値の違いとして上手く表現できています。

 

連続型確率変数の標準偏差

連続型の確率変数\(X\)の分散\(\mathrm{Var}\left( X\right) \)が有限な実数として定まる場合、それは必ず非負の実数として定まるため、その正の平方根\begin{equation*}\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}をとることができます。この指標を確率変数\(X\)の標準偏差(standard deviatioin)と呼び、\begin{equation*}\sigma _{X},\quad \mathrm{SD}\left( X\right)
\end{equation*}などで表記します。つまり、連続型の確率変数\(X\)の標準偏差は、\begin{eqnarray*}\sigma _{X} &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because \text{標準偏差の定義} \\
&=&\sqrt{\int_{-\infty }^{+\infty }\left[ x-E\left( X\right) \right] ^{2}f_{X}\left( x\right) dx}\quad \because \text{分散の定義}
\end{eqnarray*}と定義される指標です。このとき、\begin{equation*}
\sigma _{X}^{2}=\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つため、確率変数\(X\)の分散を、\begin{equation*}\sigma _{X}^{2}
\end{equation*}で表記することもできます。

離散型の確率変数\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}と定義されますが、分散の導出過程で確率変数の値と期待値の差の平方\(\left[ x-E\left( X\right) \right]^{2}\)をとっているため、分散\(\mathrm{Var}\left( X\right) \)の単位は確率変数\(X\)の値の単位の平方になっています。一方、標準偏差は分散の平方根\begin{equation*}\sigma _{X}=\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}であるため、標準偏差\(\sigma _{X}\)の単位は確率変数\(X\)の値の単位と一致しており、指標の意味が直感的に分かりやすくなっています。

例(連続型確率変数の標準偏差)
先ほどの例について再び考えます。低リスク・低リターン型事業\(A\)を採用した場合の収益\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\frac{1}{5}
\end{equation*}であるため、標準偏差は、\begin{equation*}
\sigma _{X}=\sqrt{\frac{1}{5}}\approx 0.447
\end{equation*}となります。一方、高リスク・高リターン型事業\(B\)を採用した場合の収益\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\frac{3}{11}
\end{equation*}であるため、標準偏差は、\begin{equation*}
\sigma _{X}=\sqrt{\frac{3}{11}}\approx 0.522
\end{equation*}となります。収益\(X\)の単位が「億円」である場合、標準偏差\(\sigma _{X}\)の単位もまた「億円」である一方、分散\(\mathrm{Var}\left( X\right) \)の単位は「\(\left( \text{億円}\right) ^{2}\)」です。したがって、標準偏差のほうが直感的な分かりやすさの点において優れています。

 

分散の導出プロセスの簡略化

連続型の確率変数\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}と定義されるため、分散を導出する際には以下の手順にしたがう必要があります。

  1. 確率変数\(X\)の期待値\(E\left( X\right) \)を導出する。
  2. 確率変数\(X\)がとり得る値\(x\in X\left( \Omega \right) \)について、それと期待値\(E\left(X\right) \)の差の平方\(\left[ x-E\left( X\right) \right] ^{2}\)をとり、さらに\(f_{X}\left( x\right) \)との積を求める。
  3. 得られた積を全区間\(\mathbb{R} \)上で積分する。

ただ、以下の命題を利用することにより、分散の導出プロセスを簡略化できます。

命題(分散の導出プロセスの簡略化)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。さらに、期待値\(E\left( X\right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\mathrm{Var}\left( X\right) =E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題を踏まえると、連続型の確率変数\(X\)の分散を求める際に、以下の手順にしたがってもよいことが保証されます。

  1. 確率変数\(X\)の期待値\(E\left( X\right) \)を導出する。
  2. 確率変数\(X^{2}\)の期待値\(E\left( X^{2}\right) \)を導出する。
  3. 以上の結果を踏まえた上で、\(E\left( X^{2}\right) -\left[E\left( X\right) \right] ^{2}\)を計算する。
例(分散の導出プロセスの簡略化)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
1 & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}で与えられるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\quad
\because \text{期待値の定義} \\
&=&\int_{0}^{1}x1dx\quad \because f\text{の定義} \\
&=&\int_{0}^{1}xdx \\
&=&\left[ \frac{1}{2}x^{2}\right] _{0}^{1} \\
&=&\frac{1}{2}-0 \\
&=&\frac{1}{2}
\end{eqnarray*}となります。定義にもとづいて分散を求める場合、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx\quad \because \text{分散の定義} \\
&=&\int_{0}^{1}\left( x-\frac{1}{2}\right) ^{2}1dx\quad \because E\left(
X\right) =\frac{1}{2}\text{および}f_{X}\text{の定義} \\
&=&\int_{0}^{1}\left( x-\frac{1}{2}\right) ^{2}dx \\
&=&\left[ \frac{1}{3}\left( x-\frac{1}{2}\right) ^{3}\right] _{0}^{1} \\
&=&\frac{1}{3}\left( 1-\frac{1}{2}\right) ^{3}-\frac{1}{3}\left( 0-\frac{1}{2}\right) ^{3} \\
&=&\frac{1}{3}\left( \frac{1}{2}\right) ^{3}-\frac{1}{3}\left( -\frac{1}{2}\right) ^{3} \\
&=&\frac{1}{12}
\end{eqnarray*}となり、煩雑な計算を強いられます。一方、確率変数\(X^{2}\)の期待値が、\begin{eqnarray*}E\left( X^{2}\right) &=&\int_{-\infty }^{+\infty }x^{2}f_{X}\left( x\right)
dx\quad \because \text{期待値の定義} \\
&=&\int_{0}^{1}x^{2}1dx\quad \because f_{X}\text{の定義} \\
&=&\int_{0}^{1}x^{2}dx \\
&=&\left[ \frac{1}{3}x^{3}\right] _{0}^{1} \\
&=&\frac{1}{3}-0 \\
&=&\frac{1}{3}
\end{eqnarray*}であることを踏まえた上で、先の命題を用いて分散を求めると、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2} \\
&=&\frac{1}{3}-\left( \frac{1}{2}\right) ^{2} \\
&=&\frac{1}{12}
\end{eqnarray*}となりますが、こちらの方が計算プロセスを簡略化できます。

 

分散が有限な実数として定まらない場合

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されている場合、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\int_{-\infty }^{+\infty }\left[ x-E\left(
X\right) \right] ^{2}f_{X}\left( x\right) dx
\end{equation*}と定義されます。ただし、この定義では確率変数\(X\)の期待値\(E\left(X\right) \)が有限な実数として定まることが前提になっています。仮に期待値\(E\left( X\right) \)が有限な実数として定まらない場合、すなわち\(E\left( X\right) \)が無限大である場合や\(E\left( X\right) \)が存在しない場合には、分散\(V\left( X\right) \)は存在しないものとみなします。したがって、この場合、標準偏差\(\sigma _{X}\)もまた存在しません。

一方、期待値\(E\left( X\right) \)が有限な実数として定まるにも関わらず、分散\(\mathrm{Var}\left( X\right) \)が有限な実数として定まらない事態は起こり得ます。分散\(\mathrm{Var}\left( X\right) \)が正の無限大である場合、標準偏差\(\sigma _{X}\)もまた正の無限大であるものとみなします。以下が具体例です。

例(期待値が有限だが分散が無限大である場合)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =[1,+\infty )
\end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{2}{x^{3}} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}で与えられているものとします。\(X\)の期待値は有限な実数である一方で\(X\)の分散は正の無限大です(演習問題)。

 

連続型確率変数との合成関数の分散

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。\(C^{1}\)かつ狭義単調な関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\left( g\circ X\right) \left( \omega \right) \\
&=&g\left( X\left( \omega \right) \right) \quad \because \text{合成関数の定義}
\end{eqnarray*}を定める新たな確率変数\(Y:\Omega \rightarrow \mathbb{R} \)を定義します。確率変数\(Y\)の分散が存在する場合には、分散の導出プロセスの簡略化に関する先の命題より、\begin{equation*}\mathrm{Var}\left( Y\right) =E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2}
\end{equation*}という関係が成り立つことが保証されます。なお、\(E\left( Y^{2}\right) \)や\(E\left( Y\right) \)を導出する際にはLOTUSを利用できます。具体的には、\begin{eqnarray*}E\left( Y^{2}\right) &=&\int_{-\infty }^{+\infty }\left[ g\left( x\right) \right] ^{2}f_{X}\left( x\right) dx \\
E\left( Y\right) &=&\int_{-\infty }^{+\infty }g\left( x\right) f_{X}\left(
x\right) dx
\end{eqnarray*}などとなります。

命題(連続型確率変数との合成関数の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとする。\(C^{1}\)級かつ狭義単調な関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =g\left( X\left( \omega \right) \right)
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)を定義する。\(Y\)の分散が存在する場合には、\begin{equation*}\mathrm{Var}\left( Y\right) =E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2}
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(連続型確率変数との合成関数の分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left( 0,1\right)
\end{equation*}であるとともに、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
3x^{2} & \left( if\ 0<x<1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。その上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =\left[ X\left( \omega \right) \right] ^{2}
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)を定義します。\(Y\)の期待値は、\begin{eqnarray*}E\left( Y\right) &=&\int_{-\infty }^{+\infty }x^{2}f_{X}\left( x\right)
dx\quad \because \text{LOTUS} \\
&=&\int_{0}^{1}x^{2}3x^{2}dx \\
&=&3\int_{0}^{1}x^{4}dx \\
&=&3\cdot \frac{1}{5} \\
&=&\frac{3}{5}
\end{eqnarray*}であり、\(Y^{2}\)の期待値は、\begin{eqnarray*}E\left( Y^{2}\right) &=&\int_{-\infty }^{+\infty }\left( x^{2}\right)
^{2}f_{X}\left( x\right) dx\quad \because \text{LOTUS} \\
&=&\int_{0}^{1}x^{4}3x^{2}dx \\
&=&3\int_{0}^{1}x^{6}dx \\
&=&3\cdot \frac{1}{7} \\
&=&\frac{3}{7}
\end{eqnarray*}であるため、\(Y\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( Y\right) &=&E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2} \\
&=&\frac{3}{7}-\left( \frac{3}{5}\right) ^{2} \\
&=&\frac{12}{175}
\end{eqnarray*}となります。

 

連続型確率変数の定数倍の分散

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)と実数\(c\in \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( cX\right) \left( \omega \right) =cX\left( \omega \right)
\end{equation*}を定める新たな確率変数\(cX:\Omega \rightarrow \mathbb{R} \)が定義可能です。\(c=0\)の場合には、任意の\(\omega \in \Omega \)に対して、\begin{equation*}\left( cX\right) \left( \omega \right) =0
\end{equation*}となるため\(cX\)は定数値関数であり、したがって離散型の確率変数になります。そこで以降では\(c\not=0\)の場合について考えます。\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、なおかつ\(X\)の分散\(\mathrm{Var}\left( X\right) \)が存在する場合、\(cX\)の分散\(\mathrm{Var}\left(cX\right) \)が存在することが保証されるとともに、両者の間には、\begin{equation*}E\left( cX\right) =cE\left( X\right)
\end{equation*}という関係が成り立ちます。

命題(連続型確率変数の定数倍の分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)および非ゼロの実数\(c\in \mathbb{R} \backslash \left\{ 0\right\} \)がそれぞれ任意に与えられたとき、そこから確率変数\(cX:\Omega \rightarrow \mathbb{R} \)を定義する。\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)のもとで\(X\)の分散が存在する場合、\(cX\)の分散もまた存在し、\begin{equation*}\mathrm{Var}\left( cX\right) =c^{2}\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(連続型確率変数の定数倍の分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)に関して、\begin{equation}\mathrm{Var}\left( X\right) =3 \quad \cdots (1)
\end{equation}が成り立つものとします。確率変数\(2X:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( 2X\right) \left( \omega \right) =2X\left( \omega \right)
\end{equation*}を定めるものとして定義されますが、その分散は、先の命題より、\begin{eqnarray*}
\mathrm{Var}\left( 2X\right) &=&2^{2}\mathrm{Var}\left( X\right) \\
&=&4\cdot 3\quad \because \left( 1\right) \\
&=&12
\end{eqnarray*}となります。

 

連続型確率変数の1次スケーリングの分散

連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)と非ゼロの実数\(c,d\in \mathbb{R} \backslash \left\{ 0\right\} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( cX+d\right) \left( \omega \right) =cX\left( \omega \right) +d
\end{equation*}を定める新たな確率変数\(cX+d:\Omega \rightarrow \mathbb{R} \)が定義可能です。\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、なおかつ\(X\)の分散\(\mathrm{Var}\left( X\right) \)が存在する場合、\(cX+d\)の分散\(\mathrm{Var}\left(cX+d\right) \)が存在することが保証されるとともに、両者の間には、\begin{equation*}E\left( cX+d\right) =c^{2}E\left( X\right)
\end{equation*}という関係が成り立ちます。

命題(連続型確率変数の1次スケーリングの分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)および非ゼロの実数\(c,d\in \mathbb{R} \backslash \left\{ 0\right\} \)がそれぞれ任意に与えられたとき、そこから確率変数\(cX+d:\Omega \rightarrow \mathbb{R} \)を定義する。\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)のもとで\(X\)の分散が存在する場合、\(cX+d\)の分散もまた存在し、\begin{equation*}\mathrm{Var}\left( cX+d\right) =c^{2}\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(連続型確率変数の1次スケーリングの分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)に関して、\begin{equation}\mathrm{Var}\left( X\right) =3 \quad \cdots (1)
\end{equation}が成り立つものとします。確率変数\(2X+1:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( 2X+1\right) \left( \omega \right) =2X\left( \omega \right) +1
\end{equation*}を定めるものとして定義されますが、その分散は、先の命題より、\begin{eqnarray*}
\mathrm{Var}\left( 2X+1\right) &=&2^{2}\mathrm{Var}\left( X\right) \\
&=&4\cdot 3\quad \because \left( 1\right) \\
&=&12
\end{eqnarray*}となります。

 

連続型確率変数の和の分散

連続型の確率変数\(X,Y:\Omega\rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( X+Y\right) \left( \omega \right) =X\left( \omega \right) +Y\left(
\omega \right)
\end{equation*}を定める新たな確率変数\(X+Y:\Omega \rightarrow \mathbb{R} \)が定義可能です。\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって、\(Y\)の確率分布が確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)によってそれぞれ記述されているとともに、\(X,Y\)の期待値\(E\left( X\right),E\left( Y\right) \)がともに存在する場合、\(X+Y\)の期待値\(E\left( X+Y\right) \)が存在することが保証されるとともに、それらの間には、\begin{equation*}E\left( X+Y\right) =E\left( X\right) +E\left( Y\right)
\end{equation*}という関係が成り立つことは以前に示した通りです。一方、分散に関しては、\begin{equation*}
\mathrm{Var}\left( X+Y\right) =\mathrm{Var}\left( X\right) +\mathrm{Var}\left(
Y\right)
\end{equation*}という関係は成立するとは限りません。以下の例より明らかです。

例(連続型確率変数の和の分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
1 & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}で与えられるものとします。\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2} \\
&=&\int_{-\infty }^{+\infty }x^{2}f_{X}\left( x\right) dx-\left[
\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx\right] ^{2}\quad \because
\text{LOTUS} \\
&=&\int_{0}^{1}x^{2}dx-\left( \int_{0}^{1}xdx\right) ^{2} \\
&=&\frac{1}{3}-\left( \frac{1}{2}\right) ^{2} \\
&=&\frac{1}{12}
\end{eqnarray*}です。確率変数\(2X:\Omega\rightarrow \mathbb{R} \)に注目します。これはそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}2X\left( \omega \right) =2X\left( \omega \right)
\end{equation*}を定めます。\(2X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( 2X\right) &=&2^{2}\mathrm{Var}\left( X\right) \quad \because
\text{確率変数の定数倍の分散} \\
&=&4\cdot \frac{1}{12}\quad \because \mathrm{Var}\left( X\right) =\frac{1}{12}
\\
&=&\frac{1}{3}
\end{eqnarray*}です。以上より、\begin{eqnarray*}
\mathrm{Var}\left( X\right) +\mathrm{Var}\left( 2X\right) &=&\frac{1}{12}+\frac{1}{3} \\
&=&\frac{5}{12}
\end{eqnarray*}を得ます。さて、これらの確率変数\(X,2X\)の和として定義される確率関数\(X+2X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}\left( X+2X\right) \left( \omega \right) &=&X\left( \omega \right)
+2X\left( \omega \right) \\
&=&3X\left( \omega \right)
\end{eqnarray*}を定めます。\(X+2X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X+2X\right) &=&\mathrm{Var}\left( 3X\right) \\
&=&3^{2}\mathrm{Var}\left( X\right) \quad \because \text{確率変数の定数倍の分散} \\
&=&9\cdot \frac{1}{12}\quad \because \mathrm{Var}\left( X\right) =\frac{1}{12}
\\
&=&\frac{3}{4}
\end{eqnarray*}です。以上より、\begin{equation*}
\mathrm{Var}\left( X\right) +\mathrm{Var}\left( 2X\right) \not=\mathrm{Var}\left(
X+2X\right)
\end{equation*}であることが明らかになりました。

 

演習問題

問題(連続型確率変数の分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ 0,1\right] \end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cc}
3x^{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}で与えられているものとします。\(X\)の分散を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(連続型確率変数の分散)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =[1,+\infty )
\end{equation*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{2}{x^{3}} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}で与えられているものとします。\(f_{X}\)が確率密度関数であることを確認した上で、\(X\)の期待値と分散をそれぞれ求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

離散型の一様分布

離散型の確率変数がすべての値を等しい確率でとる場合、そのような確率変数は離散型の一様分布にしたがうと言います。離散型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型確率変数の分散と標準偏差

離散型の確率変数がとり得るそれぞれの値に対して、その値と期待値の差の平方をとった上で、得られた平方の総和をとると分散と呼ばれる指標が得られます。分散の正の平方根を標準偏差と呼びます。

離散型確率変数の中央化・標準化・正規化

期待値が0になるように確率変数を変換する操作を中央化と呼び、期待値が0で分散が1になるように確率変数を変換する操作を標準化と呼び、確率変数がとり得る値の範囲が0以上1以下になるように確率変数を変換する操作を正規化と呼びます。

連続型の一様分布

連続型の確率変数の確率分布を記述する確率密度関数が定数関数である場合、その確率変数は連続型の一様分布にしたがうと言います。連続型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

指数分布

何らかの出来事が起こるまでの経過時点を表す連続型の確率変数の確率分布を指数分布と呼びます。指数分布を定義するとともに、その基本的な性質について解説します。

離散型同時確率変数の分散と標準偏差

離散型の同時確率変数の分散を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の分散を求める方法を解説します。また、独立な確率変数の和の分散は個々の確率変数の分散の和と一致することを示します。

連続型の確率変数

それぞれの標本点に対して実数を1つずつ割り当てる写像を確率変数と呼びます。値域が区間もしくは互いに素な区間の和集合であるような確率変数を連続型の確率変数と呼びます。

連続型確率変数の期待値

連続型の確率変数の値と確率密度関数の値の積を全区間上で積分することにより得られる値を確率変数の期待値と呼びます。期待値は確率変数の実現値の見込みの値を表す指標です。

連続型同時確率変数の分散と標準偏差

連続型の同時確率変数の分散を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の分散を求める方法を解説します。また、独立な確率変数の和の分散は個々の確率変数の分散の和と一致することを示します。