WIIS

離散型の確率分布

離散型確率変数の分散と標準偏差

目次

Mailで保存
Xで共有

期待値の欠点

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。加えて、確率変数\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。つまり、確率変数\(X\)が値\(x\in \mathbb{R} \)をとる確率は、\begin{equation*}P\left( X=x\right) =f_{X}\left( x\right)
\end{equation*}であり、確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f_{X}\left( x\right)
\end{equation*}であるということです。

問題としている試行のもとで確率変数\(X\)が取り得る値の範囲\(X\left(\Omega \right) \)は分かっていますが、試行はランダムネスによって支配されているため、\(X\left(\Omega \right) \)の中のどの値が実際に実現するかを事前に特定できません。したがって、何らかの手段を通じて\(X\left( \Omega \right) \)の中のどの値が実際に実現するかを予測する必要があります。以上の問題意識のもと、確率変数\(X\)の期待値\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[ x\cdot
f_{X}\left( x\right) \right] \end{equation*}と呼ばれる指標を導入しました。これは確率変数\(X\)の実現値の見込み値を表す指標です。

ただ、確率変数の確率分布を表現する指標として期待値に欠点がないわけではありません。実際、確率変数の確率分布が明らかに異なるにも関わらず、それらの期待値が一致するような状況は起こり得ます。期待値は確率分布の違いを上手く表現できると限らないということです。以下の例より明らかです。

例(期待値の欠点)
「事業を行う」という試行の標本空間が、\begin{equation*}
\Omega =\left\{ \text{大成功},\text{成功},\text{普通},\text{失敗},\text{大失敗}\right\}
\end{equation*}であるものとします。事業の結果から得られる収益を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)が、\begin{eqnarray*}X\left( \text{大成功}\right) &=&1000 \\
X\left( \text{成功}\right) &=&100 \\
X\left( \text{普通}\right) &=&0 \\
X\left( \text{失敗}\right) &=&-100 \\
X\left( \text{大失敗}\right) &=&-1000
\end{eqnarray*}として与えられているものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1000,100,0,-100,-1000\right\}
\end{equation*}という有限集合であるため、これは離散型の確率変数です。ある事業\(A\)を行った場合、確率変数\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{eqnarray*}f_{X}\left( 1000\right) &=&0 \\
f_{X}\left( 100\right) &=&\frac{1}{4} \\
f_{X}\left( 0\right) &=&\frac{1}{2} \\
f_{X}\left( -100\right) &=&\frac{1}{4} \\
f_{X}\left( -1000\right) &=&0
\end{eqnarray*}を満たす一方で、別の事業\(B\)を行った場合、確率変数\(X\)の確率質量関数\(g_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{eqnarray*}g_{X}\left( 1000\right) &=&\frac{1}{4} \\
g_{X}\left( 100\right) &=&0 \\
g_{X}\left( 0\right) &=&\frac{1}{2} \\
g_{X}\left( -100\right) &=&0 \\
g_{X}\left( -1000\right) &=&\frac{1}{4}
\end{eqnarray*}を満たすものとします。つまり、事業\(A\)は低リスク・底リターン型であり、事業\(B\)は高リスク・高リターン型です。両者は確率分布として明らかに異なります。その一方で、どちらの事業を採用した場合においても、確率変数\(X\)の期待値、すなわち事業から得られる収益の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}で等しくなります(確認してください)。つまり、確率変数\(X\)の確率分布を描写する指標として期待値だけに頼った場合、この2つの事業のタイプの違いを表現できないことになってしまいます。では、どのような指標を導入すれば2つの確率分布の違いを上手く表現できるでしょうか。事業\(A\)では期待値\(0\)の近くにある\(X\)の値が起こりやすい傾向があり、逆に、事業\(B\)では期待値\(0\)から離れている\(X\)の値が起こりやすい傾向があります。このような違いを表現するために、確率変数\(X\)の値が期待値のまわりにどのように散らばっているかを表現する新たな指標が要請されます。

 

離散型確率変数の分散

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているとともに、\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。加えて、\(X\)の期待値\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[ x\cdot
f_{X}\left( x\right) \right] \end{equation*}が有限な実数として定まるものとします。確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表現するために、\(X\)がとり得るそれぞれの値\(x\in X\left( \Omega \right) \)と期待値の差\(x-E\left( X\right) \)をとります。符号を正に統一するために平方\(\left[ x-E\left( X\right) \right] ^{2}\)をとった上で、この値の期待値\begin{equation*}E\left[ \left[ X-E\left( X\right) \right] ^{2}\right] \end{equation*}を散らばりの指標として採用します。具体的には、\begin{equation*}
E\left[ \left[ X-E\left( X\right) \right] ^{2}\right] =\sum_{x\in X\left(
\Omega \right) }\left[ x-E\left( X\right) \right] ^{2}f_{X}\left( x\right)
\quad \because \text{LOTUS}
\end{equation*}となります。この指標を確率変数\(X\)の分散(variance)と呼び、\begin{equation*}\mathrm{Var}\left( X\right)
\end{equation*}で表記します。つまり、\begin{equation*}
\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f_{X}\left( x\right)
\end{equation*}を満たすものとして分散は定義されます。

繰り返しになりますが、分散\(\mathrm{Var}\left( X\right) \)は確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表す指標です。確率変数\(X\)の値\(x\)の多くが期待値\(E\left( X\right) \)から離れた場所に分布している場合には分散\(\mathrm{Var}\left( X\right) \)は大きく評価され、逆に、確率変数\(X\)の値\(x\)の多くが期待値\(E\left( X\right) \)の近くに分布している場合には分散\(\mathrm{Var}\left( X\right) \)は小さく評価されます。

例(離散型確率変数の分散)
先ほどの例について再び考えます。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1000,100,0,-100,-1000\right\}
\end{equation*}です。事業\(A\)のもとでの確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}f_{X}\left( 1000\right) &=&0 \\
f_{X}\left( 100\right) &=&\frac{1}{4} \\
f_{X}\left( 0\right) &=&\frac{1}{2} \\
f_{X}\left( -100\right) &=&\frac{1}{4} \\
f_{X}\left( -1000\right) &=&0
\end{eqnarray*}であり、この場合の\(X\)の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\left( 1000-0\right) ^{2}\cdot 0+\left(
100-0\right) ^{2}\cdot \frac{1}{4}+\left( 0-0\right) ^{2}\cdot \frac{1}{2}+\left( -100-0\right) ^{2}\cdot \frac{1}{4}+\left( -1000-0\right) ^{2}\cdot 0
\\
&=&10000\cdot \frac{1}{4}+10000\cdot \frac{1}{4} \\
&=&5000
\end{eqnarray*}です。一方、事業\(B\)のもとでの確率質量関数\(g_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}g_{X}\left( 1000\right) &=&\frac{1}{4} \\
g_{X}\left( 100\right) &=&0 \\
g_{X}\left( 0\right) &=&\frac{1}{2} \\
g_{X}\left( -100\right) &=&0 \\
g_{X}\left( -1000\right) &=&\frac{1}{4}
\end{eqnarray*}であり、この場合の\(X\)の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\left( 1000-0\right) ^{2}\cdot \frac{1}{4}+\left( 100-0\right) ^{2}\cdot 0+\left( 0-0\right) ^{2}\cdot \frac{1}{2}+\left( -100-0\right) ^{2}\cdot 0+\left( -1000-0\right) ^{2}\cdot \frac{1}{4}
\\
&=&1000000\cdot \frac{1}{4}+1000000\cdot \frac{1}{4} \\
&=&500000
\end{eqnarray*}です。低リスク・低リターン型の事業\(A\)では期待値\(E\left( X\right) \)の近くにある\(X\)の値が起こりやすい傾向があり、逆に、高リスク・高リターン型の事業\(B\)では期待値\(E\left( X\right) \)から離れている\(X\)の値が起こりやすい傾向がありますが、その違いが分散の値の違いとして上手く表現できています。

 

離散型確率変数の標準偏差

離散型の確率変数\(X\)の分散\(\mathrm{Var}\left( X\right) \)が有限な実数として定まる場合、それは必ず非負の実数として定まるため、その正の平方根\begin{equation*}\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}をとることができます。この指標を確率変数\(X\)の標準偏差(standard deviatioin)と呼び、\begin{equation*}\sigma _{X},\quad \mathrm{SD}\left( X\right)
\end{equation*}などで表記します。つまり、離散型の確率変数\(X\)の標準偏差は、\begin{eqnarray*}\sigma _{X} &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because \text{標準偏差の定義} \\
&=&\sqrt{\sum_{x\in X\left( \Omega \right) }\left[ x-E\left( X\right) \right] ^{2}f\left( x\right) }\quad \because \text{分散の定義}
\end{eqnarray*}と定義される指標です。このとき、\begin{equation*}
\sigma _{X}^{2}=\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つため、確率変数\(X\)の分散を、\begin{equation*}\sigma _{X}^{2}
\end{equation*}で表記することもできます。

離散型の確率変数\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f_{X}\left( x\right)
\end{equation*}と定義されますが、分散の導出過程で確率変数の値と期待値の差の平方\(\left[ x-E\left( X\right) \right]^{2}\)をとっているため、分散\(\mathrm{Var}\left( X\right) \)の単位は確率変数\(X\)の値の単位の平方になっています。一方、標準偏差は分散の平方根\begin{equation*}\sigma _{X}=\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}であるため、標準偏差\(\sigma _{X}\)の単位は確率変数\(X\)の値の単位と一致しており、指標の意味が直感的に分かりやすくなっています。

例(離散型確率変数の標準偏差)
先ほどの例について再び考えます。低リスク・低リターン型の事業\(A\)を採用した場合の収益\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =5000
\end{equation*}であるため、標準偏差は、\begin{equation*}
\sigma _{X}=\sqrt{5000}\approx 70.7
\end{equation*}となります。一方、高リスク・高リターン型の事業\(B\)を採用した場合の収益\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =500000
\end{equation*}であるため、標準偏差は、\begin{equation*}
\sigma _{X}=\sqrt{500000}\approx 707.1
\end{equation*}となります。収益\(X\)の単位が「万円」である場合、標準偏差\(\sigma _{X}\)の単位もまた「万円」である一方、分散\(\mathrm{Var}\left( X\right) \)の単位は「\(\left( \text{万円}\right) ^{2}\)」です。したがって、標準偏差のほうが直感的な分かりやすさの点において優れています。

 

分散の導出プロセスの簡略化

離散型の確率変数\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f_{X}\left( x\right)
\end{equation*}と定義されるため、分散を導出する際には以下の手順にしたがう必要があります。

  1. 確率変数\(X\)の期待値\(E\left( X\right) \)を導出する。
  2. 確率変数\(X\)がとり得るそれぞれの値\(x\in X\left( \Omega\right) \)について、それと期待値\(E\left( X\right) \)の差の平方\(\left[ x-E\left( X\right) \right] ^{2}\)をとり、さらに\(f_{X}\left( x\right) \)との積を求める。
  3. 得られたすべての積の総和をとる。

ただ、以下の命題を利用することにより、分散の導出プロセスを簡略化できます。

命題(分散の導出プロセスの簡略化)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。さらに、期待値\(E\left( X\right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\mathrm{Var}\left( X\right) =E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題を踏まえると、離散型の確率変数\(X\)の分散を求める際に、以下の手順にしたがってもよいことが保証されます。

  1. 確率変数\(X\)の期待値\(E\left( X\right) \)を導出する。
  2. 確率変数\(X^{2}\)の期待値\(E\left( X^{2}\right) \)を導出する。
  3. 以上の結果を踏まえた上で、\(E\left( X^{2}\right) -\left[E\left( X\right) \right] ^{2}\)を計算する。
例(分散の導出プロセスの簡略化)
「サイコロを1回投げて出た目を観察する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ 1,2,3,4,5,6\right\}
\end{equation*}です。出た目を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1,2,3,4,5,6\right\}
\end{equation*}という有限集合であるため、これは離散型の確率変数です。サイコロに偏りがないのであれば、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{6} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\sum_{x\in X\left( \Omega \right) }xf_{X}\left(
x\right) \\
&=&\left( 1+2+3+4+5+6\right) \cdot \frac{1}{6} \\
&=&\frac{7}{2}
\end{eqnarray*}となります。定義にもとづいて分散を求める場合、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f_{X}\left( x\right) \\
&=&\left[ \left( 1-\frac{7}{2}\right) ^{2}+\left( 2-\frac{7}{2}\right)
^{2}+\left( 3-\frac{7}{2}\right) ^{2}+\left( 4-\frac{7}{2}\right)
^{2}+\left( 5-\frac{7}{2}\right) ^{2}+\left( 6-\frac{7}{2}\right) ^{2}\right] \cdot \frac{1}{6} \\
&=&\frac{35}{2}\cdot \frac{1}{6} \\
&=&\frac{35}{12}
\end{eqnarray*}となり、煩雑な計算を強いられます。一方、確率変数\(X^{2}\)の期待値が、\begin{eqnarray*}E\left( X^{2}\right) &=&\sum_{x\in X\left( \Omega \right) }x^{2}f_{X}\left(
x\right) \quad \because \text{LOTUS} \\
&=&\left( 1^{2}+2^{2}+3^{2}+4^{2}+5^{2}+6^{2}\right) \cdot \frac{1}{6} \\
&=&\frac{91}{6}
\end{eqnarray*}であることを踏まえた上で、先の命題を用いて分散を求めると、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2} \\
&=&\frac{91}{6}-\left( \frac{7}{2}\right) ^{2} \\
&=&\frac{35}{12}
\end{eqnarray*}となりますが、こちらの方が計算プロセスを簡略化できます。

 

分散が有限な実数として定まらない場合

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されている場合、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f_{X}\left( x\right)
\end{equation*}と定義されます。ただし、この定義では確率変数\(X\)の期待値\(E\left(X\right) \)が有限な実数として定まることが前提になっています。仮に期待値\(E\left( X\right) \)が有限な実数として定まらない場合、すなわち\(E\left( X\right) \)が無限大である場合や\(E\left( X\right) \)が存在しない場合には、分散\(V\left( X\right) \)は存在しないものとみなします。したがって、この場合、標準偏差\(\sigma _{X}\)もまた存在しません。

一方、期待値\(E\left( X\right) \)が有限な実数として定まるにも関わらず、分散\(\mathrm{Var}\left( X\right) \)が有限な実数として定まらない事態は起こり得ます。分散\(\mathrm{Var}\left( X\right) \)が正の無限大である場合、標準偏差\(\sigma _{X}\)もまた正の無限大であるものとみなします。以下が具体例です。

例(期待値が有限だが分散が無限大である場合)
確率変数\(X\)の値域が、\begin{equation*}X\left( \Omega \right) =\mathbb{N} =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるものとします。これは可算集合であるため\(X\)は可算型の確率変数です。\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{c}{x^{3}} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。ただし\(c\)は、\begin{equation*}\sum_{x=1}^{+\infty }\frac{c}{x^{3}}=1
\end{equation*}を満たす実数です。実際、\begin{equation*}
\sum_{x=1}^{+\infty }\frac{1}{x^{3}}
\end{equation*}は無理数であるため(アペリーの定理)、このような\(c\)をとることができます。このとき、期待値\(E\left( X\right) \)が有限な実数である一方で、分散\(E\left( X\right) \)は正の無限大です(演習問題)。

 

離散型確率変数との合成関数の分散

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Y\left( \omega \right) &=&\left( g\circ X\right) \left( \omega \right) \\
&=&g\left( X\left( \omega \right) \right) \quad \because \text{合成関数の定義}
\end{eqnarray*}を定める新たな確率変数\(Y:\Omega \rightarrow \mathbb{R} \)を定義します。確率変数\(Y\)の分散が存在する場合には、分散の導出プロセスの簡略化に関する先の命題より、\begin{equation*}\mathrm{Var}\left( Y\right) =E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2}
\end{equation*}という関係が成り立つことが保証されます。なお、\(E\left( Y^{2}\right) \)や\(E\left( Y\right) \)を導出する際にはLOTUSを利用できます。具体的には、\begin{eqnarray*}E\left( Y^{2}\right) &=&\sum_{x\in X\left( \Omega \right) }\left[ g\left(
x\right) \right] ^{2}f_{X}\left( x\right) \\
E\left( Y\right) &=&\sum_{x\in X\left( \Omega \right) }g\left( x\right)
f_{X}\left( x\right)
\end{eqnarray*}などとなります。

命題(離散型確率変数との合成関数の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとする。関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =g\left( X\left( \omega \right) \right)
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)を定義する。\(Y\)の分散が存在する場合には、\begin{equation*}\mathrm{Var}\left( Y\right) =E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2}
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(離散型確率変数との合成関数の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ -1,0,1,2,3\right\}
\end{equation*}であるとともに、\(X\)の確率分布を表す確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{5} & \left( if\ x=-1,0,1,2,3\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。その上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Y\left( \omega \right) =2\left\vert X\left( \omega \right) \right\vert
\end{equation*}を定める確率変数\(Y:\Omega\rightarrow \mathbb{R} \)を定義します。\(Y\)の期待値は、\begin{eqnarray*}E\left( Y\right) &=&\sum_{x\in X\left( \Omega \right) }\left[ 2\left\vert
x\right\vert \cdot f_{X}\left( x\right) \right] \quad \because \text{LOTUS}
\\
&=&\frac{1}{5}\cdot 2\left\vert -1\right\vert +\frac{1}{5}\cdot 2\left\vert
0\right\vert +\frac{1}{5}\cdot 2\left\vert 1\right\vert +\frac{1}{5}\cdot
2\left\vert 2\right\vert +\frac{1}{5}\cdot 2\left\vert 3\right\vert \\
&=&\frac{14}{5}
\end{eqnarray*}であり、\(Y^{2}\)の期待値は、\begin{eqnarray*}E\left( Y^{2}\right) &=&\sum_{x\in X\left( \Omega \right) }\left[ \left(
2\left\vert x\right\vert \right) ^{2}\cdot f_{X}\left( x\right) \right] \quad \because \text{LOTUS} \\
&=&\sum_{x\in X\left( \Omega \right) }\left[ 4x^{2}\cdot f_{X}\left(
x\right) \right] \\
&=&\frac{1}{5}\cdot 4\cdot \left( -1\right) ^{2}+\frac{1}{5}\cdot 4\cdot
0^{2}+\frac{1}{5}\cdot 4\cdot 1^{2}+\frac{1}{5}\cdot 4\cdot 2^{2}+\frac{1}{5}\cdot 4\cdot 3^{2} \\
&=&12
\end{eqnarray*}であるため、\(Y\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( Y\right) &=&E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2} \\
&=&12-\left( \frac{14}{5}\right) ^{2} \\
&=&\frac{104}{25}
\end{eqnarray*}となります。

 

離散型定数確率変数の分散

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)が与えられているとともに、これがそれぞれの\(\omega \in \Omega \)に対して定める値が、ある実数\(c\in \mathbb{R} \)を用いて、\begin{equation*}X\left( \omega \right) =c
\end{equation*}と表されるものとします。つまり、\(X\)は定数関数であるということです。この場合、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は必然的に、\begin{equation*}f_{X}\left( c\right) =1
\end{equation*}を満たします。さらに、\(X\)の分散が存在することが保証されるとともに、\begin{equation*}\mathrm{Var}\left( X\right) =0
\end{equation*}となります。つまり、定数確率関数の分散は\(0\)になります。

命題(離散型定数確率変数の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)がそれぞれの\(\omega \in \Omega \)に対して定める値が、ある実数\(c\in \mathbb{R} \)を用いて、\begin{equation*}X\left( \omega \right) =c
\end{equation*}と表される場合には、\(X\)の分散が存在するとともに、\begin{equation*}\mathrm{Var}\left( X\right) =0
\end{equation*}となる。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(離散型定数確率変数の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =3
\end{equation*}を定めるものとします。その分散は、先の命題より、\begin{equation*}
\mathrm{Var}\left( X\right) =0
\end{equation*}となります。

 

離散型確率変数の定数倍の分散

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)と実数\(c\in \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( cX\right) \left( \omega \right) =cX\left( \omega \right)
\end{equation*}を定める新たな確率変数\(cX:\Omega \rightarrow \mathbb{R} \)が定義可能です。\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、なおかつ\(X\)の分散\(\mathrm{Var}\left( X\right) \)が存在する場合、\(cX\)の分散\(\mathrm{Var}\left(cX\right) \)が存在することが保証されるとともに、両者の間には、\begin{equation*}\mathrm{Var}\left( cX\right) =c^{2}\mathrm{Var}\left( X\right)\end{equation*}という関係が成り立ちます。

命題(離散型確率変数の定数倍の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)および実数\(c\in \mathbb{R} \)がそれぞれ任意に与えられたとき、そこから確率変数\(cX:\Omega \rightarrow \mathbb{R} \)を定義する。\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)のもとで\(X\)の分散が存在する場合、\(cX\)の分散もまた存在し、\begin{equation*}\mathrm{Var}\left( cX\right) =c^{2}\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(離散型確率変数の定数倍の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)に関して、\begin{equation}\mathrm{Var}\left( X\right) =3 \quad \cdots (1)
\end{equation}が成り立つものとします。確率変数\(2X:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( 2X\right) \left( \omega \right) =2X\left( \omega \right)
\end{equation*}を定めるものとして定義されますが、その分散は、先の命題より、\begin{eqnarray*}
\mathrm{Var}\left( 2X\right) &=&2^{2}\mathrm{Var}\left( X\right) \\
&=&4\cdot 3\quad \because \left( 1\right) \\
&=&12
\end{eqnarray*}となります。

例(離散型確率変数の定数倍の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)がそれぞれの\(\omega \in \Omega \)に対して定める値が、ある定数\(a\in \mathbb{R} \)を用いて、\begin{equation}X\left( \omega \right) =a \quad \cdots (1)
\end{equation}と表されるものとします。つまり、\(X\)は定数確率変数です。したがって、\begin{equation}\mathrm{Var}\left( X\right) =0 \quad \cdots (2)
\end{equation}が明らかに成り立ちます。実数\(c\in \mathbb{R} \)を任意に選んだ上で確率変数\(cX:\Omega \rightarrow \mathbb{R} \)を定義すると、これはそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}\left( cX\right) \left( \omega \right) &=&cX\left( \omega \right) \quad
\because cX\text{の定義} \\
&=&ca\quad \because \left( 1\right)
\end{eqnarray*}を定めますが、これは定数関数であるため、\begin{equation}
\mathrm{Var}\left( cX\right) =0 \quad \cdots (3)
\end{equation}が明らかに成り立ちます。一方、先の命題を用いて\(cX\)の分散を求めると、\begin{eqnarray*}\mathrm{Var}\left( cX\right) &=&c^{2}\mathrm{Var}\left( X\right) \\
&=&c^{2}0\quad \because \left( 2\right) \\
&=&0
\end{eqnarray*}となりますが、これは\(\left( 3\right) \)と整合的です。つまり、先の命題は定数確率変数の定数倍として定義される確率変数の分散に関する主張を特殊例として含んでいます。

 

離散型確率変数の1次スケーリングの分散

離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)と実数\(c,d\in \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( cX+d\right) \left( \omega \right) =cX\left( \omega \right) +d
\end{equation*}を定める新たな確率変数\(cX+d:\Omega \rightarrow \mathbb{R} \)が定義可能です。\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、なおかつ\(X\)の分散\(\mathrm{Var}\left( X\right) \)が存在する場合、\(cX+d\)の分散\(\mathrm{Var}\left(cX+d\right) \)が存在することが保証されるとともに、両者の間には、\begin{equation*}\mathrm{Var}\left( cX+d\right) =c^{2}\mathrm{Var}\left( X\right)\end{equation*}という関係が成り立ちます。

命題(離散型確率変数の1次スケーリングの分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)および実数\(c,d\in \mathbb{R} \)がそれぞれ任意に与えられたとき、そこから確率変数\(cX+d:\Omega \rightarrow \mathbb{R} \)を定義する。\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)のもとで\(X\)の分散が存在する場合、\(cX+d\)の分散もまた存在し、\begin{equation*}\mathrm{Var}\left( cX+d\right) =c^{2}\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(離散型確率変数の1次スケーリングの分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)に関して、\begin{equation}\mathrm{Var}\left( X\right) =3 \quad \cdots (1)
\end{equation}が成り立つものとします。確率変数\(2X+1:\Omega\rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( 2X+1\right) \left( \omega \right) =2X\left( \omega \right) +1
\end{equation*}を定めるものとして定義されますが、その分散は、先の命題より、\begin{eqnarray*}
\mathrm{Var}\left( 2X+1\right) &=&2^{2}\mathrm{Var}\left( X\right) \\
&=&4\cdot 3\quad \because \left( 1\right) \\
&=&12
\end{eqnarray*}となります。

 

離散型確率変数の和の分散

離散型の確率変数\(X,Y:\Omega\rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( X+Y\right) \left( \omega \right) =X\left( \omega \right) +Y\left(
\omega \right)
\end{equation*}を定める新たな確率変数\(X+Y:\Omega \rightarrow \mathbb{R} \)が定義可能です。\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって、\(Y\)の確率分布が確率質量関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)によってそれぞれ記述されているとともに、\(X,Y\)の期待値\(E\left( X\right),E\left( Y\right) \)がともに存在する場合、\(X+Y\)の期待値\(E\left( X+Y\right) \)が存在することが保証されるとともに、それらの間には、\begin{equation*}E\left( X+Y\right) =E\left( X\right) +E\left( Y\right)
\end{equation*}という関係が成り立つことは以前に示した通りです。一方、分散に関しては、\begin{equation*}
\mathrm{Var}\left( X+Y\right) =\mathrm{Var}\left( X\right) +\mathrm{Var}\left(
Y\right)
\end{equation*}という関係は成立するとは限りません。以下の例より明らかです。

例(離散型確率変数の和の分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 1,-1\right\}
\end{equation*}であるとともに、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{2} & \left( if\ x=1\right) \\
\frac{1}{2} & \left( if\ x=-1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の分散を求めます。具体的には、\begin{eqnarray*}E\left( X\right) &=&1\cdot f\left( 1\right) +\left( -1\right) \cdot f\left(
-1\right) \\
&=&\frac{1}{2}-\frac{1}{2} \\
&=&0
\end{eqnarray*}であり、\begin{eqnarray*}
E\left( X^{2}\right) &=&1^{2}\cdot f\left( 1\right) +\left( -1\right)
^{2}\cdot f\left( -1\right) \quad \because \text{LOTUS} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}であるため、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}\quad \because \text{期待値と分散の関係} \\
&=&1-0^{2} \\
&=&1
\end{eqnarray*}であることが明らかになりました。確率変数\(-X:\Omega \rightarrow \mathbb{R} \)に注目します。これはそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left( -X\right) \left( \omega \right) =-X\left( \omega \right)
\end{equation*}を定めるものとして定義されます。\(-X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( -X\right) &=&\left( -1\right) ^{2}\mathrm{Var}\left(
X\right) \quad \because \text{確率変数の定数倍の分散} \\
&=&1\cdot 1\quad \because \mathrm{Var}\left( X\right) =1 \\
&=&1
\end{eqnarray*}です。さて、これらの確率変数\(X,-X\)の和として定義される確率関数\(X+\left( -X\right) :\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}\left( X+\left( -X\right) \right) \left( \omega \right) &=&X\left( \omega
\right) +\left[ -X\left( \omega \right) \right] \\
&=&0
\end{eqnarray*}を定めるため、これは定数値関数であり、したがってその分散は、\begin{equation*}
\mathrm{Var}\left( X+\left( -X\right) \right) =0
\end{equation*}です。以上より、\begin{equation*}
\mathrm{Var}\left( X+\left( -X\right) \right) \not=\mathrm{Var}\left( X\right) +\mathrm{Var}\left( -X\right)
\end{equation*}であることが明らかになりました。

 

演習問題

問題(離散型確率変数の分散)
離散型確率変数\(X\)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,3\right\}
\end{equation*}であるとともに、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{4} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}であるものとします。\(X\)の分散を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(離散型確率変数の分散)
離散型確率変数\(X\)の値域が、\begin{equation*}X\left( \Omega \right) =\left\{ 1,2,3,4\right\}
\end{equation*}であるとともに、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{1}{30}x^{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}であるものとします。\(X\)の分散を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(期待値が有限だが分散が無限大である場合)
確率変数\(X\)の値域が、\begin{equation*}X\left( \Omega \right) =\mathbb{N} =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるものとします。これは可算集合であるため\(X\)は可算型の確率変数です。\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\frac{c}{x^{3}} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。ただし\(c\)は、\begin{equation*}\sum_{x=1}^{+\infty }\frac{c}{x^{3}}=1
\end{equation*}を満たす実数です。このとき、期待値\(E\left(X\right) \)が有限な実数である一方で、分散\(E\left( X\right) \)は正の無限大であることを示してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(期待値と分散)
離散型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の期待値と分散がともに存在する場合、以下の関係\begin{equation*}\mathrm{Var}\left( X\right) =\mathrm{Var}\left( X-E\left( X\right) \right)
\end{equation*}が成立することを示してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録