WIIS

教材一覧
教材一覧
教材検索
PROBABILITY DISTRIBUTION

離散型確率変数の分散と標準偏差

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

期待値の欠点

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が有限集合または可算集合であるということです。加えて、確率変数\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。つまり、確率変数\(X\)が値\(x\in \mathbb{R} \)をとる確率は、\begin{equation*}P\left( X=x\right) =f\left( x\right)
\end{equation*}であり、確率変数\(X\)の値が点集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f\left( x\right)
\end{equation*}であるということです。問題としている試行のもとで確率変数\(X\)が取り得る値の範囲\(X\left( \Omega \right) \)は分かっていますが、試行はランダムネスによって支配されているため、\(X\left( \Omega \right) \)の中のどの値が実際に実現するかを事前に特定できません。したがって、何らかの手段を通じて\(X\left( \Omega \right) \)の中のどの値が実際に実現するかを予測する必要があります。以上の問題意識のもと、確率変数\(X\)の期待値\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }x\cdot P\left(
X=x\right) =\sum_{x\in X\left( \Omega \right) }xf\left( x\right)
\end{equation*}と呼ばれる指標を導入しました。これは確率変数\(X\)の実現値の見込み値に相当します。

ただ、確率変数の確率分布を表現する指標として期待値に欠点がないわけではありません。実際、確率変数の確率分布が明らかに異なるにも関わらず、それらの期待値が一致するような状況は起こり得ます。期待値は確率分布の違いを上手く表現できると限らないということです。以下の例より明らかです。

例(期待値の欠点)
「事業を行う」という試行の標本空間が、\begin{equation*}
\Omega =\left\{ \text{大成功},\text{成功},\text{普通},\text{失敗},\text{大失敗}\right\}
\end{equation*}であるものとします。事業の結果から得られる収益を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)が、\begin{eqnarray*}X\left( \text{大成功}\right) &=&1000 \\
X\left( \text{成功}\right) &=&100 \\
X\left( \text{普通}\right) &=&0 \\
X\left( \text{失敗}\right) &=&-100 \\
X\left( \text{大失敗}\right) &=&-1000
\end{eqnarray*}として与えられているものとします。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1000,100,0,-100,-1000\right\}
\end{equation*}という有限集合であるため、これは離散型の確率変数です。ある事業\(A\)を行った場合、確率変数\(X\)の確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{eqnarray*}f\left( 1000\right) &=&0 \\
f\left( 100\right) &=&\frac{1}{4} \\
f\left( 0\right) &=&\frac{1}{2} \\
f\left( -100\right) &=&\frac{1}{4} \\
f\left( -1000\right) &=&0
\end{eqnarray*}を満たす一方で、別の事業\(B\)を行った場合、確率変数\(X\)の確率関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)が、\begin{eqnarray*}g\left( 1000\right) &=&\frac{1}{4} \\
g\left( 100\right) &=&0 \\
g\left( 0\right) &=&\frac{1}{2} \\
g\left( -100\right) &=&0 \\
g\left( -1000\right) &=&\frac{1}{4}
\end{eqnarray*}を満たすものとします。つまり、事業\(A\)は低リスク・底リターン型であり、事業\(B\)は高リスク・高リターン型です。両者は確率分布として明らかに異なります。その一方で、どちらの事業を採用した場合においても、確率変数\(X\)の期待値、すなわち事業から得られる収益の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}で等しくなります(確認してください)。つまり、確率変数\(X\)の確率分布を描写する指標として期待値だけに頼った場合、この2つの事業のタイプの違いを表現できないことになってしまいます。では、どのような指標を導入すれば2つの確率分布の違いを上手く表現できるでしょうか。事業\(A\)では期待値\(E\left( X\right) \)の近くにある\(X\)の値が起こりやすい傾向があり、逆に、事業\(B\)では期待値\(E\left( X\right) \)から離れている\(X\)の値が起こりやすい傾向があります。このような違いを表現するために、確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表現する新たな指標が要請されます。

 

離散型確率変数の分散と標準偏差

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているとともに、\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。加えて、\(X\)の期待値\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }xf\left( x\right)
\end{equation*}が有限な実数として定まるものとします。確率変数\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表現するために、\(X\)がとり得るそれぞれの値\(x\in X\left( \Omega \right) \)と期待値の差\(x-E\left( X\right) \)をとります。符号を正に統一するために平方\(\left[ x-E\left( X\right) \right] ^{2}\)をとった上で、この平方と値\(x\)が実現する確率\(P\left( X=x\right) \)との積をとり、さらに、得られた積の総和\begin{equation*}\sum_{x\in X\left( \Omega \right) }\left[ x-E\left( X\right) \right] ^{2}\cdot P\left( X=x\right)
\end{equation*}をとり、これを\(X\)の値が期待値\(E\left( X\right) \)のまわりにどのように散らばっているかを表現する指標として採用します。この指標を確率変数\(X\)の分散(variance)と呼び、\begin{equation*}\mathrm{Var}\left( X\right)
\end{equation*}で表記します。つまり、離散型の確率変数\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}\cdot P\left( X=x\right) \quad \because \text{分散の定義} \\
&=&\sum_{x\in X\left( \Omega \right) }\left[ x-E\left( X\right) \right] ^{2}f\left( x\right) \quad \because \text{確率関数}f\text{の定義}
\end{eqnarray*}と定義される指標です。

離散型の確率変数\(X\)の分散\(\mathrm{Var}\left( X\right) \)が有限な実数として定まる場合、それは必ず非負の実数として定まるため、その正の平方根\begin{equation*}\sqrt{\mathrm{Var}\left( X\right) }
\end{equation*}をとることができます。この指標を確率変数\(X\)の標準偏差(standard deviatioin)と呼び、\begin{equation*}\sigma _{X},\quad \mathrm{SD}\left( X\right)
\end{equation*}などで表記します。つまり、離散型の確率変数\(X\)の標準偏差は、\begin{eqnarray*}\sigma _{X} &=&\sqrt{\mathrm{Var}\left( X\right) }\quad \because \text{標準偏差の定義} \\
&=&\sqrt{\sum_{x\in X\left( \Omega \right) }\left[ x-E\left( X\right) \right] ^{2}f\left( x\right) }\quad \because \text{分散の定義}
\end{eqnarray*}と定義される指標です。このとき、\begin{equation*}
\sigma _{X}^{2}=\mathrm{Var}\left( X\right)
\end{equation*}という関係が成り立つため、確率変数\(X\)の分散を、\begin{equation*}\sigma _{X}^{2}
\end{equation*}で表記することもできます。

例(離散型確率変数の分散)
先ほどの例について再び考えます。確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 1000,100,0,-100,-1000\right\}
\end{equation*}です。事業\(A\)のもとでの確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}f\left( 1000\right) &=&0 \\
f\left( 100\right) &=&\frac{1}{4} \\
f\left( 0\right) &=&\frac{1}{2} \\
f\left( -100\right) &=&\frac{1}{4} \\
f\left( -1000\right) &=&0
\end{eqnarray*}であり、この場合の\(X\)の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\left( 1000-0\right) ^{2}\cdot 0+\left(
100-0\right) ^{2}\cdot \frac{1}{4}+\left( 0-0\right) ^{2}\cdot \frac{1}{2}+\left( -100-0\right) ^{2}\cdot \frac{1}{4}+\left( -1000-0\right) ^{2}\cdot 0
\\
&=&10000\cdot \frac{1}{4}+10000\cdot \frac{1}{4} \\
&=&5000
\end{eqnarray*}であり、\(X\)の標準偏差は、\begin{equation*}\sigma _{X}=\sqrt{5000}=50\sqrt{2}
\end{equation*}となります。一方、事業\(B\)のもとでの確率関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}g\left( 1000\right) &=&\frac{1}{4} \\
g\left( 100\right) &=&0 \\
g\left( 0\right) &=&\frac{1}{2} \\
g\left( -100\right) &=&0 \\
g\left( -1000\right) &=&\frac{1}{4}
\end{eqnarray*}であり、この場合の\(X\)の期待値は、\begin{equation*}E\left( X\right) =0
\end{equation*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&\left( 1000-0\right) ^{2}\cdot \frac{1}{4}+\left( 100-0\right) ^{2}\cdot 0+\left( 0-0\right) ^{2}\cdot \frac{1}{2}+\left( -100-0\right) ^{2}\cdot 0+\left( -1000-0\right) ^{2}\cdot \frac{1}{4}
\\
&=&1000000\cdot \frac{1}{4}+1000000\cdot \frac{1}{4} \\
&=&500000
\end{eqnarray*}\(X\)の標準偏差は、\begin{equation*}\sigma _{X}=\sqrt{500000}=500\sqrt{2}
\end{equation*}となります。低リスク・低リターン型の事業\(A\)では期待値\(E\left( X\right) \)の近くにある\(X\)の値が起こりやすい傾向があり、逆に、高リスク・高リターン型の事業\(B\)では期待値\(E\left( X\right) \)から離れている\(X\)の値が起こりやすい傾向がありますが、その違いが分散もしくは標準偏差の値の違いとして上手く表現できています。

 

分散の導出プロセスの簡略化

繰り返しになりますが、離散型の確率変数\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f\left( x\right)
\end{equation*}と定義されるため、分散を導出する際には以下の手順にしたがう必要があります。

  1. 確率変数\(X\)の期待値\(E\left( X\right) \)を導出する。
  2. 確率変数\(X\)がとり得るそれぞれの値\(x\in X\left( \Omega\right) \)について、それと期待値\(E\left( X\right) \)の差の平方\(\left[ x-E\left( X\right) \right] ^{2}\)をとり、さらに\(f\left( x\right) \)との積を求める。
  3. 得られたすべての積の総和をとる。

ただ、以下の命題を利用することにより、分散の導出プロセスを簡略化できます。

命題(分散の導出プロセスの簡略化)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)と確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとする。さらに、期待値\(E\left( X\right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\mathrm{Var}\left( X\right) =E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題を踏まえると、離散型の確率変数\(X\)の分散を求める際に、以下の手順にしたがってもよいことが保証されます。

  1. 確率変数\(X\)の期待値\(E\left( X\right) \)を導出する。
  2. 確率変数\(X^{2}\)の期待値\(E\left( X^{2}\right) \)を導出する。
  3. 以上の結果を踏まえた上で、\(E\left( X^{2}\right) -\left[E\left( X\right) \right] ^{2}\)を計算する。
例(分散の導出プロセスの簡略化)
「サイコロを1回投げて出た目を観察する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ 1,2,3,4,5,6\right\}
\end{equation*}です。出た目を与える確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めます。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left\{ 1,2,3,4,5,6\right\}
\end{equation*}という有限集合であるため、これは離散型の確率変数です。サイコロに偏りがないのであれば、確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{6} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\sum_{x\in X\left( \Omega \right) }xf\left( x\right) \\
&=&\left( 1+2+3+4+5+6\right) \cdot \frac{1}{6} \\
&=&\frac{7}{2}
\end{eqnarray*}となります。定義にもとづいて分散を求める場合、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f\left( x\right) \\
&=&\left[ \left( 1-\frac{7}{2}\right) ^{2}+\left( 2-\frac{7}{2}\right)
^{2}+\left( 3-\frac{7}{2}\right) ^{2}+\left( 4-\frac{7}{2}\right)
^{2}+\left( 5-\frac{7}{2}\right) ^{2}+\left( 6-\frac{7}{2}\right) ^{2}\right] \cdot \frac{1}{6} \\
&=&\frac{35}{2}\cdot \frac{1}{6} \\
&=&\frac{35}{12}
\end{eqnarray*}となり、煩雑な計算を強いられます。一方、確率変数\(X^{2}\)の期待値が、\begin{eqnarray*}E\left( X^{2}\right) &=&\sum_{x\in X\left( \Omega \right) }x^{2}f\left(
x\right) \\
&=&\left( 1^{2}+2^{2}+3^{2}+4^{2}+5^{2}+6^{2}\right) \cdot \frac{1}{6} \\
&=&\frac{91}{6}
\end{eqnarray*}であることを踏まえた上で、先の命題を用いて分散を求めると、\begin{eqnarray*}
\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2} \\
&=&\frac{91}{6}-\left( \frac{7}{2}\right) ^{2} \\
&=&\frac{35}{12}
\end{eqnarray*}となりますが、こちらの方が計算プロセスを簡略化できます。

 

分散が有限な実数として定まらない場合

繰り返しになりますが、離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されている場合、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[
x-E\left( X\right) \right] ^{2}f\left( x\right)
\end{equation*}と定義されます。ただし、この定義では確率変数\(X\)の期待値\(E\left(X\right) \)が有限な実数として定まることが前提になっています。仮に期待値\(E\left( X\right) \)が有限な実数として定まらない場合、すなわち\(E\left( X\right) \)が無限大である場合や\(E\left( X\right) \)が存在しない場合には、分散\(V\left( X\right) \)は存在しないものとみなします。したがって、この場合、標準偏差\(\sigma _{X}\)もまた存在しません。

一方、期待値\(E\left( X\right) \)が有限な実数として定まるにも関わらず、分散\(\mathrm{Var}\left( X\right) \)が有限な実数として定まらない事態は起こり得ます。分散\(\mathrm{Var}\left( X\right) \)が正の無限大である場合、標準偏差\(\sigma _{X}\)もまた正の無限大であるものとみなします。以下が具体例です。

例(期待値が有限だが分散が無限大である場合)
確率変数\(X\)の値域が、\begin{equation*}X\left( \Omega \right) =\mathbb{N} =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるものとします。これは可算集合であるため\(X\)は可算型の確率変数です。\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cc}
\frac{c}{x^{3}} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。ただし\(c\)は、\begin{equation*}\sum_{x=1}^{+\infty }\frac{c}{x^{3}}=1
\end{equation*}を満たす実数です。実際、\begin{equation*}
\sum_{x=1}^{+\infty }\frac{1}{x^{3}}
\end{equation*}は無理数であるため(アペリーの定理)、このような\(c\)をとることができます。このとき、期待値\(E\left( X\right) \)が有限な実数である一方で、分散\(E\left( X\right) \)は正の無限大です(演習問題)。

 

演習問題

問題(期待値が有限だが分散が無限大である場合)
確率変数\(X\)の値域が、\begin{equation*}X\left( \Omega \right) =\mathbb{N} =\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるものとします。これは可算集合であるため\(X\)は可算型の確率変数です。\(X\)の確率分布が確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されており、これはそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cc}
\frac{c}{x^{3}} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。ただし\(c\)は、\begin{equation*}\sum_{x=1}^{+\infty }\frac{c}{x^{3}}=1
\end{equation*}を満たす実数です。このとき、期待値\(E\left(X\right) \)が有限な実数である一方で、分散\(E\left( X\right) \)は正の無限大であることを示してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

確率変数
離散型の確率変数

それぞれの標本点に対して実数を1つずつ割り当てる写像を確率変数と呼びます。値域が有限集合または可算集合であるような確率変数を離散型の確率変数と呼びます。

期待値
離散型確率変数の期待値

確率変数がとり得るそれぞれの値に対して、その値が実現する確率との積をとった上で、得られた積の総和をとると期待値と呼ばれる指標が得られます。

期待値
離散型確率変数の期待値の線型性

確率変数の定数倍として定義される確率変数の期待値はもとの確率変数の期待値の定数倍と一致し、確率変数の和として定義される確率変数の期待値はもとの確率変数の期待値の和と一致します。

ベルヌーイ分布
ベルヌーイ分布

ある確率変数が1と0の二つの値のみをとり得るとともに、1を値としてとる確率がpで、0を値としてとる確率が1-pである場合には、その確率変数はパラメーターpのベルヌーイ分布にしたがうと言います。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録