WIIS

離散型の確率分布

離散型同時確率変数の分散と標準偏差

目次

関連知識

Mailで保存
Xで共有

離散型同時確率変数の分散

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられているものとします。加えて、同時確率変数\(\left( X,Y\right) \)の同時確率分布が同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値がベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)と一致する確率は、\begin{equation*}P\left( X=x\wedge Y=y\right) =f_{XY}\left( x,y\right)
\end{equation*}であり、同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =\sum_{\left( x,y\right) \in
A\times B}f_{XY}\left( x,y\right)
\end{equation*}であるということです。

問題としている試行のもとで同時確率変数\(\left( X,Y\right) \)が取り得る値の範囲\(\left( X,Y\right) \left( \Omega \right) \)は分かっていますが、試行はランダムネスによって支配されているため、\(\left( X,Y\right) \left( \Omega\right) \)の中のどのベクトルが実際に実現するかを事前に特定できません。したがって、何らかの手段を通じて\(\left( X,Y\right) \left( \Omega \right) \)の中のどのベクトルが実際に実現するかを予測する必要があります。以上の問題意識のもと、同時確率変数\(\left( X,Y\right) \)の期待値\begin{equation*}E\left( X,Y\right) =\left( E\left( X\right) ,E\left( Y\right) \right)
\end{equation*}と呼ばれる指標を導入しました。これは同時確率変数\(\left( X,Y\right) \)の実現値の見込み値を表す指標です。ただし、\(E\left( X\right) \)は確率変数\(X\)の期待値であり、\(E\left(Y\right) \)は確率変数\(Y\)の期待値です。

ただ、同時確率変数の確率分布を表現する指標として期待値に欠点がないわけではありません。実際、同時確率変数の同時確率分布が明らかに異なるにも関わらず、それらの期待値が一致するような状況は起こり得ます。期待値は同時確率分布の違いを上手く表現できると限らないということです。そこで、同時確率変数\(\left( X,Y\right) \)の値が期待値\(E\left(X,Y\right) \)のまわりにどのように散らばっているかを表現する指標として、個々の確率変数\(X,Y\)の分散からなるベクトル\begin{equation*}\left( \mathrm{Var}\left( X\right) ,\mathrm{Var}\left( Y\right) \right) =\left(
\sum_{x\in X\left( \Omega \right) }\left[ x-E\left( X\right) \right] ^{2}f_{X}\left( x\right) ,\sum_{y\in Y\left( \Omega \right) }\left[
y-E\left( Y\right) \right] ^{2}f_{Y}\left( y\right) \right)
\end{equation*}を採用します。ただし、\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は確率変数\(X\)に関する(周辺)確率質量関数であり、\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)は確率変数\(Y\)に関する(周辺)確率質量関数です。以上の指標を同時確率変数\(\left( X,Y\right) \)の分散(variance)と呼び、\begin{equation*}\mathrm{Var}\left( X,Y\right)
\end{equation*}で表記します。つまり、\begin{equation*}
\mathrm{Var}\left( X,Y\right) =\left( \mathrm{Var}\left( X\right) ,\mathrm{Var}\left( Y\right) \right)
\end{equation*}を満たすものとして同時確率変数の分散\(\mathrm{Var}\left( X,Y\right) \)は定義されます。

例(離散型同時確率変数の分散)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( 1,1\right) ,\left(
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ 0,1,2\right\} \\
Y\left( \Omega \right) &=&\left\{ 0,1\right\}
\end{eqnarray*}であるとともに、\(X\)の周辺確率関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in X\left( \Omega\right) \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ x=0,1,2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定め、\(Y\)の周辺確率関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in Y\left( \Omega\right) \)に対して、\begin{equation*}f_{Y}\left( y\right) =\left\{
\begin{array}{cl}
\frac{2}{3} & \left( if\ y=0\right) \\
\frac{1}{3} & \left( if\ y=1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます(確認してください)。\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2}\quad \because \text{分散の導出プロセスの簡易化} \\
&=&\left[ \sum_{x\in \Omega \left( X\right) }x^{2}f_{X}\left( x\right) \right] -\left[ \sum_{x\in \Omega \left( X\right) }xf_{X}\left( x\right) \right] ^{2}\quad \because \text{LOTUS} \\
&=&\left( \frac{1}{3}\cdot 0^{2}+\frac{1}{3}\cdot 1^{2}+\frac{1}{3}\cdot
2^{2}\right) -\left( \frac{1}{3}\cdot 0+\frac{1}{3}\cdot 1+\frac{1}{3}\cdot
2\right) \\
&=&\frac{2}{3}
\end{eqnarray*}であり、\(Y\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( Y\right) &=&E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2}\quad \because \text{分散の導出プロセスの簡易化} \\
&=&\left[ \sum_{y\in \Omega \left( Y\right) }y^{2}f_{Y}\left( y\right) \right] -\left[ \sum_{y\in \Omega \left( Y\right) }yf_{Y}\left( y\right) \right] ^{2}\quad \because \text{LOTUS} \\
&=&\left( \frac{2}{3}\cdot 0^{2}+\frac{1}{3}\cdot 1^{2}\right) -\left( \frac{2}{3}\cdot 0+\frac{1}{3}\cdot 1\right) ^{2} \\
&=&\frac{2}{9}
\end{eqnarray*}です。したがって、\(\left( X,Y\right) \)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X,Y\right) &=&\left( \mathrm{Var}\left( X\right) ,\mathrm{Var}\left( Y\right) \right) \\
&=&\left( \frac{2}{3},\frac{2}{9}\right)
\end{eqnarray*}です。

 

離散型同時確率変数の標準偏差

離散型の同時確率変数\(\left( X,Y\right) \)の分散\(\mathrm{Var}\left(X,Y\right) \)が有限なベクトルとして定まる場合、その成分である個々の確率変数の分散\(\mathrm{Var}\left( X\right) \)および\(\mathrm{Var}\left( Y\right) \)は必ず非負の実数として定まるため、それらの平方根からなるベクトル\begin{equation*}\left( \sqrt{\mathrm{Var}\left( X\right) },\sqrt{\mathrm{Var}\left( Y\right) }\right) =\left( \sigma _{X},\sigma _{Y}\right)
\end{equation*}をとることができます。この指標を同時確率変数\(\left( X,Y\right) \)の標準偏差(standard deviation)と呼び、\begin{equation*}\sigma _{XY}\quad \mathrm{SD}\left( X,Y\right)
\end{equation*}などで表記します。つまり、離散型の同時確率変数\(\left( X,Y\right) \)の標準偏差は、\begin{eqnarray*}\sigma _{XY} &=&\left( \sqrt{\mathrm{Var}\left( X\right) },\sqrt{\mathrm{Var}\left( Y\right) }\right) \\
&=&\left( \sigma _{X},\sigma _{Y}\right) \\
&=&\left( \sqrt{\sum_{x\in X\left( \Omega \right) }\left[ x-E\left( X\right) \right] ^{2}f_{X}\left( x\right) },\sqrt{\sum_{y\in Y\left( \Omega \right) }\left[ y-E\left( Y\right) \right] ^{2}f_{Y}\left( y\right) }\right)
\end{eqnarray*}と定義される指標です。

例(離散型同時確率変数の標準偏差)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( 1,1\right) ,\left(
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に求めたように、\(\left( X,Y\right) \)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X,Y\right) &=&\left( \mathrm{Var}\left( X\right) ,\mathrm{Var}\left( Y\right) \right) \\
&=&\left( \frac{2}{3},\frac{2}{9}\right)
\end{eqnarray*}であるため、\(\left( X,Y\right) \)の標準偏差は、\begin{eqnarray*}\sigma _{XY} &=&\left( \sigma _{X},\sigma _{Y}\right) \\
&=&\left( \sqrt{\frac{2}{3}},\sqrt{\frac{2}{9}}\right)
\end{eqnarray*}となります。

 

離散型同時確率変数との合成関数の分散

離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。2変数関数\(g:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Z\left( \omega \right) &=&\left( g\circ \left( X,Y\right) \right) \left(
\omega \right) \\
&=&g\left( \left( X,Y\right) \left( \omega \right) \right) \quad \because
\text{合成関数の定義} \\
&=&g\left( X\left( \omega \right) ,Y\left( \omega \right) \right) \quad
\because \left( X,Y\right) \text{の定義}
\end{eqnarray*}を定める新たな確率変数\(Z:\Omega \rightarrow \mathbb{R} \)を定義します。確率変数\(Z\)の分散が存在する場合には、分散の導出プロセスの簡略化に関する命題より、\begin{equation*}\mathrm{Var}\left( Z\right) =E\left( Z^{2}\right) -\left[ E\left( Z\right) \right] ^{2}
\end{equation*}という関係が成り立つことが保証されます。なお、\(E\left( Z^{2}\right) \)や\(E\left( Z\right) \)を導出する際にはLOTUSを利用できます。具体的には、\begin{eqnarray*}E\left( Z^{2}\right) &=&\sum_{\left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) }\left[ g\left( x,y\right) \right] ^{2}\cdot
f_{XY}\left( x,y\right) \\
E\left( Z\right) &=&\sum_{\left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) }g\left( x,y\right) \cdot f_{XY}\left( x,y\right)
\end{eqnarray*}などとなります。

命題(離散型同時確率変数との合成関数の分散)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとする。関数\(g:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =\left( g\circ \left( X,Y\right) \right) \left(
\omega \right)
\end{equation*}を定める確率変数\(Z:\Omega\rightarrow \mathbb{R} \)を定義する。\(Z\)の分散が存在する場合には、\begin{equation*}\mathrm{Var}\left( Z\right) =E\left( Z^{2}\right) -\left[ E\left( Z\right) \right] ^{2}
\end{equation*}という関係が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(離散型同時確率変数との合成関数の分散)
離散型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( 1,1\right) ,\left(
2,0\right) ,\left( 0,0\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。その上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) \cdot Y\left( \omega \right)
\end{equation*}を定める確率変数\(Z:\Omega\rightarrow \mathbb{R} \)を定義します。\(Z\)の期待値は、\begin{eqnarray*}E\left( Z\right) &=&\sum_{\left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) }\left[ xy\cdot f_{XY}\left( x,y\right) \right] \quad
\because \text{LOTUS} \\
&=&\left( 1\cdot 1\right) \cdot \frac{1}{3}+\left( 2\cdot 0\right) \cdot
\frac{1}{3}+\left( 0\cdot 0\right) \cdot \frac{1}{3} \\
&=&\frac{1}{3}
\end{eqnarray*}であり、\(Z^{2}\)の期待値は、\begin{eqnarray*}E\left( Z^{2}\right) &=&\sum_{\left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) }\left[ \left( xy\right) ^{2}\cdot f_{XY}\left(
x,y\right) \right] \quad \because \text{LOTUS} \\
&=&\left( 1\cdot 1\right) ^{2}\cdot \frac{1}{3}+\left( 2\cdot 0\right)
^{2}\cdot \frac{1}{3}+\left( 0\cdot 0\right) ^{2}\cdot \frac{1}{3} \\
&=&\frac{1}{3}
\end{eqnarray*}であるため、\(Z\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( Z\right) &=&E\left( Z^{2}\right) -\left[ E\left( Z\right) \right] ^{2} \\
&=&\frac{1}{3}-\left( \frac{1}{3}\right) ^{2} \\
&=&\frac{2}{9}
\end{eqnarray*}となります。

 

2つの独立な離散型確率変数の和の分散

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)における2つの離散型の確率変数\begin{eqnarray*}X &:&\Omega \rightarrow \mathbb{R} \\
Y &:&\Omega \rightarrow \mathbb{R} \end{eqnarray*}が与えられているとともに、これらの確率分布が確率関数\begin{eqnarray*}
f_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
f_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}としてそれぞれ記述されているものとします。以上の2つの確率変数\(X,Y\)の同時確率変数は、\begin{equation*}\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}であり、その同時確率分布が同時確率関数\begin{equation*}
f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}として記述されているものとします。さらに、確率関数\(X,Y\)が独立であるものとします。この場合、以下の関係\begin{equation*}\forall x,y\in \mathbb{R} :f_{XY}\left( x,y\right) =f_{X}\left( x\right) \cdot f_{Y}\left( y\right)
\end{equation*}が成り立つことに注意してください。以上を踏まえた上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) +Y\left( \omega \right)
\end{equation*}を定める新たな確率関数\(Z:\Omega \rightarrow \mathbb{R} \)を定義します。以上の条件が満たされるとともに、確率変数\(X,Y\)の分散\(\mathrm{Var}\left( X\right) ,\mathrm{Var}\left(Y\right) \)がともに存在する場合、確率変数\(Z\)の分散が、\begin{equation*}\mathrm{Var}\left( Z\right) =\mathrm{Var}\left( X\right) +\mathrm{Var}\left(
Y\right)
\end{equation*}として定まることが保証されます。つまり、2つの独立な確率変数の和として定義される確率変数の分散は、個々の確率変数の分散の和と一致します。

命題(2つの独立な離散型確率変数の和の分散)
2つの離散型確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) +Y\left( \omega \right)
\end{equation*}を定める新たな確率関数\(Z:\Omega \rightarrow \mathbb{R} \)を定義する。\(X\)と\(Y\)が独立であるとともに分散\(\mathrm{Var}\left( X\right) \)および\(\mathrm{Var}\left( Y\right) \)が存在する場合には、確率変数\(Z\)の分散が存在するとともに、以下の関係\begin{equation*}\mathrm{Var}\left( Z\right) =\mathrm{Var}\left( X\right) +\mathrm{Var}\left(
Y\right)
\end{equation*}が成立する。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題における主張が常に成り立つことを保証するためには2つの確率変数が独立である必要があります。つまり、確率変数\(X,Y\)が独立ではない場合には、確率変数\(X,Y\)の和として定義される確率変数\(X+Y\)の分散は、個々の確率変数\(X,Y\)の分散の和と一致するとは限りません。以下の例より明らかです。

例(独立ではない確率変数の和の分散)
「コインを2回投げる」という試行を行います。\(i\ \left( =1,2\right) \)回目に出た面を\(\omega _{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( \omega _{1},\omega _{2}\right) \ |\ \forall i\in
\left\{ 1,2\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}です。すべての標本点は同じ確率で起こり得るものとします。「1投目に表が出る回数」を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)と「2投において表が出る合計回数」を特定する確率変数\(Y:\Omega\rightarrow \mathbb{R} \)は独立ではなく、さらに、\begin{equation*}\mathrm{Var}\left( X+Y\right) \not=\mathrm{Var}\left( X\right) +\mathrm{Var}\left(
Y\right)
\end{equation*}が成り立ちます(演習問題)。

 

演習問題

問題(2つの独立な離散型確率変数の差の分散)
2つの離散型確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) -Y\left( \omega \right)
\end{equation*}を定める新たな確率関数\(Z:\Omega \rightarrow \mathbb{R} \)を定義します。\(X\)と\(Y\)が独立であるとともに分散\(\mathrm{Var}\left( X\right) \)および\(\mathrm{Var}\left( Y\right) \)が存在する場合には、確率変数\(Z\)の分散が存在するとともに、以下の関係\begin{equation*}\mathrm{Var}\left( Z\right) =\mathrm{Var}\left( X\right) -\mathrm{Var}\left(
Y\right)
\end{equation*}が成立することを示してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(独立ではない確率変数の和の分散)
「コインを2回投げる」という試行を行います。\(i\ \left( =1,2\right) \)回目に出た面を\(\omega _{i}\)で表記するのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left\{ \left( \omega _{1},\omega _{2}\right) \ |\ \forall i\in
\left\{ 1,2\right\} :\omega _{i}\in \left\{ \text{表},\text{裏}\right\} \right\}
\end{equation*}です。すべての標本点は同じ確率で起こり得るものとします。「1投目に表が出る回数」を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)と「2投において表が出る合計回数」を特定する確率変数\(Y:\Omega\rightarrow \mathbb{R} \)は独立ではないこと、さらに、\begin{equation*}\mathrm{Var}\left( X+Y\right) \not=\mathrm{Var}\left( X\right) +\mathrm{Var}\left(
Y\right)
\end{equation*}が成り立つことを確認してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録