共分散の欠点
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布が同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値がベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)と一致する確率は、\begin{equation*}P\left( X=x\wedge Y=y\right) =f_{XY}\left( x,y\right)
\end{equation*}であり、同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =\sum_{\left( x,y\right) \in
A\times B}f_{XY}\left( x,y\right)
\end{equation*}であるということです。
確率変数\(X\)の値の分布と確率変数\(Y\)の値の分布の間の関連性を表現する指標として、共分散\begin{equation*}\mathrm{Cov}\left( X,Y\right) =E\left( \left[ X-E\left( X\right) \right] \left[
Y-E\left( Y\right) \right] \right)
\end{equation*}と呼ばれる指標を導入しました。共分散について、\begin{equation*}
\mathrm{Cov}\left( X,Y\right) >0
\end{equation*}が成り立つ場合には、\(X\)の値が大きいほど\(Y\)の値もまた大きくなる傾向があり、同時に、\(X\)の値が小さいほど\(Y\)の値もまた小さくなる傾向があります。また、\begin{equation*}\mathrm{Cov}\left( X,Y\right) <0
\end{equation*}が成り立つ場合には、\(X\)の値が大きいほど\(Y\)の値は小さくなる傾向があり、同時に、\(X\)の値が小さいほど\(Y\)の値は大きくなる傾向があります。さらに、\begin{equation*}\mathrm{Cov}\left( X,Y\right) =0
\end{equation*}が成り立つ場合には、\(X\)の値と\(Y\)の値の分布に関して何らかの関連性を見出すことができません。
ただ、2つの確率変数の値の分布の関連性を表現する指標として共分散に欠点がないわけではありません。共分散\(\mathrm{Cov}\left( X,Y\right) \)の水準は確率変数\(X,Y\)の値の単位の選び方に依存します。以下の例より明らかです。
&=&E\left( \left[ 100X-100E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \quad \because \text{確率変数の定数倍の期待値} \\
&=&E\left( 100\left[ X-E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \\
&=&100E\left( \left[ X-E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \quad \because \text{確率変数の定数倍の期待値} \\
&=&100\mathrm{Cov}\left( X,Y\right) \quad \because \text{共分散の定義}
\end{eqnarray*}すなわち、\begin{equation}
\mathrm{Cov}\left( 100X,Y\right) =100\mathrm{Cov}\left( X,Y\right) \quad \cdots (1)
\end{equation}となります。つまり、確率変数\(X\)の値を\(100\)倍すると共分散の値も\(100\)倍になってしまいます。
つまり、同じデータを扱っていてもデータの単位を変えれば共分散の値が変わってしまうということです。3つの確率変数\(X,Y,Z\)について共分散\(C\left(X,Y\right) ,C\left( X,Z\right) ,C\left( Y,Z\right) \)をそれぞれとったとき、\(X,Y,Z\)の値の単位が異なる場合には、これらの共分散の値を比較することに意味はありません。共分散の値は単位に依存してしまうからです。共分散が抱えるこのような問題を解決するために相関係数(correlation)と呼ばれる指標を利用します。
2つの離散型確率変数の相関係数
離散型の確率変数\(X,Y:\Omega\rightarrow \mathbb{R} \)の共分散は、\begin{equation*}\mathrm{Cov}\left( X,Y\right) =E\left( \left[ X-E\left( X\right) \right] \left[
Y-E\left( Y\right) \right] \right)
\end{equation*}と定義されます。特に、確率変数\(X,Y\)の分散がともに有限な正の実数として定まる場合、すなわち、\begin{eqnarray*}0 &<&\mathrm{Var}\left( X\right) <+\infty \\
0 &<&\mathrm{Var}\left( Y\right) <+\infty
\end{eqnarray*}が成り立つ場合、共分散\(\mathrm{Cov}\left( X,Y\right) \)もまた有限な実数として定まるだけでなく、標準偏差もまた有限な正の実数として定まるため、すなわち、\begin{eqnarray*}0 &<&\sigma _{X}=\sqrt{\mathrm{Var}\left( X\right) }<+\infty \\
0 &<&\sigma _{Y}=\sqrt{\mathrm{Var}\left( Y\right) }<+\infty
\end{eqnarray*}が成り立つため、以下の指標\begin{equation*}
\frac{\mathrm{Cov}\left( X,Y\right) }{\sigma _{X}\sigma _{Y}}
\end{equation*}が定義可能です。この指標を確率変数\(X,Y\)の相関係数(correlation)と呼び、\begin{equation*}\mathrm{Corr}\left( X,Y\right) ,\quad \rho \left( X,Y\right)
\end{equation*}で表記します。つまり、離散型確率変数\(X,Y\)の相関係数は、\begin{eqnarray*}\mathrm{Corr}\left( X,Y\right) &=&\frac{\mathrm{Cov}\left( X,Y\right) }{\sigma
_{X}\sigma _{Y}}\quad \because \text{相関係数の定義} \\
&=&\frac{E\left( \left[ X-E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) }{\sigma _{X}\sigma _{Y}}\quad \because \text{共分散の定義}
\end{eqnarray*}と定義される指標です。
-1,1\right) ,\left( -1,-1\right) \right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ -1,1\right\} \\
Y\left( \Omega \right) &=&\left\{ -1,1\right\}
\end{eqnarray*}であるとともに、\(X\)の周辺確率関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in X\left( \Omega\right) \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{2}{3} & \left( if\ x=-1\right) \\
\frac{1}{3} & \left( if\ x=1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定め、\(Y\)の周辺確率関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(y\in Y\left( \Omega\right) \)に対して、\begin{equation*}f_{Y}\left( y\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ y=-1\right) \\
\frac{2}{3} & \left( if\ y=1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\sum_{x\in X\left( \Omega \right) }\left[ x\cdot
f_{X}\left( x\right) \right] \\
&=&-1\cdot f_{X}\left( -1\right) +1\cdot f_{X}\left( 1\right) \\
&=&-1\cdot \frac{2}{3}+1\cdot \frac{1}{3} \\
&=&-\frac{1}{3}
\end{eqnarray*}であり、\(X^{2}\)の期待値は、\begin{eqnarray*}E\left( X^{2}\right) &=&\sum_{x\in X\left( \Omega \right) }\left[
x^{2}\cdot f_{X}\left( x\right) \right] \quad \because \text{LOTUS} \\
&=&\left( -1\right) ^{2}\cdot f_{X}\left( -1\right) +1^{2}\cdot f_{X}\left(
1\right) \\
&=&1\cdot \frac{2}{3}+1\cdot \frac{1}{3} \\
&=&1
\end{eqnarray*}であるため、\(X\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( X\right) &=&E\left( X^{2}\right) -\left[ E\left( X\right) \right] ^{2} \\
&=&1-\left( -\frac{1}{3}\right) ^{2} \\
&=&\frac{8}{9}
\end{eqnarray*}であり、したがって\(X\)の標準偏差は、\begin{equation*}\sigma _{X}=\sqrt{\frac{8}{9}}
\end{equation*}です。一方、\(Y\)の期待値は、\begin{eqnarray*}E\left( Y\right) &=&\sum_{y\in Y\left( \Omega \right) }\left[ y\cdot
f_{Y}\left( y\right) \right] \\
&=&-1\cdot f_{Y}\left( -1\right) +1\cdot f_{Y}\left( 1\right) \\
&=&-1\cdot \frac{1}{3}+1\cdot \frac{2}{3} \\
&=&\frac{1}{3}
\end{eqnarray*}であり、\(Y^{2}\)の期待値は、\begin{eqnarray*}E\left( Y^{2}\right) &=&\sum_{y\in Y\left( \Omega \right) }\left[
y^{2}\cdot f_{Y}\left( y\right) \right] \quad \because \text{LOTUS} \\
&=&\left( -1\right) ^{2}\cdot f_{Y}\left( -1\right) +1^{2}\cdot f_{Y}\left(
1\right) \\
&=&1\cdot \frac{1}{3}+1\cdot \frac{2}{3} \\
&=&1
\end{eqnarray*}であるため、\(Y\)の分散は、\begin{eqnarray*}\mathrm{Var}\left( Y\right) &=&E\left( Y^{2}\right) -\left[ E\left( Y\right) \right] ^{2} \\
&=&1-\left( \frac{1}{3}\right) ^{2} \\
&=&\frac{8}{9}
\end{eqnarray*}であり、したがって\(Y\)の標準偏差は、\begin{equation*}\sigma _{Y}=\sqrt{\frac{8}{9}}
\end{equation*}です。\(X\)と\(Y\)の共分散は、\begin{eqnarray*}\mathrm{Cov}\left( X,Y\right) &=&E\left( \left[ X-E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \quad \because \text{共分散の定義} \\
&=&\sum_{\left( x,y\right) \in \left( X,Y\right) \left( \Omega \right) }
\left[ x-E\left( X\right) \right] \left[ y-E\left( Y\right) \right] f_{XY}\left( x,y\right) \quad \because \text{LOTUS} \\
&=&\sum_{\left( x,y\right) \in \left( X,Y\right) \left( \Omega \right)
}\left( x+\frac{1}{3}\right) \left( y-\frac{1}{3}\right) f_{XY}\left(
x,y\right) \quad \because E\left( X\right) =-\frac{1}{3},E\left( Y\right) =\frac{1}{3} \\
&=&\left( 1+\frac{1}{3}\right) \left( 1-\frac{1}{3}\right) f_{XY}\left(
1,1\right) +\left( -1+\frac{1}{3}\right) \left( 1-\frac{1}{3}\right)
f_{XY}\left( -1,1\right) +\left( -1+\frac{1}{3}\right) \left( -1-\frac{1}{3}\right) f_{XY}\left( -1,-1\right) \\
&=&\left( 1+\frac{1}{3}\right) \left( 1-\frac{1}{3}\right) \frac{1}{3}+\left( -1+\frac{1}{3}\right) \left( 1-\frac{1}{3}\right) \frac{1}{3}+\left(
-1+\frac{1}{3}\right) \left( -1-\frac{1}{3}\right) \frac{1}{3}\quad \because
f_{XY}\text{の定義} \\
&=&\frac{4}{9}
\end{eqnarray*}であるため、\(X\)と\(Y\)の相関係数は、\begin{eqnarray*}\mathrm{Corr}\left( X,Y\right) &=&\frac{\mathrm{Cov}\left( X,Y\right) }{\sigma
_{X}\sigma _{Y}}\quad \because \text{相関係数の定義} \\
&=&\frac{\frac{4}{9}}{\sqrt{\frac{8}{9}}\sqrt{\frac{8}{9}}} \\
&=&\frac{\frac{4}{9}}{\frac{8}{9}} \\
&=&\frac{1}{2}
\end{eqnarray*}となります。
相関係数は単位に依存しない
離散型確率変数\(X,Y\)の共分散は、\begin{equation*}\mathrm{Cov}\left( X,Y\right) =E\left( \left[ X-E\left( X\right) \right] \left[
Y-E\left( Y\right) \right] \right)
\end{equation*}と定義されますが、先に指摘したように、その水準は確率変数\(X,Y\)の値の単位の選び方に大きく依存します。一方、離散型確率変数\(X,Y\)の相関係数は、\begin{equation*}\mathrm{Corr}\left( X,Y\right) =\frac{\mathrm{Cov}\left( X,Y\right) }{\sigma
_{X}\sigma _{Y}}
\end{equation*}と定義されますが、その水準は確率変数\(X,Y\)の値の単位の選び方に依存しません。
&=&E\left( \left[ 100X-100E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \quad \because \text{確率変数の定数倍の期待値} \\
&=&E\left( 100\left[ X-E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \\
&=&100E\left( \left[ X-E\left( X\right) \right] \left[ Y-E\left( Y\right) \right] \right) \quad \because \text{確率変数の定数倍の期待値} \\
&=&100\mathrm{Cov}\left( X,Y\right) \quad \because \text{共分散の定義}
\end{eqnarray*}すなわち、\begin{equation}
\mathrm{Cov}\left( 100X,Y\right) =100\mathrm{Cov}\left( X,Y\right) \quad \cdots (1)
\end{equation}となります。つまり、確率変数\(X\)の値を\(100\)倍すると共分散の値も\(100\)倍になってしまいます。一方、相関係数は、\begin{equation*}\mathrm{Corr}\left( X,Y\right) =\frac{\mathrm{Cov}\left( X,Y\right) }{\sigma
_{X}\sigma _{Y}}
\end{equation*}と定義されますが、その水準は確率変数\(X,Y\)の値の単位の選び方に依存しません。例えば、先と同様の状況を想定すると、\begin{eqnarray*}\mathrm{Corr}\left( 100X,Y\right) &=&\frac{\mathrm{Cov}\left( 100X,Y\right) }{\sigma _{100X}\sigma _{Y}}\quad \because \text{相関係数の定義} \\
&=&\frac{100\mathrm{Cov}\left( X,Y\right) }{100\sigma _{X}\sigma _{Y}}\quad
\because \left( 1\right) \text{および確率変数の定数倍の標準偏差} \\
&=&\frac{\mathrm{Cov}\left( X,Y\right) }{\sigma _{X}\sigma _{Y}} \\
&=&\mathrm{Corr}\left( X,Y\right) \quad \because \text{相関係数の定義}
\end{eqnarray*}となります。つまり、確率変数\(X\)の値を\(100\)倍しても相関係数の値は変化しません。他の単位を採用する場合や、確率変数\(Y\)の単位を変化させる場合にも同様の議論が成立します。
つまり、同じデータを扱っている限りにおいてデータの単位を変えても相関係数の値は不変です。3つの確率変数\(X,Y,Z\)について相関係数\(\mathrm{Corr}\left( X,Y\right) ,\mathrm{Corr}\left( X,Z\right) ,\mathrm{Corr}\left( Y,Z\right) \)をそれぞれとったとき、\(X,Y,Z\)の値の単位が異なる場合でも、これらの相関係数の値を比較することに意味があります。相関係数の値は単位に依存しないからです。
相関係数がとり得る値の範囲
相関係数が有限な実数として定まる場合、それは必ず\(-1\)以上\(1\)以下の実数として定まることが保証されます。
0 &<&\mathrm{Var}\left( Y\right) <+\infty
\end{eqnarray*}が成り立つ場合には相関係数\(\mathrm{Corr}\left( X,Y\right) \)が有限な実数として定まるとともに、\begin{equation*}-1\leq \mathrm{Corr}\left( X,Y\right) \leq 1
\end{equation*}が成り立つ。
相関係数の意味(正の相関・負の相関・無相関)
相関係数と共分散の符号は常に一致します。
0 &<&\mathrm{Var}\left( Y\right) <+\infty
\end{eqnarray*}が成り立つ場合には共分散\(\mathrm{Cov}\left( X,Y\right) \)と相関係数\(\mathrm{Corr}\left( X,Y\right) \)がともに有限な実数として定まるとともに、以下の関係\begin{eqnarray*}\left( a\right) \ \mathrm{Cov}\left( X,Y\right) &>&0\Leftrightarrow \mathrm{Corr}\left( X,Y\right) >0 \\
\left( b\right) \ \mathrm{Cov}\left( X,Y\right) &<&0\Leftrightarrow \mathrm{Corr}\left( X,Y\right) <0 \\
\left( c\right) \ \mathrm{Cov}\left( X,Y\right) &=&0\Leftrightarrow \mathrm{Corr}\left( X,Y\right) =0
\end{eqnarray*}が成立する。
離散型の確率変数\(X,Y\)の相関係数が正である場合には、すなわち、\begin{equation*}\mathrm{Corr}\left( X,Y\right) >0
\end{equation*}が成り立つ場合には、\(X\)と\(Y\)は正の相関がある(positively correlated)と言います。先の命題より、\(X\)と\(Y\)が正の相関があることと、\begin{equation*}\mathrm{Cov}\left( X,Y\right) >0
\end{equation*}が成り立つことは必要十分です。したがって、\(X\)と\(Y\)の正の相関がある場合には、\(X\)の値が大きいほど\(Y\)の値もまた大きくなる傾向があり、同時に、\(X\)の値が小さいほど\(Y\)の値もまた小さくなる傾向があります。相関係数\(\mathrm{Corr}\left( X,Y\right) \)の最大値は\(1\)ですが、\(1\)に近づくにつれて先の傾向がより強くなります。
離散型の確率変数\(X,Y\)の相関係数が負である場合には、すなわち、\begin{equation*}\mathrm{Corr}\left( X,Y\right) <0
\end{equation*}が成り立つ場合には、\(X\)と\(Y\)は負の相関がある(negatively correlated)と言います。先の命題より、\(X\)と\(Y\)が負の相関があることと、\begin{equation*}\mathrm{Cov}\left( X,Y\right) <0
\end{equation*}が成り立つことは必要十分です。したがって、\(X\)と\(Y\)の負の相関がある場合には、\(X\)の値が大きいほど\(Y\)の値は小さくなる傾向があり、同時に、\(X\)の値が小さいほど\(Y\)の値は大きくなる傾向があります。相関係数\(\mathrm{Corr}\left( X,Y\right) \)の最小値は\(-1\)ですが、\(-1\)に近づくにつれて先の傾向がより強くなります。
離散型の確率変数\(X,Y\)の相関係数が非ゼロである場合には、すなわち、\begin{equation*}\mathrm{Corr}\left( X,Y\right) \not=0
\end{equation*}が成り立つ場合には、\(X\)と\(Y\)は相関がある(correlated)と言います。これは、\(X\)と\(Y\)が正の相関または負の相関があることを意味します。逆に、\(X\)と\(Y\)は相関がない場合には、すなわち、\begin{equation*}\mathrm{Corr}\left( X,Y\right) =0
\end{equation*}が成り立つ場合には、\(X\)と\(Y\)は無相関である(uncorrelated)であるとか相関がないなどと言います。先の命題より、\(X\)と\(Y\)が無相関であることと、\begin{equation*}\mathrm{Cov}\left( X,Y\right) =0
\end{equation*}が成り立つことは必要十分です。したがって、\(X\)と\(Y\)が無相関である場合には、\(X\)の値と\(Y\)の値の分布に関して何らかの関連性を見出すことができません。
2つの離散型確率変数\(X,Y\)が独立である場合、\(X\)の値の起こりやすさと\(Y\)の値の起こりやすさの間に影響関係が存在しないため、\(X\)の値と\(Y\)の値の分布に関して何らかの関連性を見出すことはできず、したがって\(X\)と\(Y\)は無相関になることが予想されます。これは正しい予想です。
0 &<&\mathrm{Var}\left( Y\right) <+\infty
\end{eqnarray*}が成り立つ場合には相関係数\(\mathrm{Corr}\left( X,Y\right) \)が有限な実数として定まるとともに、\begin{equation*}\mathrm{Corr}\left( X,Y\right) =0
\end{equation*}が成り立つ。
同一の確率変数の間の相関係数
離散型の確率変数と自身との相関係数は\(1\)になります。
\end{equation*}が成り立つ場合には相関係数\(\mathrm{Corr}\left( X,X\right) \)が有限な実数として定まるとともに、\begin{equation*}\mathrm{Corr}\left( X,X\right) =1
\end{equation*}が成り立つ。
相関係数の対称性
離散型の確率変数\(X,Y\)について\(X\)と\(Y\)の相関係数と\(Y\)と\(X\)の相関係数は一致します。つまり、\begin{equation*}\mathrm{Corr}\left( X,Y\right) =\mathrm{Corr}\left( Y,X\right)
\end{equation*}が成り立つということです。相関係数が満たす以上の性質を対称性(symmetry)と呼びます。
0 &<&\mathrm{Var}\left( Y\right) <+\infty
\end{eqnarray*}が成り立つ場合には相関係数\(\mathrm{Corr}\left( X,Y\right) \)および\(\mathrm{Corr}\left( Y,X\right) \)が有限な実数として定まるとともに、\begin{equation*}\mathrm{Corr}\left( X,Y\right) =\mathrm{Corr}\left( Y,X\right)
\end{equation*}が成り立つ。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】