WIIS

連続型の確率分布

連続型同時確率変数の期待値

目次

Twitter
Mailで保存

連続型同時確率変数の期待値

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられており、その同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。つまり、同時確率変数\(\left( X,Y\right) \)の値が区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に属する確率が、\begin{equation*}P\left( \left( X,Y\right) \in I\times J\right) =\int \int_{\left( x,y\right)
\in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}であるということです。

問題としている試行のもとで同時確率変数\(\left( X,Y\right) \)がとり得る値の範囲\(\left( X,Y\right) \left( \Omega \right) \)は分かっていますが、試行はランダムネスによって支配されているため、\(\left( X,Y\right) \left( \Omega\right) \)の中のどのベクトルが実際に実現するかを事前に特定できません。したがって、何らかの手段を通じて\(\left( X,Y\right) \left( \Omega \right) \)の中のどのベクトルが実際に実現するかを予測する必要があります。\(\left( X,Y\right) \)の実現値を予想する際に期待値(expectation)と呼ばれる指標を参考にすることは最も基本的な考え方です。

連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。問題としている試行はランダムネスによって支配されているため、\(\left( X,Y\right) \left( \Omega \right) \)に属するどのベクトルが実際に実現するかを事前に知ることはできません。そこで、\(\left( X,Y\right) \)の実現値の見込み値を表す指標として、個々の確率変数\(X,Y\)の期待値からなるベクトル\begin{equation*}\left( E\left( X\right) ,E\left( Y\right) \right) =\left( \int_{-\infty
}^{+\infty }xf_{X}\left( x\right) dx,\int_{-\infty }^{+\infty }yf_{Y}\left(
y\right) dy\right)
\end{equation*}を採用します。ただし、\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は確率変数\(X\)に関する周辺確率密度関数であり、\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)は確率変数\(Y\)に関する周辺確率密度関数です。以上の指標を同時確率変数\(\left( X,Y\right) \)の期待値(expectation)や平均値(mean)などと呼び、\begin{equation*}E\left( X,Y\right)
\end{equation*}で表記します。つまり、\begin{equation*}
E\left( X,Y\right) =\left( E\left( X\right) ,E\left( Y\right) \right)
\end{equation*}を満たすものとして同時確率変数の期待値\(E\left( X,Y\right) \)は定義されます。

例(連続型同時確率変数の期待値)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)の値域は、\begin{eqnarray*}X\left( \Omega \right) &=&\left\{ x\in \mathbb{R} \ |\ 0\leq x\leq 1\right\} \\
Y\left( \Omega \right) &=&\left\{ y\in \mathbb{R} \ |\ 0\leq y\leq 1\right\}
\end{eqnarray*}であるとともに、\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
x+\frac{1}{2} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}であり、\(Y\)の確率密度関数\(f_{Y}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(y\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{Y}\left( y\right) =\left\{
\begin{array}{cc}
\frac{3}{2}y^{2}+\frac{1}{2} & \left( if\ x\in Y\left( \Omega \right)
\right) \\
0 & \left( if\ x\not\in Y\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}です(確認してください)。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx \\
&=&\int_{-\infty }^{0}x0dx+\int_{0}^{1}x\left( x+\frac{1}{2}\right)
dx+\int_{1}^{+\infty }x0dx \\
&=&0+\left[ \frac{1}{3}x^{3}+\frac{1}{4}x^{2}\right] _{0}^{1}+0 \\
&=&\frac{1}{3}+\frac{1}{4} \\
&=&\frac{7}{12}
\end{eqnarray*}であり、\(Y\)の期待値は、\begin{eqnarray*}E\left( Y\right) &=&\int_{-\infty }^{+\infty }yf_{Y}\left( y\right) dy \\
&=&\int_{-\infty }^{0}y0dy+\int_{0}^{1}y\left( \frac{3}{2}y^{2}+\frac{1}{2}\right) dy+\int_{1}^{+\infty }y0dy \\
&=&0+\left[ \frac{3}{8}y^{4}+\frac{1}{4}y^{2}\right] _{0}^{1}+0 \\
&=&\frac{3}{8}+\frac{1}{4} \\
&=&\frac{5}{8}
\end{eqnarray*}です。したがって、\(\left( X,Y\right) \)の期待値は、\begin{eqnarray*}E\left( X,Y\right) &=&\left( E\left( X\right) ,E\left( Y\right) \right) \\
&=&\left( \frac{7}{12},\frac{5}{8}\right)
\end{eqnarray*}です。

 

不注意な統計学者の法則(LOTUS)

連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。2変数関数\(g:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{eqnarray*}Z\left( \omega \right) &=&\left( g\circ \left( X,Y\right) \right) \left(
\omega \right) \\
&=&g\left( \left( X,Y\right) \left( \omega \right) \right) \quad \because
\text{合成関数の定義} \\
&=&g\left( X\left( \omega \right) ,Y\left( \omega \right) \right) \quad
\because \left( X,Y\right) \text{の定義}
\end{eqnarray*}を定める新たな確率変数\(Z:\Omega \rightarrow \mathbb{R} \)を定義します。確率変数\(Z\)の期待値が存在する場合には、\begin{equation*}E\left( Z\right) =\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }\left[
g\left( x,y\right) \cdot f_{XY}\left( x,y\right) \right] dxdy
\end{equation*}という関係が成り立つことが保証されます。これを不注意な統計学者の法則(law of the unconscious statistician)やLOTUSなどと呼びます。証明では測度論の知識が必要であるため、必要な道具が揃った段階で改めて証明します。

命題(不注意な統計学者の法則)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとする。関数\(g:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =\left( g\circ \left( X,Y\right) \right) \left(
\omega \right)
\end{equation*}を定める確率変数\(Z:\Omega\rightarrow \mathbb{R} \)を定義する。\(Z\)の期待値が存在する場合には、\begin{equation*}E\left( Z\right) =\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }\left[
g\left( x,y\right) \cdot f_{XY}\left( x,y\right) \right] dxdy
\end{equation*}という関係が成り立つ。

確率変数\(Z=g\left( X,Y\right) \)の期待値を求める際、期待値の本来の定義にもとづいて考えるのであれば、\begin{equation*}z=f\left( x,y\right)
\end{equation*}とおいた上で、確率変数\(Z\)の確率分布を描写する確率密度関数\(f_{Z}:\mathbb{R} \rightarrow \mathbb{R} \)を特定した上で、\begin{equation*}E\left( Z\right) =\int_{-\infty }^{+\infty }\left[ z\cdot f_{Z}\left(
z\right) \right] dz
\end{equation*}と計算する必要があります。つまり、本来、確率変数\(Z\)の期待値は\(Z\)の確率分布にもとづいて計算する必要があり、同時確率変数\(\left( X,Y\right) \)の確率分布をそのまま流用できることは必ずしも自明ではありません。であるにもかかわらず、統計学の多くの教科書では、確率変数\(Z\)の期待値を導出する際に、同時確率変数\(\left( X,Y\right) \)の同時確率分布を描写する同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を用いて、\begin{equation*}E\left( Z\right) =\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }\left[
g\left( x,y\right) \cdot f_{XY}\left( x,y\right) \right] dxdy
\end{equation*}としています。なぜなら、多くの不注意な人は、このような関係が成り立つことが自明であると思いこんでいるからです。ただ、実際には、上の命題が示すように、このような関係が成り立つことはきちんと証明されるべきです。このような背景を踏まえた上で、上の命題は「不注意な統計者の法則(LOTUS)」と呼ばれます。

例(不注意な統計学者の法則)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。その上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) \cdot Y\left( \omega \right)
\end{equation*}を定める確率変数\(Z:\Omega\rightarrow \mathbb{R} \)を定義します。この確率変数の期待値は、\begin{eqnarray*}E\left( Z\right) &=&\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }
\left[ xy\cdot f_{XY}\left( x,y\right) \right] dxdy\quad \because \text{LOTUS} \\
&=&\int_{0}^{1}\int_{0}^{1}\left[ xy\left( x+\frac{3}{2}y^{2}\right) \right] dxdy \\
&=&\int_{0}^{1}\left[ \int_{0}^{1}\left( x^{2}y+\frac{3}{2}xy^{3}\right) dx\right] dy \\
&=&\int_{0}^{1}\left[ \frac{1}{3}x^{3}y+\frac{3}{4}x^{2}y^{3}\right] _{0}^{1}dy \\
&=&\int_{0}^{1}\left( \frac{1}{3}y+\frac{3}{4}y^{3}\right) dy \\
&=&\left[ \frac{1}{6}y^{2}+\frac{3}{16}y^{4}\right] _{0}^{1} \\
&=&\frac{1}{6}+\frac{3}{16} \\
&=&\frac{17}{48}
\end{eqnarray*}となります。

 

2つの独立な連続型確率変数の積の期待値

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)における2つの連続型の確率変数\begin{eqnarray*}X &:&\Omega \rightarrow \mathbb{R} \\
Y &:&\Omega \rightarrow \mathbb{R} \end{eqnarray*}が与えられているとともに、これらの確率分布が確率密度関数\begin{eqnarray*}
f_{X} &:&\mathbb{R} \rightarrow \mathbb{R} \\
f_{Y} &:&\mathbb{R} \rightarrow \mathbb{R} \end{eqnarray*}としてそれぞれ記述されているものとします。以上の2つの確率変数\(X,Y\)の同時確率変数は、\begin{equation*}\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}
\end{equation*}であり、その同時確率分布が同時確率密度関数\begin{equation*}
f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \end{equation*}として記述されているものとします。さらに、確率関数\(X,Y\)が独立であるものとします。この場合、以下の関係\begin{equation*}\forall x,y\in \mathbb{R} :f_{XY}\left( x,y\right) =f_{X}\left( x\right) \cdot f_{Y}\left( y\right)
\end{equation*}が成り立つことに注意してください。以上を踏まえた上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) \cdot Y\left( \omega \right)
\end{equation*}を定める新たな確率関数\(Z:\Omega \rightarrow \mathbb{R} \)を定義します。以上の条件が満たされるとともに、確率変数\(X,Y\)の期待値\(E\left( X\right) ,E\left( Y\right) \)がともに存在する場合、確率変数\(Z\)の期待値が、\begin{equation*}E\left( Z\right) =E\left( X\right) \cdot E\left( Y\right)
\end{equation*}として定まることが保証されます。つまり、2つの独立な確率変数の積として定義される確率変数の期待値は、個々の確率変数の期待値の積と一致します。

命題(2つの独立な確率変数の積の期待値)
2つの連続型確率変数\(X,Y:\Omega \rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) \cdot Y\left( \omega \right)
\end{equation*}を定める新たな確率関数\(Z:\Omega \rightarrow \mathbb{R} \)を定義する。\(X\)と\(Y\)が独立であるとともに期待値\(E\left( X\right) \)および\(E\left(Y\right) \)が存在する場合には、確率変数\(Z\)の期待値が存在するとともに、以下の関係\begin{equation*}E\left( Z\right) =E\left( X\right) \cdot E\left( Y\right)
\end{equation*}が成立する。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題における主張が常に成り立つことを保証するためには2つの確率変数が独立である必要があります。つまり、確率変数\(X,Y\)が独立ではない場合には、確率変数\(X,Y\)の積として定義される確率変数\(XY\)の期待値は、個々の確率変数\(X,Y\)の期待値の積と一致するとは限りません。以下の例より明らかです。

例(独立ではない確率変数の積の期待値)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+y & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)は独立ではなく、さらに、\begin{equation*}E\left( XY\right) \not=E\left( X\right) \cdot E\left( Y\right)
\end{equation*}が成り立ちます(演習問題)。

 

演習問題

問題(同時確率変数の期待値)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\mathbb{R} _{+}^{2}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
e^{-x-y} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。同時確率変数\(\left(X,Y\right) \)の期待値を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(LOTUS)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。その上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}Z\left( \omega \right) =X\left( \omega \right) -Y\left( \omega \right)
\end{equation*}を定める確率変数\(Z:\Omega\rightarrow \mathbb{R} \)を定義します。この確率変数\(Z\)の期待値を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(従属な確率変数の積の期待値)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}であるとともに、\(\left(X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+y & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。確率変数\(X,Y\)は独立ではないことを示してください。さらに、\begin{equation*}E\left( XY\right) \not=E\left( X\right) \cdot E\left( Y\right)
\end{equation*}が成り立つことを示してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

離散型確率変数の期待値

確率変数がとり得るそれぞれの値に対して、その値が実現する確率との積をとった上で、得られた積の総和をとると期待値と呼ばれる指標が得られます。

離散型の一様分布

離散型の確率変数がすべての値を等しい確率でとる場合、そのような確率変数は離散型の一様分布にしたがうと言います。離散型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型確率変数の分散と標準偏差

離散型の確率変数がとり得るそれぞれの値に対して、その値と期待値の差の平方をとった上で、得られた平方の総和をとると分散と呼ばれる指標が得られます。分散の正の平方根を標準偏差と呼びます。

離散型確率変数の中央化・標準化・正規化

期待値が0になるように確率変数を変換する操作を中央化と呼び、期待値が0で分散が1になるように確率変数を変換する操作を標準化と呼び、確率変数がとり得る値の範囲が0以上1以下になるように確率変数を変換する操作を正規化と呼びます。

連続型の一様分布

連続型の確率変数の確率分布を記述する確率密度関数が定数関数である場合、その確率変数は連続型の一様分布にしたがうと言います。連続型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型同時確率変数の期待値

離散型の同時確率変数の期待値を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の期待値を求める方法を解説します。また、独立な確率変数の積の期待値は個々の確率変数の期待値の積と一致することを示します。

連続型確率変数の期待値

連続型の確率変数の値と確率密度関数の値の積を全区間上で積分することにより得られる値を確率変数の期待値と呼びます。期待値は確率変数の実現値の見込みの値を表す指標です。