WIIS

連続型の確率分布

連続型同時確率変数の同時確率密度関数

目次

Twitter
Mailで保存

同時確率変数の同時確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)が与えられている場合、\(\left( X,Y\right) \)の値がある集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率を、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right)
\end{equation*}または、\begin{equation*}
P\left( X\in A\wedge Y\in B\right)
\end{equation*}で表記するものと定めます。これをどのように評価すればよいでしょうか。

同時確率変数\(\left( X,Y\right) \)はそれぞれの標本点\(\omega \in\Omega \)に対してベクトル\begin{equation*}\left( X,Y\right) \left( \omega \right) =\left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in \mathbb{R} ^{2}
\end{equation*}を1つずつ定めるため、「同時確率変数\(\left(X,Y\right) \)の値が集合\(A\times B\)に属する」という事象は、\(\left( X,Y\right) \left( \omega \right) \in A\times B\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in
A\times B\right\}
\end{equation*}として表現されます。したがって、「同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\)に属する」という事象が起こる確率は、\begin{eqnarray*}P\left( \left( X,Y\right) \in A\times B\right) &=&P\left( \left\{ \omega
\in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in A\times
B\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left( X\left( \omega \right)
,Y\left( \omega \right) \right) \in A\times B\right\} \right) \quad \because
\left( X,Y\right) \text{の定義} \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\wedge
Y\left( \omega \right) \in B\right\} \right) \quad \because \text{直積の定義}
\end{eqnarray*}となります。

それぞれの集合\(A\times B\subset \mathbb{R} ^{2}\)に対して確率\(P\left( \left(X,Y\right) \in A\times B\right) \)が明らかになっている場合には、そのような情報の集まりを同時確率変数\(\left( X,Y\right) \)の同時確率分布(joint probability distributioin)と呼びます。確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられている場合には、すなわち試行によって起こり得るそれぞれの事象の確率が分かっている場合には、何らかの同時確率変数を導入したとき、その同時確率分布もまた明らかになるということです。

 

連続型同時確率変数の確率分布を記述する際の問題点

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられているものとします。同時確率変数\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =P\left( \left\{ \omega \in
\Omega \ |\ X\left( \omega \right) \in A\wedge Y\left( \omega \right) \in
B\right\} \right)
\end{equation*}と定式化されますが、この値をどのように定義すればよいでしょうか。

同時確率変数\(\left( X,Y\right) \)が離散型の場合には、それぞれのベクトル\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(\left( x,y\right) \)と一致する確率\begin{equation*}f_{XY}\left( x,y\right) =P\left( X=x\wedge Y=y\right)
\end{equation*}を定める同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を定義し、その上で、\(\left( X,Y\right) \)の値が集合\(A\times B\subset \mathbb{R} ^{2}\)に属する確率は、\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =\sum_{\left( x,y\right) \in
A\times B}f_{XY}\left( x,y\right)
\end{equation*}として定まることを示しました。つまり、集合\(A\times B\)に属するそれぞれの点\(\left( x,y\right) \)に対する確率\(f_{XY}\left( x,y\right) \)をとり、それらの総和をとれば\(P\left( \left( X,Y\right) \in A\times B\right) \)が得られるということです。一方、同時確率変数\(\left( X,Y\right) \)が連続型である場合には、同時確率質量関数を用いて\(\left( X,Y\right) \)の同時確率分布を表現できません。以下の例より明らかです。

例(連続型の同時確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)を構成する標本空間が、\begin{equation*}\Omega =[0,+\infty )\times \lbrack 0,+\infty )
\end{equation*}という無限閉区間の直積であるものとします。この集合は非可算集合であるため、任意の標本点\(\omega \in \Omega \)に対して、その根元事象の確率は、\begin{equation}P\left( \left\{ \omega \right\} \right) =0 \quad \cdots (1)
\end{equation}となります。同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation}\left( X,Y\right) \left( \omega \right) =\omega \quad \cdots (2)
\end{equation}を定めるのであれば、\(\left( X,Y\right) \)の値域は、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =[0,+\infty )\times \lbrack
0,+\infty )
\end{equation*}となるため、\(\left( X,Y\right) \)は連続型の同時確率変数です。仮に同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)を定義するのであれば、これはそれぞれの\(\omega \in \left( X,Y\right) \left( \Omega \right) \)に対して、\begin{eqnarray*}f_{XY}\left( \omega \right) &=&P\left( \left\{ \omega ^{\prime }\in \Omega
\ |\ \left( X,Y\right) \left( \omega ^{\prime }\right) =\omega \right\}
\right) \quad \because f\text{の定義} \\
&=&P\left( \left\{ \omega \right\} \right) \quad \because \left( 2\right) \\
&=&0\quad \because \left( 1\right)
\end{eqnarray*}を定めます。つまり、同時確率質量関数\(f_{XY}\)は\(0\)のみを値としてとるため、同時確率質量関数が満たすべき条件\begin{equation*}\sum_{x\in \left( X,Y\right) \left( \Omega \right) }f_{XY}\left( x,y\right)
=1
\end{equation*}が満たされません。したがって、以上のような連続型の同時確率変数\(\left( X,Y\right) \)の確率分布を同時確率質量関数\(f_{XY}\)を用いて表現することはできません。

繰り返しになりますが、同時確率質量関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)は、同時確率変数\(\left(X,Y\right) \)の値がベクトル\(\left(x,y\right) \in \mathbb{R} ^{2}\)と一致する確率\begin{equation*}f_{XY}\left( x,y\right) =P\left( X=x\wedge Y=y\right)
\end{equation*}を指定することを通じて\(\left( X,Y\right) \)の確率分布を記述しようとします。ただ、先の例が示唆するように、同時確率質量関数\(f_{XY}\)は連続型の同時確率変数\(\left( X,Y\right) \)の同時確率分布を上手く記述できません。そこで、連続型の同時確率変数\(\left( X,Y\right) \)の確率分布を記述する際には、同時確率分布の考え方の原点に戻り、それぞれの集合\(A\times B\subset \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(A\times B\)に属する確率\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =P\left( \left\{ \omega \in
\Omega \ |\ X\left( \omega \right) \in A\wedge Y\left( \omega \right) \in
B\right\} \right)
\end{equation*}を直接記述するアプローチを採用します。では、これをどのように評価すればよいでしょうか。

 

連続型の同時確率変数の同時確率密度関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の同時確率変数\(\left( X,Y\right) :\Omega\rightarrow \mathbb{R} ^{2}\)が与えられているものとします。\(\left( X,Y\right) \)の確率分布を記述するためには、任意の集合\(A\times B\subset \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(A\times B\)に属する確率\begin{equation*}P\left( \left( X,Y\right) \in A\times B\right) =P\left( \left\{ \omega \in
\Omega \ |\ X\left( \omega \right) \in A\wedge Y\left( \omega \right) \in
B\right\} \right)
\end{equation*}を特定する必要があります。ただ、\(X\left( \Omega\right) \)および\(Y\left( \Omega \right) \)は区間もしくは互いに素な区間の和集合であるため、\(\left( X,Y\right) \)の確率分布を記述するためには、区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に対して、\(\left( X,Y\right) \)の値が\(I\times J\)に属する確率\begin{eqnarray*}P\left( \left( X,Y\right) \in I\times J\right) &=&P\left( \left\{ \omega
\in \Omega \ |\ \left( X,Y\right) \left( \omega \right) \in I\times
J\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in I\wedge
Y\left( \omega \right) \in J\right\} \right)
\end{eqnarray*}を記述すれば十分です。

以上を踏まえた上で、有界区間と無限区間のどちらであるかを問わず、任意の区間の直積\(I\times J\subset \mathbb{R} ^{2}\)に対して、\begin{equation*}\left( a\right) \ P\left( \left( X,Y\right) \in I\times J\right) =\int
\int_{\left( x,y\right) \in I\times J}f_{XY}\left( x,y\right) dxdy
\end{equation*}を満たすとともに、\begin{eqnarray*}
&&\left( b\right) \ \forall \left( x,y\right) \in \mathbb{R} ^{2}:f_{XY}\left( x,y\right) \geq 0 \\
&&\left( c\right) \ \int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty
}f_{XY}\left( x,y\right) dxdy=1
\end{eqnarray*}をともに満たす関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が存在する場合には、これを\(\left( X,Y\right) \)の同時確率密度関数(jointprobability density function)と呼びます。

条件\(\left( a\right) \)は、連続型の同時確率変数\(\left( X,Y\right) \)がある集合\(I\times J\)に属する値をとる確率は、同時確率密度関数\(f_{XY}\)をその集合\(I\times J\)上で二重積分すれば得られることを意味します。条件\(\left( b\right) \)は同時確率密度関数が非負の実数を値としてとり得る関数であることを意味し、条件\(\left( c\right) \)は同時確率密度関数を\(\mathbb{R} ^{2}\)上で二重積分すると\(1\)になることを意味します。

同時確率変数\(\left( X,Y\right) \)の同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)が存在する場合、\(f_{XY}\)が正の値をとる点からなる集合\begin{equation*}\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ f\left( x,y\right) >0\right\}
\end{equation*}を\(\left( X,Y\right) \)の同時確率分布の(support)と呼びます。

例(連続型の同時確率密度関数)
「平面上の4つの点\(\left(0,0\right) ,\left( 0,1\right) ,\left( 1,0\right) ,\left( 1,1\right) \)を頂点とする正方形またはその内部の1点を選ぶ」という試行において、標本空間\(\Omega \)は問題としている正方形の辺と内部の点からなる集合\begin{equation*}\Omega =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}です。「選ばれた点の\(x\)座標」と「選ばれた点の\(y\)座標」の関係性を分析したい場合には、それらを特定する2つの確率変数の同時確率変数を利用することになります。「選ばれた点の\(x\)座標」を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{equation*}X\left( x,y\right) =x
\end{equation*}を定め、「選ばれた点の\(y\)座標」を特定する確率変数\(Y:\Omega \rightarrow \mathbb{R} \)はそれぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{equation*}Y\left( x,y\right) =y
\end{equation*}を定めます。同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)はそれぞれの標本点\(\left( x,y\right) \in \Omega \)に対して、\begin{eqnarray*}\left( X,Y\right) \left( x,y\right) &=&\left( X\left( x,y\right) ,Y\left(
x,y\right) \right) \\
&=&\left( x,y\right)
\end{eqnarray*}を定めますが、その値域は、\begin{equation*}
\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right\}
\end{equation*}です。同時確率密度関数\(f_{XY}:\mathbb{R} ^{2} \rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+\frac{3}{2}y^{2} & \left( if\ \left( x,y\right) \in \left( X,Y\right)
\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。このとき、\begin{equation*}
\forall \left( x,y\right) \in \mathbb{R} ^{2}:f_{XY}\left( x,y\right) \geq 0
\end{equation*}が明らかに成り立つとともに、\begin{eqnarray*}
\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }f_{XY}\left( x,y\right)
dxdy &=&\int \int_{\left( x,y\right) \in \left( X,Y\right) \left( \Omega
\right) }f_{XY}\left( x,y\right) dxdy \\
&=&\int_{0}^{1}\int_{0}^{1}\left( x+\frac{3}{2}y^{2}\right) dxdy \\
&=&\int_{0}^{1}\left[ \frac{1}{2}x^{2}+\frac{3}{2}y^{2}x\right] _{0}^{1}dy \\
&=&\int_{0}^{1}\left( \frac{1}{2}+\frac{3}{2}y^{2}\right) dy \\
&=&\left[ \frac{1}{2}y+\frac{1}{2}y^{3}\right] _{0}^{1} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}となるため、確かに\(f_{XY}\left( x,y\right) \)は同時確率密度関数としての要件を満たしています。このとき、例えば、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}\wedge 0\leq Y\leq \frac{1}{2}\right)
&=&\int_{0}^{\frac{1}{2}}\int_{0}^{\frac{1}{2}}\left( x+\frac{3}{2}y^{2}\right) dxdy \\
&=&\int_{0}^{\frac{1}{2}}\left[ \frac{1}{2}x^{2}+\frac{3}{2}y^{2}x\right] _{0}^{\frac{1}{2}}dy \\
&=&\int_{0}^{\frac{1}{2}}\left( \frac{1}{8}+\frac{3}{4}y^{2}\right) dy \\
&=&\left[ \frac{1}{8}y+\frac{1}{4}y^{3}\right] _{0}^{\frac{1}{2}} \\
&=&\frac{3}{32}
\end{eqnarray*}となります。

 

連続型の同時確率変数が特定の値をとる確率

連続型の同時確率変数\(\left( X,Y\right) \)の同時確率分布が同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)によって記述されているものとします。点\(\left( a,b\right) \in \mathbb{R} ^{2}\)を任意に選んだとき、\begin{equation}\left[ a,a\right] \times \left[ b,b\right] =\left\{ a\right\} \times \left\{
b\right\} \quad \cdots (1)
\end{equation}という関係が成り立つため、\begin{eqnarray*}
P\left( X=a\wedge Y=b\right) &=&P\left( \left( X,Y\right) \in \left\{
a\right\} \times \left\{ b\right\} \right) \\
&=&P\left( a\leq X\leq a\wedge b\leq X\leq b\right) \quad \because \left(
1\right) \\
&=&\int_{a}^{a}\int_{b}^{b}f_{XY}\left( x,y\right) dxdy\quad \because f_{XY}\text{の定義} \\
&=&0\quad \because \text{点における積分}
\end{eqnarray*}すなわち、\begin{equation*}
P\left( X=a\wedge Y=b\right) =0
\end{equation*}となります。つまり、連続型の同時確率変数\(\left( X,Y\right) \)に関しては、それがある1つのベクトルを値としてとる確率は必ず\(0\)になるということです。この点において連続型の同時確率変数は離散型の同時確率変数とは異なります。ただ、以上の事実は「連続型の同時確率変数\(\left( X,Y\right) \)の値があるベクトル\(\left( a,b\right) \)と一致する」という事象が「空事象」であることを意味するわけではありません。

 

演習問題

問題(連続型の同時確率密度関数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の値域が、\begin{equation*}\left( X,Y\right) \left( \Omega \right) =\left\{ \left( x,y\right) \in \mathbb{R} ^{2}\ |\ 0\leq x\leq 2\wedge 0\leq y\leq 3\right\}
\end{equation*}であるとともに、その同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cc}
\frac{1}{6} & \left( if\ \left( x,y\right) \in \left( X,Y\right) \left(
\Omega \right) \right) \\
0 & \left( if\ \left( x,y\right) \not\in \left( X,Y\right) \left( \Omega
\right) \right)
\end{array}\right.
\end{equation*}を定めるものとします。\(f_{XY}\)が同時確率密度関数としての性質を満たすことを確認するとともに、以下の確率\begin{equation*}P\left( 1\leq X\leq 3\wedge -1\leq Y\leq 1\right)
\end{equation*}を求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(連続型の同時確率密度関数)
「平面上の3つの点\(\left(0,0\right) ,\left( 1,0\right) ,\left( 1,1\right) \)を頂点とする三角形上またはその内部の1点を選ぶ」という試行において、「選ばれた点の\(x\)座標」を特定する確率変数\(X\)と「選ばれた点の\(y\)座標」を特定する確率変数\(Y\)の同時確率変数\(\left( X,Y\right) \)を定式化するとともに、その同時確率分布を描写する同時確率密度関数\(f_{XY}\)を特定してください。ただし、すべての標本点は等しい確率で起こるものとします。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(同時確率密度関数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布を記述する同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
x+cy^{2} & \left( if\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。ただし、\(c\in \mathbb{R} \)は定数です。\(f_{XY}\)が同時確率密度関数であるための\(c\)が満たすべき条件を特定してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(同時確率密度関数)
連続型の同時確率変数\(\left( X,Y\right) :\Omega \rightarrow \mathbb{R} ^{2}\)の同時確率分布を記述する同時確率密度関数\(f_{XY}:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f_{XY}\left( x,y\right) =\left\{
\begin{array}{cl}
c\left( xy+x+y\right) & \left( if\ 0\leq x\leq 1\wedge 0\leq y\leq 1\right)
\\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。ただし、\(c\in \mathbb{R} \)は定数です。\(f_{XY}\)が同時確率密度関数であるための\(c\)が満たすべき条件を特定するとともに、以下の確率\begin{equation*}P\left( X\geq Y\right)
\end{equation*}を求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

離散型の同時確率変数

それぞれの標本点に対して2次元ベクトルを1つずつ割り当てる写像を同時確率変数と呼びます。離散型の2個の確率変数から定義される同時確率変数を離散型の同時確率変数と呼びます。

離散型同時確率変数の同時確率質量関数

離散型の同時確率変数が与えられたとき、それぞれの実数の順序対に対して、同時確率変数がその順序対を値としてとる確率を特定する関数を同時確率関数や同時確率質量関数などと呼びます。

同時確率変数の定義

標本点に対して2次元ベクトルを1つずつ割り当てる写像を同時確率変数と呼びます。確率論の公理と整合的な形で同時確率変数の概念を定義します。

2つの確率変数の独立性

2つの確率変数が生成するσ代数どうしが独立である場合、それらの確率変数は独立であると言います。2つの独立変数が独立であることを様々な形で表現するとともに、独立性を判定する方法について解説します。

連続型の同時確率変数

それぞれの標本点に対してベクトルを1つずつ割り当てる写像を同時確率変数や確率ベクトルなどと呼びます。連続型の確率変数から定義される同時確率変数を連続型の同時確率変数と呼びます。

連続型確率ベクトルの同時確率密度関数

連続型の確率ベクトルの同時確率分布を表現する際に同時確率質量関数を利用できません。連続型の確率ベクトルの同時確率分布を描写する際には同時確率密度関数を利用します。