教材一覧
教材一覧
教材検索

連続型の確率分布

連続型確率変数の確率密度関数

目次

Twitterで共有
メールで共有

確率変数の確率分布

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率変数\(X:\Omega\rightarrow \mathbb{R} \)が与えられている場合、\(X\)の値がある集合\(A\subset \mathbb{R} \)に属する確率を、\begin{equation*}P\left( X\in A\right)
\end{equation*}と表記するものと定めます。これをどのように評価すればよいでしょうか。確率変数\(X\)はそれぞれの標本点\(\omega \in \Omega \)に対して実数\(X\left( \omega \right) \in \mathbb{R} \)を1つずつ定めるため、「確率変数\(X\)の値が集合\(A\)に属する」という事象は、\(X\left( \omega \right) \in A\)を満たす標本点\(\omega \)からなる集合\begin{equation*}\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \in A\right\}
\end{equation*}として表現されます。したがって、「確率変数\(X\)の値が集合\(A\)に属する」という事象が起こる確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}となります。

それぞれの集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)が明らかになっている場合には、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びます。確率空間\(\left( \Omega ,\mathcal{F},P\right) \)が与えられている場合には、すなわち試行によって起こり得るそれぞれの事象の確率が分かっている場合には、何らかの確率変数を導入したとき、その確率変数の確率分布もまた明らかになるということです。

 

連続型確率変数の確率分布を記述する際の問題点

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が数直線\(\mathbb{R} \)上の区間であったり、互いに素な区間の和集合であるということです。確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}と定式化されますが、この値をどのように定義すればよいでしょうか。

確率変数\(X\)が離散型の場合には、それぞれの実数\(x\in \mathbb{R} \)に対して、\(X\)が値\(x\)をとる確率\begin{equation*}f_{X}\left( x\right) =P\left( X=x\right)
\end{equation*}を定める確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)と呼ばれる概念を定義し、その上で、\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f_{X}\left( x\right)
\end{equation*}として定まることを示しました。つまり、集合\(A\)に属するそれぞれの値\(x\)に対する確率\(f_{X}\left( x\right) \)をとり、それらの総和をとれば\(P\left( X\in A\right) \)が得られるということです。一方、確率変数\(X\)が連続型である場合には、確率質量関数を用いて確率変数の確率分布を表現できません。以下の例より明らかです。

例(連続型の確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)を構成する標本空間が、\begin{equation*}\Omega =[0,+\infty )
\end{equation*}という無限閉区間であるものとします。無限閉区間は非可算集合であるため、任意の標本点\(\omega \in \Omega \)に対して、その根元事象の確率は、\begin{equation}P\left( \left\{ \omega \right\} \right) =0 \quad \cdots (1)
\end{equation}となります。確率変数\(X:\Omega \rightarrow \mathbb{R} \)はそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めるのであれば、\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =[0,+\infty )
\end{equation*}という無限閉区間になるため、\(X\)は連続型の確率変数です。仮に確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)を定義するのであれば、これはそれぞれの\(\omega \in X\left( \Omega \right) \)に対して、\begin{eqnarray*}f_{X}\left( \omega \right) &=&P\left( \left\{ \omega ^{\prime }\in \Omega \
|\ X\left( \omega ^{\prime }\right) =\omega \right\} \right) \quad \because f\text{の定義} \\
&=&P\left( \left\{ \omega \right\} \right) \quad \because X\text{の定義} \\
&=&0\quad \because \left( 1\right)
\end{eqnarray*}を定めます。つまり、確率質量関数\(f_{X}\)は\(0\)のみを値としてとるため、確率質量関数が満たすべき条件\begin{equation*}\sum_{x\in X\left( \Omega \right) }f_{X}\left( x\right) =1
\end{equation*}が満たされません。したがって、連続型の確率変数\(X\)の確率分布を確率質量関数\(f_{X}\)を用いて表現することはできません。

繰り返しになりますが、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、確率変数\(X\)がそれぞれの値\(x\in \mathbb{R} \)をとる確率\begin{equation*}f\left( x\right) =P\left( X=x\right)
\end{equation*}を指定することを通じて\(X\)の確率分布を記述しようとします。ただ、先の例が示唆するように、確率質量関数は連続型の確率変数の確率分布を上手く記述できません。そこで、連続型の確率変数\(X\)の確率分布を記述する際には、確率分布の考え方の原点に戻り、それぞれの集合\(A\subset \mathbb{R} \)に対して、\(X\)の値が\(A\)に属する確率\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}を直接記述するアプローチを採用します。では、これをどのように評価すればよいでしょうか。

 

連続型の確率変数の確率密度関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が数直線\(\mathbb{R} \)上の区間であったり、互いに素な区間の和集合であるということです。\(X\)の確率分布を記述するためには、任意の集合\(A\subset \mathbb{R} \)に対して、\(X\)の値が\(A\)に属する確率\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}を特定する必要があります。ただ、\(X\left( \Omega\right) \)は区間もしくは互いに素な区間の和集合であるため、\(X\)の確率分布を記述するためには、それぞれの区間\(I\subset \mathbb{R} \)に対して、\(X\)の値が\(I\)に属する確率\begin{equation*}P\left( X\in I\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in I\right\} \right)
\end{equation*}を記述すれば十分です。

以上を踏まえた上で、有界区間と無限区間のどちらであるかを問わず、任意の区間\(I\subset \mathbb{R} \)に対して、\begin{equation*}\left( a\right) \ P\left( X\in I\right) =\int_{I}f_{X}\left( x\right) dx
\end{equation*}を満たすとともに、\begin{eqnarray*}
&&\left( b\right) \ \forall x\in \mathbb{R} :f_{X}\left( x\right) \geq 0 \\
&&\left( c\right) \ \int_{-\infty }^{+\infty }f_{X}\left( x\right) dx=1
\end{eqnarray*}をともに満たす関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在する場合には、これを\(X\)の確率密度関数(probability density function)と呼びます。

条件\(\left( a\right) \)は、連続型の確率変数\(X\)がある区間\(I\)に属する値をとる確率は、確率密度関数\(f_{X}\)をその区間\(I\)にわたって積分すれば得られることを意味します。条件\(\left( b\right) \)は確率密度関数が非負の実数を値としてとり得る関数であることを意味し、条件\(\left( c\right) \)は確率密度関数を全区間\(\mathbb{R} \)上で積分すると\(1\)になることを意味します。

確率変数\(X\)の確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が存在する場合、\(f_{X}\)が正の値をとる点からなる集合\begin{equation*}\left\{ x\in \mathbb{R} \ |\ f_{X}\left( x\right) >0\right\}
\end{equation*}を\(X\)の確率分布の(support)と呼びます。

例(有界閉区間の確率)
連続型の確率変数\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとします。\(a\leq b\)を満たす実数\(a,b\in \mathbb{R} \)を端点とする有界な閉区間\begin{equation*}\left[ a,b\right] \subset \mathbb{R} \end{equation*}をとったとき、\(X\)の値が\(\left[ a,b\right] \)に属する確率は、\begin{eqnarray*}P\left( X\in \left[ a,b\right] \right) &=&P\left( a\leq X\leq b\right) \\
&=&\int_{a}^{b}f_{X}\left( x\right) dx\quad \because f_{X}\text{の定義}
\end{eqnarray*}となります。つまり、連続型の確率変数\(X\)が\(a\)以上\(b\)以下の値をとる確率は、確率密度関数\(f_{X}\)を区間\(\left[ a,b\right] \)上で積分して得られる値であり、これは下図のグレーの領域の面積に相当します。

図:確率密度関数
図:確率密度関数
例(無限閉区間の確率)
連続型の確率変数\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとします。実数\(a\in \mathbb{R} \)を端点とする無限閉区間\begin{equation*}\lbrack a,+\infty )\subset \mathbb{R} \end{equation*}をとったとき、\(X\)の値が\([a,+\infty )\)に属する確率は、\begin{eqnarray*}P\left( X\in \lbrack a,+\infty )\right) &=&P\left( a\leq X\right) \\
&=&\int_{a}^{+\infty }f_{X}\left( x\right) dx\quad \because f_{X}\text{の定義}
\end{eqnarray*}となります。つまり、連続型の確率変数\(X\)が\(a\)以上の値をとる確率は、確率密度関数\(f_{X}\)を区間\([a,+\infty )\)上で積分して得られる値であり、これは下図のグレーの領域の面積に相当します。

図:確率密度関数
図:確率密度関数
例(無限閉区間の確率)
連続型の確率変数\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって表現されているものとします。実数\(a\in \mathbb{R} \)を端点とする無限閉区間\begin{equation*}(-\infty ,a]\subset \mathbb{R} \end{equation*}をとったとき、\(X\)の値が\((-\infty ,a]\)に属する確率は、\begin{eqnarray*}P\left( X\in (-\infty ,a]\right) &=&P\left( X\leq a\right) \\
&=&\int_{-\infty }^{a}f_{X}\left( x\right) dx\quad \because f_{X}\text{の定義}
\end{eqnarray*}となります。つまり、連続型の確率変数\(X\)が\(a\)以下の値をとる確率は、確率密度関数\(f_{X}\)を区間\((-\infty ,a]\)上で積分して得られる値であり、これは下図のグレーの領域の面積に相当します。

図:確率密度関数
図:確率密度関数
例(確率密度関数)
「\(0\)以上\(1\)以下の実数をランダムに\(1\)つ選ぶ」という試行の標本空間は、\begin{equation*}\Omega =\left[ 0,1\right] \end{equation*}となります。それぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left[ 0,1\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(f_{X}\)の定義より、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が明らかに成り立ちます。また、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{0}^{1}1dx\quad
\because f_{X}\text{の定義} \\
&=&\left[ x\right] _{0}^{1} \\
&=&1
\end{eqnarray*}です。したがって、\(f_{X}\)は確率密度関数であることが示されました。\(X\)の確率分布の台は、\begin{equation*}\left[ 0,1\right] \end{equation*}です。例えば、\(\frac{1}{2}\)以下の実数が選ばれる確率は、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}\right) &=&\int_{0}^{\frac{1}{2}}f_{X}\left(
x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}1dx \\
&=&\frac{1}{2}
\end{eqnarray*}であり、\(\frac{1}{4}\)以上\(\frac{3}{4}\)以下の実数が選ばれる確率は、\begin{eqnarray*}P\left( \frac{1}{4}\leq X\leq \frac{3}{4}\right) &=&\int_{\frac{1}{4}}^{\frac{3}{4}}f_{X}\left( x\right) dx \\
&=&\int_{\frac{1}{4}}^{\frac{3}{4}}1dx \\
&=&\frac{1}{2}
\end{eqnarray*}です。

例(確率密度関数)
「エレベーターが到着するのが待つ」という試行において、エレベーターが到着するまでの経過時間を\(\omega \)で表記します。最長で\(2\)分間待つ必要があるのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left[ 0,2\right] \end{equation*}となります。それぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left[ 0,2\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
x & \left( if\ 0\leq x\leq 1\right) \\
2-x & \left( if\ 1<x\leq 2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(f_{X}\)の定義より、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) \geq 0
\end{equation*}が明らかに成り立ちます。また、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f_{X}\left( x\right) dx &=&\int_{0}^{2}f_{X}\left(
x\right) dx\quad \because f_{X}\text{の定義} \\
&=&\int_{0}^{1}xdx+\int_{1}^{2}\left( 2-x\right) dx\quad \because f_{X}\text{の定義} \\
&=&\left[ \frac{x^{2}}{2}\right] _{0}^{1}+\left[ 2x-\frac{x^{2}}{2}\right] _{1}^{2} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}です。したがって、\(f_{X}\)が\(X\)の確率密度関数であることが示されました。\(X\)の確率分布の台は、\begin{equation*}\left( 0,2\right)
\end{equation*}です。例えば、待ち時間が\(30\)秒(\(\frac{1}{2}\)分)以下である確率は、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}\right) &=&\int_{0}^{\frac{1}{2}}f_{X}\left(
x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}xdx \\
&=&\left[ \frac{x^{2}}{2}\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{8}
\end{eqnarray*}であり、待ち時間が\(1\)分\(30\)秒(\(\frac{3}{2}\)分)以上である確率は、\begin{eqnarray*}P\left( X\geq \frac{3}{2}\right) &=&\int_{\frac{3}{2}}^{+\infty
}f_{X}\left( x\right) dx \\
&=&\int_{\frac{3}{2}}^{2}\left( 2-x\right) dx \\
&=&\left[ 2x-\frac{x^{2}}{2}\right] _{\frac{3}{2}}^{2} \\
&=&\frac{1}{8}
\end{eqnarray*}です。

 

連続型の確率変数が特定の値をとる確率

連続型の確率変数\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって描写されているものとします。点\(a\in \mathbb{R} \)を任意に選んだとき、\begin{equation}\left[ a,a\right] =\left\{ a\right\} \quad \cdots (1)
\end{equation}という関係が成り立つため、\begin{eqnarray*}
P\left( X=a\right) &=&P\left( X\in \left\{ a\right\} \right) \\
&=&P\left( X\in \left[ a,a\right] \right) \quad \because \left( 1\right) \\
&=&P\left( a\leq X\leq a\right) \\
&=&\int_{a}^{a}f_{X}\left( x\right) dx\quad \because f\text{の定義} \\
&=&0\quad \because \text{点における積分}
\end{eqnarray*}すなわち、\begin{equation*}
P\left( X=a\right) =0
\end{equation*}となります。つまり、連続型の確率変数\(X\)に関しては、それがある1つの実数を値としてとる確率は必ず\(0\)になるということです。この点において連続型の確率変数は離散型の確率変数と異なります。ただ、以上の事実は「連続型の確率変数\(X\)の値がある値\(a\)と一致する」という事象が「空事象」であることを意味するわけではありません。\(X\)の値が\(a\)と一致する確率は下図の線分の面積として表現されますが、線分は面積をもたないため、その値は\(0\)になります。ただ、これは線分が存在しないことを意味するわけではありません。

図:確率密度関数
図:確率密度関数

 

区間の端点の扱い

連続型の確率変数\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。点\(a\in \mathbb{R} \)を任意に選んだ上で、以下の2つの事象、\begin{eqnarray*}A &=&\left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq a\right\} \\
B &=&\left\{ \omega \in \Omega \ |\ X\left( \omega \right) <a\right\}
\end{eqnarray*}に注目します。差事象の確率より、\begin{equation*}
P\left( A\backslash B\right) =P\left( A\right) -P\left( A\cap B\right)
\end{equation*}すなわち、\begin{equation*}
P\left( X=a\right) =P\left( X\leq a\right) -P\left( X<a\right)
\end{equation*}という関係が成り立ちますが、先に示したように、連続型の確率変数\(X\)が特定の値\(a\)をとる確率は\(0\)であるため、\begin{equation*}0=P\left( X\leq a\right) -P\left( X<a\right)
\end{equation*}すなわち、\begin{equation*}
P\left( X\leq a\right) =P\left( X<a\right)
\end{equation*}を得ます。つまり、連続型の確率変数\(X\)に関しては、\(X\)の値が\(a\)以下である確率と、\(X\)の値が\(a\)より小さい確率は一致するということです。

点\(b\in \mathbb{R} \)を任意に選んだ場合、同様に考えることにより、\begin{equation*}P\left( b\leq X\right) =P\left( b<X\right)
\end{equation*}が成り立つことが示されます。つまり、連続型の確率変数\(X\)に関しては、\(X\)の値が\(b\)以上である確率と、\(X\)の値が\(b\)より大きい確率は一致するということです。

\(a\leq b\)を満たす点\(a,b\in \mathbb{R} \)を任意に選んだ場合、同様に考えることにより、\begin{equation*}P\left( a\leq X\leq b\right) =P\left( a<x<b\right) =P\left( a<X\leq b\right)
=P\left( a\leq X<b\right)
\end{equation*}が成り立つことが示されます。つまり、連続型の確率変数\(X\)の値が区間に属する確率について考える際には、区間の端点を含む場合とそうでない場合とで同じ値が得られるということです。

 

演習問題

問題(確率密度関数)
関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、定数\(c\in \mathbb{R} \)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
cx & \left( if\ 0\leq x\leq 4\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}という形で表されているものとします。この\(f_{X}\)が連続型の確率変数\(X\)の確率密度関数であるために\(c\)が満たすべき条件を明らかにしてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(確率密度関数)
連続型の確率変数\(X:\Omega\rightarrow \mathbb{R} \)の値域が、\begin{equation*}X\left( \Omega \right) =\left[ -3,3\right] \end{equation*}であるとともに、関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{36}\left( 9-x^{2}\right) & \left( if\ x\in X\left( \Omega \right)
\right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}であるものとします。この\(f_{X}\)が連続型の確率変数\(X\)の確率密度関数であることを示した上で、以下の確率\begin{equation*}P\left( -1\leq X\leq 1\right)
\end{equation*}を求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録