教材一覧
教材検索
PROBABILITY DISTRIBUTION

確率密度関数

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

確率密度関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて確率変数\(X:\Omega\rightarrow \mathbb{R} \)が与えられている場合、確率変数\(X\)の値が点集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}と定義されます。すべての点集合\(A\subset \mathbb{R} \)に対して確率\(P\left( X\in A\right) \)がそれぞれ明らかになっている場合、そのような情報の集まりを確率変数\(X\)の確率分布(probability distribution)と呼びました。

離散型の確率変数\(X\)に対しては、それぞれの実数\(x\in \mathbb{R} \)に対して、\(X\)が値\(x\)をとる確率\begin{eqnarray*}f\left( x\right) &=&P\left( X=x\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) =x\right\}
\right)
\end{eqnarray*}を値として定める確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)を定義し、その上で、\(X\)の値が点集合\(A\subset \mathbb{R} \)に入る確率が、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f\left( x\right)
\end{equation*}として与えられることを明らかにしました。一方、連続型の確率変数の確率分布を確率関数を用いて表現することはできません。以下の例より明らかです。

例(連続型の確率変数)
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)を構成する標本空間が、\begin{equation*}\Omega =[0,+\infty )
\end{equation*}という無限閉区間であるものとします。無限閉区間は非可算集合であるため、任意の標本点\(\omega \in \Omega \)に対して、その根元事象の確率は、\begin{equation}P\left( \left\{ \omega \right\} \right) =0 \quad \cdots (1)
\end{equation}となります。確率変数\(X:\Omega \rightarrow \mathbb{R} \)がそれぞれの\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を定めるのであれば、\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\Omega =[0,+\infty )
\end{equation*}という無限閉区間になるため、\(X\)は連続型の確率変数です。仮に確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)を定義するのであれば、これはそれぞれの\(\omega \in X\left( \Omega \right) \)に対して、\begin{eqnarray*}f\left( \omega \right) &=&P\left( \left\{ \omega ^{\prime }\in \Omega \ |\
X\left( \omega ^{\prime }\right) =\omega \right\} \right) \quad \because f\text{の定義} \\
&=&P\left( \left\{ \omega \right\} \right) \quad \because X\text{の定義} \\
&=&0\quad \because \left( 1\right)
\end{eqnarray*}を定めます。つまり、確率関数\(f\)は\(0\)のみを値としてとるため、確率関数が満たすべき条件\begin{equation*}\sum_{x\in X\left( \Omega \right) }f\left( x\right) =1
\end{equation*}が成り立ちません。したがって、以上のような連続型の確率変数\(X\)の確率分布を確率関数\(f\)を用いて表現することはできません。

繰り返しになりますが、確率関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)は確率変数\(X\)がそれぞれの値\(x\in \mathbb{R} \)をとる確率\begin{equation*}f\left( x\right) =P\left( X=x\right)
\end{equation*}を指定することを通じて\(X\)の確率分布を間接的に表現します。ただ、先の例が示唆するように、確率変数\(X\)が連続型である場合、確率関数\(f\)では\(X\)の確率分布を上手く記述できません。そこで、連続型の確率変数\(X\)の確率分布を記述する際には、確率分布の考え方の原点に戻り、それぞれの点集合\(A\subset \mathbb{R} \)に対して、\(X\)の値が\(A\)に属する確率\begin{equation*}P\left( X\in A\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in A\right\} \right)
\end{equation*}を直接記述するアプローチを採用します。特に、連続型の確率変数\(X\)の値域\(X\left( \Omega \right) \)は区間もしくは互いに素な区間の和集合であるため、\(X\)の確率分布を記述するためには、それぞれの区間\(I\subset \mathbb{R} \)に対して、\(X\)の値が\(I\)に属する確率\begin{equation*}P\left( X\in I\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega
\right) \in I\right\} \right)
\end{equation*}を記述すれば十分です。では、具体的にどうすればよいでしょうか。

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。つまり、\(X\)の値域\begin{equation*}X\left( \Omega \right) =\left\{ X\left( \omega \right) \in \mathbb{R} \ |\ \omega \in \Omega \right\}
\end{equation*}が区間もしくは互いに素な区間の和集合であるということです。その上で、有界区間と無限区間をどちらであるかを問わず任意の区間\(I\subset \mathbb{R} \)に対して、\begin{equation*}\left( a\right) \ P\left( X\in I\right) =\int_{I}f\left( x\right) dx
\end{equation*}を満たすとともに、\begin{eqnarray*}
&&\left( b\right) \ \forall x\in \mathbb{R} :f\left( x\right) \geq 0 \\
&&\left( c\right) \ \int_{-\infty }^{+\infty }f\left( x\right) dx=1
\end{eqnarray*}をともに満たす関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が存在する場合には、この関数\(f\)を\(X\)の確率密度関数(probability density function)と呼びます。

条件\(\left( a\right) \)は、連続型の確率変数\(X\)がある区間\(I\)に属する値をとる確率は、確率密度関数\(f\)をその区間\(I\)にわたって積分すれば得られることを意味します。また、条件\(\left(b\right) \)は確率密度関数が非負の実数を値としてとり得る関数であることを意味し、条件\(\left( c\right) \)は確率密度関数を定義域全体で積分すると\(1\)になることを意味します。

例(有界閉区間の確率)
連続型の確率変数\(X\)の確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとします。\(a\leq b\)を満たす実数\(a,b\in \mathbb{R} \)を任意に選んだ上で、それらを端点とする有界な閉区間\begin{equation*}\left[ a,b\right] \subset \mathbb{R} \end{equation*}をとったとき、\(f\)の定義より、\begin{eqnarray*}P\left( X\in \left[ a,b\right] \right) &=&P\left( a\leq X\leq b\right) \\
&=&\int_{a}^{a}f\left( x\right) dx\quad \because f\text{の定義}
\end{eqnarray*}となります。つまり、連続型の確率変数\(X\)が\(a\)以上\(b\)以下の値をとる確率は、確率密度関数\(f\)を区間\(\left[ a,b\right] \)上で積分して得られる値であり、これは下図のグレーの領域の面積に相当します

図:確率密度関数
図:確率密度関数
例(無限閉区間の確率)
連続型の確率変数\(X\)の確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとします。実数\(a\in \mathbb{R} \)を任意に選んだ上で、それを端点とする無限閉区間\begin{equation*}\lbrack a,+\infty )\subset \mathbb{R} \end{equation*}をとったとき、\(f\)の定義より、\begin{eqnarray*}P\left( X\in \lbrack a,+\infty )\right) &=&P\left( a\leq X\right) \\
&=&\int_{a}^{+\infty }f\left( x\right) dx\quad \because f\text{の定義}
\end{eqnarray*}となります。つまり、連続型の確率変数\(X\)が\(a\)以上の値をとる確率は、確率密度関数\(f\)を区間\([a,+\infty )\)上で積分して得られる値であり、これは下図のグレーの領域の面積に相当します。

図:確率密度関数
図:確率密度関数
例(無限閉区間の確率)
連続型の確率変数\(X\)の確率密度関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)が与えられているものとします。実数\(a\in \mathbb{R} \)を任意に選んだ上で、それを端点とする無限閉区間\begin{equation*}(-\infty ,a]\subset \mathbb{R} \end{equation*}をとったとき、\(f\)の定義より、\begin{eqnarray*}P\left( X\in (-\infty ,a]\right) &=&P\left( X\leq a\right) \\
&=&\int_{-\infty }^{a}f\left( x\right) dx\quad \because f\text{の定義}
\end{eqnarray*}となります。つまり、連続型の確率変数\(X\)が\(a\)以下の値をとる確率は、確率密度関数\(f\)を区間\((-\infty ,a]\)上で積分して得られる値であり、これは下図のグレーの領域の面積に相当します。

図:確率密度関数
図:確率密度関数
例(確率密度関数)
「\(0\)以上\(1\)以下の実数をランダムに\(1\)つ選ぶ」という試行の標本空間は、\begin{equation*}\Omega =\left[ 0,1\right] \end{equation*}となります。それぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left[ 0,1\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(f\)の定義より、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) \geq 0
\end{equation*}が明らかに成り立ちます。また、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f\left( x\right) dx &=&\int_{0}^{1}f\left(
x\right) dx \\
&=&\int_{0}^{1}1dx \\
&=&\left[ x\right] _{0}^{1} \\
&=&1
\end{eqnarray*}です。したがって、\(f\)が\(X\)の確率密度関数であることが示されました。 例えば、\(\frac{1}{2}\)以下の実数が選ばれる確率は、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}\right) &=&\int_{0}^{\frac{1}{2}}f\left(
x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}1dx \\
&=&\frac{1}{2}
\end{eqnarray*}であり、\(\frac{1}{4}\)以上\(\frac{3}{4}\)以下の実数が選ばれる確率は、\begin{eqnarray*}P\left( \frac{1}{4}\leq X\leq \frac{3}{4}\right) &=&\int_{\frac{1}{4}}^{\frac{3}{4}}f\left( x\right) dx \\
&=&\int_{\frac{1}{4}}^{\frac{3}{4}}1dx \\
&=&\frac{1}{2}
\end{eqnarray*}です。

例(確率密度関数)
「エレベーターが到着するのが待つ」という試行において、エレベーターが到着するまでの経過時間を\(\omega \)で表記します。最長で\(2\)分間待つ必要があるのであれば、問題としている試行の標本空間は、\begin{equation*}\Omega =\left[ 0,2\right] \end{equation*}となります。それぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{equation*}X\left( \Omega \right) =\Omega =\left[ 0,2\right] \end{equation*}という有界閉区間であるため\(X\)は連続型の確率変数です。関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
x & \left( if\ 0\leq x\leq 1\right) \\
2-x & \left( if\ 1<x\leq 2\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(f\)の定義より、任意の\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) \geq 0
\end{equation*}が明らかに成り立ちます。また、\begin{eqnarray*}
\int_{-\infty }^{+\infty }f\left( x\right) dx &=&\int_{0}^{2}f\left(
x\right) dx \\
&=&\int_{0}^{1}xdx+\int_{1}^{2}\left( 2-x\right) dx \\
&=&\left[ \frac{x^{2}}{2}\right] _{0}^{1}+\left[ 2x-\frac{x^{2}}{2}\right] _{1}^{2} \\
&=&\frac{1}{2}+\frac{1}{2} \\
&=&1
\end{eqnarray*}です。したがって、\(f\)が\(X\)の確率密度関数であることが示されました。 例えば、待ち時間が\(30\)秒(\(\frac{1}{2}\)分)以下である確率は、\begin{eqnarray*}P\left( 0\leq X\leq \frac{1}{2}\right) &=&\int_{0}^{\frac{1}{2}}f\left(
x\right) dx \\
&=&\int_{0}^{\frac{1}{2}}xdx \\
&=&\left[ \frac{x^{2}}{2}\right] _{0}^{\frac{1}{2}} \\
&=&\frac{1}{8}
\end{eqnarray*}であり、待ち時間が\(1\)分\(30\)秒(\(\frac{3}{2}\)分)以上である確率は、\begin{eqnarray*}P\left( X\geq \frac{3}{2}\right) &=&\int_{\frac{3}{2}}^{+\infty }f\left(
x\right) dx \\
&=&\int_{\frac{3}{2}}^{2}\left( 2-x\right) dx \\
&=&\left[ 2x-\frac{x^{2}}{2}\right] _{\frac{3}{2}}^{2} \\
&=&\frac{1}{8}
\end{eqnarray*}です。

 

連続型の確率変数が特定の値をとる確率

実数\(a\in \mathbb{R} \)を任意に選んだとき、\begin{equation}\left[ a,a\right] =\left\{ a\right\} \quad \cdots (1)
\end{equation}という関係が成り立つため、\begin{eqnarray*}
P\left( X=a\right) &=&P\left( X\in \left\{ a\right\} \right) \\
&=&P\left( X\in \left[ a,a\right] \right) \quad \because \left( 1\right) \\
&=&P\left( a\leq X\leq a\right) \\
&=&\int_{a}^{a}f\left( x\right) dx\quad \because f\text{の定義} \\
&=&0
\end{eqnarray*}すなわち、\begin{equation*}
P\left( X=a\right) =0
\end{equation*}となります。つまり、連続型の確率変数\(X\)に関しては、それがある1つの実数を値としてとる確率は\(0\)になるということです。ただ、以上の事実は「\(X\)の値が\(a\)と一致する」という事象が空事象であることを意味するわけではありません。\(X\)の値が\(a\)と一致する確率は下図の線分の面積として表現されますが、線分は面積をもたないため、その値は\(0\)になります。ただ、これは線分が存在しないことを意味するわけではありません。

図:確率密度関数
図:確率密度関数

繰り返しになりますが、\(a\leq b\)を満たす実数\(a,b\in \mathbb{R} \)を任意に選んだ上でそれらを端点とする有界な閉区間\begin{equation*}\left[ a,b\right] \subset \mathbb{R} \end{equation*}をとったとき、先の議論より、離散型の確率変数\(X\)の値が区間の端点である\(a\)や\(b\)と一致する確率はいずれも\(0\)であるため、\begin{equation*}P\left( X\in \left[ a,b\right] \right) =P\left( X\in \left( a,b\right)
\right) =P\left( X\in (a,b]\right) =P\left( X\in \lbrack a,b)\right)
=\int_{a}^{a}f\left( x\right) dx
\end{equation*}すなわち、\begin{equation*}
P\left( a\leq X\leq b\right) =P\left( a<x<b\right) =P\left( a<X\leq b\right)
=P\left( a\leq X<b\right) =\int_{a}^{a}f\left( x\right) dx
\end{equation*}という関係が成り立ちます。

 

演習問題

問題(確率密度関数)
関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、定数\(c\in \mathbb{R} \)を用いて、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
cx & \left( if\ 0\leq x\leq 4\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}という形で表されているものとします。この\(f\)が連続型の確率変数\(X\)の確率密度関数であるために\(c\)が満たすべき条件を明らかにしてください。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(確率密度関数)
関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{36}\left( 9-x^{2}\right) & \left( if\ -3\leq x\leq 3\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}であるものとします。この\(f\)が連続型の確率変数\(X\)の確率密度関数であることを示した上で、\(X\)が\(-1\)以上\(1\)以下の値をとる確率を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(確率密度関数)
「病院で受付を済ませてから診察を受け始めるまでの待ち時間(分)を計測する」という試行の標本空間は、\begin{equation*}
\Omega =[0,+\infty )
\end{equation*}となります。それぞれの標本点\(\omega \in \Omega \)に対して、\begin{equation*}X\left( \omega \right) =\omega
\end{equation*}を値として定める確率変数\(X:\Omega \rightarrow \mathbb{R} \)を定義すると、その値域は、\begin{equation*}X\left( \Omega \right) =\Omega =[0,+\infty )
\end{equation*}であるため\(X\)は連続型の確率変数です。関数\(f:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{4}e^{-\frac{x}{4}} & \left( if\ x\geq 0\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。この関数\(f\)が\(X\)の確率密度関数であることを確認した上で、待ち時間が\(2\)分以上\(5\)分以下である確率を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は連続型の分布関数について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

確率変数

連続型の確率変数

値域が区間もしくは互いに素な区間の和集合であるような確率変数を連続型の確率変数と呼びます。

分布関数

連続型の分布関数(累積分布関数)

連続型の確率変数の確率分布は確率密度関数によって表現されますが、分布関数と呼ばれる概念を用いて表現することもできます。これは確率変数の値がある一定の値以下をとる確率を与える関数です。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録