連続型確率変数のメディアン
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。加えて、確率変数\(X\)の分布関数\begin{equation*}F_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。つまり、\(F_{X}\)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{eqnarray*}F_{X}\left( x\right) &=&P\left( X\leq x\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ X\left( \omega \right) \leq
x\right\} \right)
\end{eqnarray*}です。
確率変数\(X\)に対して実数\(m\in \mathbb{R} \)が以下の条件\begin{equation*}P\left( X\leq m\right) \geq \frac{1}{2}\wedge P\left( X\geq m\right) \geq
\frac{1}{2}
\end{equation*}を満たす場合には、すなわち、\(X\)の実現値が\(m\)以下である確率と\(X\)の実現値が\(m\)以上である確率がともに\(\frac{1}{2}\)以上である場合には、\(m\)を\(X\)のメディアン(median)やメジアン、または中央値などと呼びます。
特に、絶対連続型の確率変数\(X\)に対して実数\(m\in \mathbb{R} \)がメディアンであることと、以下の条件\begin{equation*}F_{X}\left( m\right) =\frac{1}{2}
\end{equation*}が成り立つことは必要十分です。
\end{equation*}が成り立つことは、\(m\)が\(X\)のメディアンであるための必要十分条件である。
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{3}{4}\left( x^{2}-\frac{x^{3}}{3}\right) & \left( if\ 0\leq x\leq
2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(1\in \mathbb{R} \)に注目したとき、\begin{eqnarray*}F_{X}\left( 1\right) &=&\frac{3}{4}\left( 1^{2}-\frac{1^{3}}{3}\right) \\
&=&\frac{1}{2}
\end{eqnarray*}が成り立つため、\(1\)は\(X\)のメディアンです。\(\frac{3}{4}\left( x^{2}-\frac{x^{3}}{3}\right) \)は\(\left[ 0,2\right] \)上において狭義単調増加であるため、\(k<1\)を満たす任意の\(k\in \mathbb{R} \)について、\begin{equation*}F_{X}\left( k\right) <\frac{1}{2}
\end{equation*}が成り立ち、\(k>1\)を満たす任意の\(k\in \mathbb{R} \)について、\begin{equation*}F_{X}\left( k\right) >\frac{1}{2}
\end{equation*}が成り立つため、\(1\)とは異なる任意の\(k\)は\(X\)のメディアンではありません。以上より、\(X\)のメディアンは\(1\)であることが明らかになりました。
確率密度関数を用いたメディアンの表現
絶対連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられたとき、その分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)と確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} _{+}\)の間には以下の関係\begin{equation}\forall x\in \mathbb{R} :F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt \quad \cdots (1)
\end{equation}が成り立ちます。一方、先の命題より、実数\(m\in \mathbb{R} \)が\(X\)のメディアンであることと、\begin{equation}F_{X}\left( m\right) =\frac{1}{2} \quad \cdots (2)
\end{equation}が成り立つことは必要十分です。\(\left( 1\right) \)を用いて\(\left( 2\right) \)を言い換えると、\begin{equation*}\int_{-\infty }^{m}f_{X}\left( x\right) dx=\frac{1}{2}
\end{equation*}となります。したがって以下の命題を得ます。
\end{equation*}が成り立つことは、\(m\)が\(X\)のメディアンであるための必要十分条件である。
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{3}{4}\left( x^{2}-\frac{x^{3}}{3}\right) & \left( if\ 0\leq x\leq
2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}を定めるものとします。先に示したように、\(X\)のメディアンは\(1\)です。同じことを先の命題を用いて示します。導関数\(\frac{dF_{X}}{dx}:\mathbb{R} \supset \left( 0,2\right) \rightarrow \mathbb{R} \)はそれぞれの\(x\in \left( 0,2\right) \)に対して、\begin{eqnarray*}\frac{dF_{X}\left( x\right) }{dx} &=&\frac{d}{dx}\frac{3}{4}\left( x^{2}-\frac{x^{3}}{3}\right) \\
&=&\frac{3}{4}\frac{d}{dx}\left( x^{2}-\frac{x^{3}}{3}\right) \\
&=&\frac{3}{4}\left( 2x-x^{2}\right)
\end{eqnarray*}を定めるため、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<0\right) \\
\frac{3}{4}\left( 2x-x^{2}\right) & \left( if\ 0\leq x\leq 2\right) \\
1 & \left( if\ x>2\right)
\end{array}\right.
\end{equation*}を定める関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)の確率密度関数です。さらに、\begin{eqnarray*}\int_{-\infty }^{1}f_{X}\left( x\right) dx &=&\int_{0}^{1}\frac{3}{4}\left(
2x-x^{2}\right) dx \\
&=&\frac{3}{4}\int_{0}^{1}\left( 2x-x^{2}\right) dx \\
&=&\frac{3}{4}\left[ x^{2}-\frac{x^{3}}{3}\right] _{0}^{1} \\
&=&\frac{3}{4}\left( 1-\frac{1}{3}\right) \\
&=&\frac{1}{2}
\end{eqnarray*}が成り立つため、先の命題より\(1\)は\(X\)のメディアンです。
メディアンの存在
絶対連続型確率変数のメディアンは必ず存在します。
メディアンからなる集合は有界閉区間
絶対連続型の確率変数のメディアンは一意的に定まるとは限りません。以下の例より明らかです。
\begin{array}{cl}
\frac{5}{2} & \left( if\ 0\leq x\leq \frac{1}{5}\vee \frac{4}{5}\leq x\leq
1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)のメディアンからなる集合は、\begin{equation*}\left[ \frac{1}{5},\frac{4}{5}\right] \end{equation*}です(演習問題)。
絶対連続型確率変数のメディアンは一意的に定まるとは限りませんが、すべてのメディアンからなる集合は有界閉区間になります。
演習問題
\begin{array}{cl}
\frac{5}{2} & \left( if\ 0\leq x\leq \frac{1}{5}\vee \frac{4}{5}\leq x\leq
1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)のメディアンからなる集合が、\begin{equation*}\left[ \frac{1}{5},\frac{4}{5}\right] \end{equation*}であることを示してください。
\end{equation*}であるとともに、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、\(c\in \mathbb{R} \)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
cx^{2} & \left( if\ 0<x<1\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}と表されるものとします。以下の問いに答えてください。
- \(c\)の値を特定してください。
- \(X\)のメディアンを求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】