連続型確率変数に関するマルコフの不等式
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の確率変数\begin{equation*}X:\Omega \rightarrow \mathbb{R} \end{equation*}が与えられているものとします。さらに、確率変数\(X\)の確率分布が確率密度関数\begin{equation*}f_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}によって記述されているものとします。つまり、\begin{equation*}
\forall B\in \mathcal{B}\left( \mathbb{R} \right) :P\left( X\in B\right) =\int_{B}f_{X}\left( x\right) dx
\end{equation*}が成り立つということです。ただし、\(\mathcal{B}\left( \mathbb{R} \right) \)は\(\mathbb{R} \)上のボレル集合族です。確率変数\(X\)の分布関数が、\begin{equation*}F_{X}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}である場合、以下の関係\begin{equation*}
\forall x\in \mathbb{R} :F_{X}\left( x\right) =\int_{-\infty }^{x}f_{X}\left( t\right) dt
\end{equation*}もまた成立します。この確率変数\(X\)は以下の2つの条件を満たすものとします。
1つ目は、\(X\)が非負の実数のみを値としてとり得るということ、すなわち、\begin{equation*}\forall \omega \in \Omega :X\left( \omega \right) \geq 0
\end{equation*}が成り立つということです。
2つ目は、\(X\)の期待値\begin{equation*}E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}が有限な実数として定まるということです。
正の実数\(c>0\)を任意に選んだとき、確率変数\(X\)の実現値が\(c\)以上である確率は、\begin{equation*}P\left( X\geq c\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \geq c\right\} \right)
\end{equation*}として定まりますが、\(X\)が先の条件を満たす場合には以下の関係\begin{equation*}P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立つことが保証されます。これをマルコフの不等式(Markov’s inequality)と呼びます。
\end{equation*}が成り立つとともに、期待値\(E\left( X\right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall c>0:P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立つ。
絶対連続型の確率変数\(X\)が非負の実数のみを値としてとり得るとともに期待値\(E\left( X\right) \)が有限な実数として定まる場合には、任意の\(c>0\)について以下の関係\begin{equation*}P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立つことが明らかになりました。以上の事実をどのように理解すればよいでしょうか。
同一の確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に対して定義される2つの異なる確率変数\begin{eqnarray*}X &:&\Omega \rightarrow \mathbb{R} \\
Y &:&\Omega \rightarrow \mathbb{R} \end{eqnarray*}が与えられた状況において、これらの確率変数の実現値がある値\(c>0\)以上である確率どうしを比較します。ただし、\begin{equation}E\left( X\right) >E\left( Y\right) \quad \cdots (1)
\end{equation}が成り立つものとします。つまり、\(X\)の期待値は\(Y\)の期待値よりも大きいということです。マルコフの定理より、\begin{eqnarray*}P\left( X\geq c\right) &\leq &\frac{E\left( X\right) }{c} \\
P\left( Y\geq c\right) &\leq &\frac{E\left( Y\right) }{c}
\end{eqnarray*}が成り立ちますが、これらと\(\left( 1\right) \)および\(c>0\)より、\begin{equation*}\frac{E\left( X\right) }{c}>\frac{E\left( Y\right) }{c}
\end{equation*}を得ます。つまり、より大きい期待値\(E\left(X\right) \)を持つ確率変数\(X\)のもとで、ある値\(c\)以上の値が実現する確率はより大きく評価され、逆に、より小さい期待値\(E\left( Y\right) \)を持つ確率変数\(Y\)のもとで、ある値\(c\)以上の値が実現する確率はより小さく評価されます。つまり、確率分布の形状を山と見立て、期待値を山の頂上とみなす場合、山が高いほど山の裾野は長いということです。
先の命題は、確率変数の実現値がある値以上である確率の上限を評価する際にも有用です。つまり、マルコフの定理より、\begin{equation*}
P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立つため、確率変数\(X\)の実現値が\(c\)以上である確率の上限が\(\frac{E\left( X\right) }{c}\)であることが保証されます。同時に、確率変数の実現値がある値より小さい確率の下限を評価する際にも有用です。つまり、\begin{eqnarray*}P\left( X<c\right) &=&1-P\left( X\geq c\right) \\
&\geq &1-\frac{E\left( X\right) }{c}\quad \because \text{マルコフの不等式}
\end{eqnarray*}すなわち、\begin{equation*}
P\left( X<c\right) \geq 1-\frac{E\left( X\right) }{c}
\end{equation*}が成り立つため、確率変数\(X\)の実現値が\(c\)より小さい確率の下限が\(1-\frac{E\left( X\right) }{c}\)であることが保証されます。
\end{equation*}が成り立つということです。さらに、期待値\(E\left( X\right) \)が有限な実数として定まるものとします。このとき、\begin{equation*}\forall \omega \in \Omega :X\left( \omega \right) \geq 0
\end{equation*}が明らかに成り立つため、先の命題より、\begin{equation*}
\forall c>0:P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立ちます。
\end{equation}であるものとします。この確率変数\(X\)の実現値が\(20\)以上である確率に関して、\begin{eqnarray*}P\left( X\geq 20\right) &\leq &\frac{E\left( X\right) }{20}\quad \because
\text{マルコフの不等式} \\
&=&\frac{15}{20}\quad \because \left( 1\right) \\
&=&\frac{3}{4}
\end{eqnarray*}が成り立ちます。逆に、この確率変数\(X\)の実現値が\(20\)より小さい確率に関して、\begin{eqnarray*}P\left( X<20\right) &=&1-P\left( X\geq 20\right) \\
&\geq &1-\frac{E\left( X\right) }{20}\quad \because \text{マルコフの不等式} \\
&=&1-\frac{15}{20} \\
&=&\frac{1}{4}
\end{eqnarray*}が成り立ちます。つまり、\(X\)の期待値が\(15\)である場合、\(X\)の実現値が\(20\)以上である確率は最大で\(\frac{3}{4}\)であり、\(X\)の実現値が\(20\)より小さい確率は最低で\(\frac{1}{4}\)であるということです。
\end{equation*}であるものとします。マルコフの不等式より、\(X\)の値が\(60\)以上である確率に関して、\begin{eqnarray*}P\left( X\geq 60\right) &\leq &\frac{E\left( X\right) }{60} \\
&=&\frac{40}{60} \\
&=&\frac{2}{3}
\end{eqnarray*}が成り立ちます。同時に、\(X\)の値が\(60\)より小さい確率に関して、\begin{eqnarray*}P\left( X<60\right) &=&1-P\left( X\geq 60\right) \\
&\geq &1-\frac{2}{3} \\
&=&\frac{1}{3}
\end{eqnarray*}が成り立ちます。つまり、耐用時間の平均が\(40\)である場合、耐用時間が\(60\)以上の製品の割合は最大で\(\frac{2}{3}\)であり、逆に、耐用時間が\(60\)より短い製品の割合は最小で\(\frac{1}{3}\)であるということです。
確率変数の絶対値に関するマルコフの不等式
マルコフの不等式では確率変数\(X:\Omega \rightarrow \mathbb{R} \)が非負の実数のみを値としてとり得る状況を想定しています。一方、\(X\)が負の値をとり得る場合においても、その絶対値\(\left\vert X\right\vert \)をとれば、すなわち、それぞれの\(\omega \in\Omega \)に対して、\begin{equation*}\left\vert X\right\vert \left( \omega \right) =\left\vert X\left( \omega
\right) \right\vert
\end{equation*}を定める確率変数\begin{equation*}
\left\vert X\right\vert :\Omega \rightarrow \mathbb{R} \end{equation*}に注目すれば、この確率変数\(\left\vert X\right\vert \)は非負の実数のみを値としてとり得るため、この新たな確率変数\(\left\vert X\right\vert \)に対して先と同様の主張が成り立つことを保証できます。具体的には以下の通りです。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。加えて、\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。さらに、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left\vert X\right\vert \left( \omega \right) =\left\vert X\left( \omega
\right) \right\vert
\end{equation*}を定める新たな確率変数\(\left\vert X\right\vert :\Omega \rightarrow \mathbb{R} \)を定義します。
この確率変数\(\left\vert X\right\vert \)の期待値が有限な実数として定まるものとします。LOTUSより、\(\left\vert X\right\vert \)の期待値は、\begin{equation*}E\left( \left\vert X\right\vert \right) =\int_{-\infty }^{+\infty
}\left\vert x\right\vert f_{X}\left( x\right) dx
\end{equation*}として定まることに注意してください。
正の実数\(c>0\)を任意に選んだとき、確率変数\(\left\vert X\right\vert \)の値が\(c\)以上である確率は、\begin{eqnarray*}P\left( \left\vert X\right\vert \geq c\right) &=&P\left( \left\{ \omega \in
\Omega \ |\ \left\vert X\right\vert \left( \omega \right) \geq c\right\}
\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left\vert X\left( \omega \right)
\right\vert \geq c\right\} \right)
\end{eqnarray*}として定まりますが、先の条件が満たされる場合には、以下の関係\begin{equation*}
P\left( \left\vert X\right\vert \geq c\right) \leq \frac{E\left( \left\vert
X\right\vert \right) }{c}
\end{equation*}が成り立つことが保証されます。これもまたマルコフの不等式(Markov’s inequality)と呼ばれます。
\right) \right\vert
\end{equation*}を定める確率変数\(\left\vert X\right\vert :\Omega \rightarrow \mathbb{R} \)を定義する。期待値\(E\left( \left\vert X\right\vert \right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall c>0:P\left( \left\vert X\right\vert \geq c\right) \leq \frac{E\left(
\left\vert X\right\vert \right) }{c}
\end{equation*}が成り立つ。
\left\vert X\right\vert \right) }{c}
\end{equation*}が成り立ちます。つまり、変動率の期待値\(E\left( \left\vert X\right\vert \right) \)が明らかである場合には、変動率の実現値が\(c\)以上である確率は最大で\(\frac{E\left( \left\vert X\right\vert \right) }{c}\)となります。
確率変数との合成関数に関するマルコフの不等式
マルコフの不等式では確率変数\(X:\Omega \rightarrow \mathbb{R} \)が非負の実数のみを値としてとり得る状況を想定しています。一方、\(X\)が負の値をとり得る場合においても、何らかの関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)との合成関数\(g\circ X:\Omega\rightarrow \mathbb{N} \)をとることにより非負の実数のみを値としてとり得る確率変数\(g\left( X\right) =g\circ X\)を生成すれば、この新たな確率変数\(g\left( X\right) \)に対して先の命題と同様の主張が成り立つことを保証できます。具体的には以下の通りです。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて絶対連続型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。加えて、\(X\)の確率分布が確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。さらに、関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}g\left( X\right) \left( \omega \right) =g\left( X\left( \omega \right)
\right)
\end{equation*}を定める新たな確率変数\(g\left( X\right) :\Omega \rightarrow \mathbb{R} \)を定義します。この確率変数\(X\)は以下の2つの条件を満たすものとします。
1つ目は、\(g\left( X\right) \)が非負の実数のみを値としてとり得るということ、すなわち、\begin{equation*}\forall \omega \in \Omega :g\left( X\right) \left( \omega \right) =g\left(
X\left( \omega \right) \right) \geq 0
\end{equation*}が成り立つということです。
2つ目は、\(g\left( X\right) \)の期待値が有限な実数として定まるということです。LOTUSより、\(g\left( X\right) \)の期待値は、\begin{equation*}E\left( g\left( X\right) \right) =\int_{-\infty }^{+\infty }g\left( x\right)
f_{X}\left( x\right) dx
\end{equation*}として定まることに注意してください。
正の実数\(c>0\)を任意に選んだとき、確率変数\(g\left( X\right) \)の値が\(c\)以上である確率は、\begin{eqnarray*}P\left( g\left( X\right) \geq c\right) &=&P\left( \left\{ \omega \in \Omega
\ |\ g\left( X\right) \left( \omega \right) \geq c\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ g\left( X\left( \omega \right)
\right) \geq c\right\} \right)
\end{eqnarray*}として定まりますが、先の条件が満たされる場合には、以下の関係\begin{equation*}
P\left( g\left( X\right) \geq c\right) \leq \frac{E\left( g\left( X\right)
\right) }{c}
\end{equation*}が成り立つことが保証されます。これもまたマルコフの不等式(Markov’s inequality)と呼ばれます。
\right)
\end{equation*}を定める確率変数\(g\left(X\right) :\Omega \rightarrow \mathbb{R} \)を定義する。ただし、\begin{equation*}\forall \omega \in \Omega :g\left( X\right) \left( \omega \right) \geq 0
\end{equation*}が成り立つとともに、期待値\(E\left( g\left( X\right) \right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall c>0:P\left( g\left( X\right) \geq c\right) \leq \frac{E\left(
g\left( X\right) \right) }{c}
\end{equation*}が成り立つ。
\end{equation*}が成り立ちます。つまり、寿命の2乗の期待値\(E\left( \left\vert X\right\vert \right) \)が明らかである場合には、寿命の2乗の実現値が\(c\)以上である確率は最大で\(\frac{E\left( X^{2}\right) }{c}\)となります。
マルコフの不等式の正確性
確率変数\(X\)の確率分布の全容を特定するのが困難な状況においても、期待値\(E\left( X\right) \)さえ明らかであれば、マルコフの不等式を用いることにより、その確率変数\(X\)の実現値が\(c\)以上である確率\(P\left( X\geq c\right) \)の上限\(\frac{E\left( X\right) }{c}\)を特定することはできます。つまり、\(X\)の実現値が\(c\)以上である真の確率\(P\left( X\geq c\right) \)を特定するのが困難な状況においても、期待値\(E\left( X\right) \)さえ明らかであれば、確率\(P\left( X\geq c\right) \)の真の値が収まる範囲を特定できるということです。言い換えると、\(X\)の実現値が\(c\)以上である真の確率\(P\left( X\geq c\right) \)が\(\frac{E\left( X\right) }{c}\)を超えることはありません。では、真の確率\(P\left( X\geq c\right) \)とマルコフの不等式が与える値\(\frac{E\left( X\right) }{c}\)はどの程度乖離しているのでしょうか。具体例を挙げます。
\begin{array}{cl}
\frac{1}{10} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。\(X\)の期待値は、\begin{eqnarray*}E\left( X\right) &=&\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx \\
&=&\int_{0}^{10}\frac{x}{10}dx \\
&=&\frac{1}{10}\int_{0}^{10}xdx \\
&=&\frac{1}{10}\left[ \frac{x^{2}}{2}\right] _{0}^{10} \\
&=&\frac{1}{10}\cdot 50 \\
&=&5
\end{eqnarray*}であるため、マルコフの不等式より、確率変数\(X\)の実現値が\(8\)以上の確率について、\begin{eqnarray*}P\left( X\geq 8\right) &\leq &\frac{E\left( X\right) }{8}\quad \because
\text{マルコフの不等式} \\
&=&\frac{5}{8}\quad \because E\left( X\right) =5
\end{eqnarray*}が成り立ちます。つまり、確率変数\(X\)の実現値が\(8\)以上である確率は\(\frac{5}{8}\)以下です。一方、確率変数\(X\)の実現値が\(8\)以上である確率の真の値は、\begin{eqnarray*}P\left( X\geq 8\right) &=&\int_{8}^{10}f_{X}\left( x\right) dx \\
&=&\int_{8}^{10}\frac{1}{10}dx \\
&=&\frac{1}{10}\int_{8}^{10}1dx \\
&=&\frac{1}{10}\left[ x\right] _{8}^{10} \\
&=&\frac{1}{10}\left( 10-8\right) \\
&=&\frac{1}{5}
\end{eqnarray*}です。両者を比較すると、\begin{equation*}
\frac{1}{5}\leq \frac{5}{8}
\end{equation*}すなわち、\begin{equation*}
P\left( X\geq 8\right) \leq \frac{5}{8}
\end{equation*}であり、マルコフの不等式の正しさを確認できました。繰り返しになりますが、確率\(P\left( X\geq 8\right) \)の真の値は\(\frac{1}{5}\)である一方、マルコフの不等式が与える確率\(P\left( X\geq 8\right) \)の最大値は\(\frac{5}{8}\)であるため、両者の誤差は、\begin{equation*}\frac{5}{8}-\frac{1}{5}=\frac{17}{40}
\end{equation*}であり、両者の間には大きな開きがあります。この例のように、確率変数の実現値が広い範囲に均等に分布している場合、マルコフの不等式が与える確率の範囲は実際の確率を特定する上でそれほど役に立ちません。マルコフの不等式は期待値だけを拠り所とした指標であるため、致し方ありません。
演習問題
\end{equation*}を満たすものとします。加えて、期待値\begin{equation*}
E\left( X\right) =\int_{-\infty }^{+\infty }xf_{X}\left( x\right) dx
\end{equation*}は有限な実数として求まるものとします。以上の想定のもと、以下の確率\begin{equation*}
P\left( X\geq 2E\left( X\right) \right)
\end{equation*}の上限を求めてください。
\end{equation*}であるとともに、確率密度関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、定数\(\lambda >0\)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\lambda e^{-\lambda x} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}と表されるものとします。\(c>0\)を任意に選んだとき、以下の確率\begin{equation*}P\left( X\geq c\right)
\end{equation*}の上限をマルコフの定理より求めてください。さらに、\(P\left( X\geq c\right) \)の真の値を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】