離散型確率変数に関するマルコフの不等式
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられており、その確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。つまり、確率変数\(X\)が値\(x\in \mathbb{R} \)をとる確率は、\begin{equation*}P\left( X=x\right) =f_{X}\left( x\right)
\end{equation*}であり、確率変数\(X\)の値が集合\(A\subset \mathbb{R} \)に属する確率は、\begin{equation*}P\left( X\in A\right) =\sum_{x\in A}f_{X}\left( x\right)
\end{equation*}であるということです。
この確率変数\(X\)は以下の2つの条件を満たすものとします。1つ目は、\(X\)が非負の実数のみを値としてとり得るということです。すなわち、\begin{equation*}\forall \omega \in \Omega :X\left( \omega \right) \geq 0
\end{equation*}が成り立つということです。2つ目は、\(X\)の期待値\begin{equation*}E\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[ x\cdot
f_{X}\left( x\right) \right]
\end{equation*}が有限な実数として定まるということです。
正の実数\(c>0\)を任意に選んだとき、確率変数\(X\)の値が\(c\)以上である確率は、\begin{equation*}P\left( X\geq c\right) =P\left( \left\{ \omega \in \Omega \ |\ X\left(
\omega \right) \geq c\right\} \right)
\end{equation*}として定まりますが、先の条件が満たされる場合には、以下の関係\begin{equation*}
P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立つことが保証されます。これをマルコフの不等式(Markov’s inequality)と呼びます。
\end{equation*}が成り立つとともに、期待値\(E\left( X\right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall c>0:P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}という関係が成り立つ。
確率変数\(X\)が非負の実数のみを値としてとり得るとともに期待値\(E\left( X\right) \)が有限な実数として定まる場合には、任意の\(c>0\)について以下の関係\begin{equation*}P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立つことが明らかになりました。以上の事実をどのように理解すればよいでしょうか。
様々な確率変数\(X_{1},X_{2},X_{3},\cdots \)が存在する状況において、これらの確率変数がある値\(c\)以上の値をとる確率どうしを比較します。上の命題によると、これらの確率変数\(X_{1},X_{2},X_{3},\cdots \)の中でも最大の期待値を持つ確率変数のもとで、ある値\(c\)以上の値が実現する確率は最大になります。逆に、確率変数\(X_{1},X_{2},X_{3},\cdots \)の中でも最小の期待値を持つ確率変数のもとで、ある値\(c\)以上の値が実現する確率は最小になります。つまり、より大きい期待値\(E\left( X\right) \)を持つ確率変数\(X\)のもとで、ある値\(c\)以上の値が実現する確率はより大きく評価され、逆に、より小さい期待値\(E\left( X\right) \)を持つ確率変数\(X\)のもとで、ある値\(c\)以上の値が実現する確率はより小さく評価されます。
先の命題は、確率変数がある値以上の値をとる確率の上限を評価する際にも有用です。つまり、\begin{equation*}
P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}という関係が成り立つため、確率変数\(X\)が\(c\)以上の値をとる確率の上限が\(\frac{E\left( X\right) }{c}\)であることが保証されます。
\end{equation*}が成り立つとともに、期待値\(E\left( X\right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall \omega \in \Omega :X\left( \omega \right) \geq 0
\end{equation*}は明らかに成り立つため、先の命題より、\begin{equation*}
\forall c>0:P\left( X\geq c\right) \leq \frac{E\left( X\right) }{c}
\end{equation*}が成り立ちます。
\end{equation}であるものとします。この確率変数\(X\)の値が\(20\)以上である確率に関して、\begin{eqnarray*}P\left( X\geq 20\right) &\leq &\frac{E\left( X\right) }{20}\quad \because
\text{マルコフの不等式} \\
&=&\frac{15}{20} \\
&=&\frac{3}{4}
\end{eqnarray*}が成り立ちます。逆に、この確率変数\(X\)の値が\(20\)より小さい確率に関して、\begin{eqnarray*}P\left( X<20\right) &=&1-P\left( X\geq 20\right) \\
&\geq &1-\frac{E\left( X\right) }{20}\quad \because \text{マルコフの不等式} \\
&=&1-\frac{15}{20} \\
&=&\frac{1}{4}
\end{eqnarray*}が成り立ちます。つまり、\(X\)の期待値が\(15\)である場合、\(X\)の値が\(20\)以上である確率は最大で\(\frac{3}{4}\)であり、\(X\)の値が\(20\)より小さい確率は最低で\(\frac{1}{4}\)であるということです。
\end{equation*}という有限集合です。つまり、\(X\)は非負の値のみをとり得る離散型の確率変数です。\(X\)の期待値は、\begin{equation*}E\left( X\right) =2
\end{equation*}であるものとします。マルコフの不等式より、\(X\)の値が\(3\)以上である確率に関して、\begin{eqnarray*}P\left( X\geq 3\right) &\leq &\frac{E\left( X\right) }{3} \\
&=&\frac{2}{3}
\end{eqnarray*}が成り立ちます。同時に、\(X\)の値が\(3\)より小さい確率に関して、\begin{eqnarray*}
P\left( X<3\right) &=&1-P\left( X\geq 3\right) \\
&\geq &1-\frac{2}{3} \\
&=&\frac{1}{3}
\end{eqnarray*}が成り立ちます。つまり、クラスのGPAの平均が\(2\)である場合、\(3\)以上のGPAを獲得している学生の割合は最大で\(\frac{2}{3}\)であり、逆に、\(3\)より小さいGPAを獲得している学生の割合は最小で\(\frac{1}{3}\)であるということです。
確率変数の絶対値に関するマルコフの不等式
マルコフの不等式では確率変数\(X:\Omega \rightarrow \mathbb{R} \)が非負の実数のみを値としてとり得る状況を想定しています。一方、\(X\)が負の値をとり得る場合においても、その絶対値\(\left\vert X\right\vert \)をとれば、すなわち、それぞれの\(\omega \in\Omega \)に対して、\begin{equation*}\left\vert X\right\vert \left( \omega \right) =\left\vert X\left( \omega
\right) \right\vert
\end{equation*}を定める確率変数\(\left\vert X\right\vert :\Omega \rightarrow \mathbb{R} \)に注目すれば、この確率変数\(\left\vert X\right\vert \)は非負の実数のみを値としてとり得るため、この新たな確率変数\(\left\vert X\right\vert \)に対して先の命題と同様の主張が成り立つことを保証できます。具体的には以下の通りです。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。加えて、\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。さらに、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}\left\vert X\right\vert \left( \omega \right) =\left\vert X\left( \omega
\right) \right\vert
\end{equation*}を定める新たな確率変数\(\left\vert X\right\vert :\Omega \rightarrow \mathbb{R} \)を定義します。
この確率変数\(\left\vert X\right\vert \)の期待値が有限な実数として定まるものとします。LOTUSより、\(\left\vert X\right\vert \)の期待値は、\begin{equation*}E\left( \left\vert X\right\vert \right) =\sum_{x\in X\left( \Omega \right) }
\left[ \left\vert x\right\vert \cdot f_{X}\left( x\right) \right]
\end{equation*}として定まることに注意してください。
正の実数\(c>0\)を任意に選んだとき、確率変数\(\left\vert X\right\vert \)の値が\(c\)以上である確率は、\begin{eqnarray*}P\left( \left\vert X\right\vert \geq c\right) &=&P\left( \left\{ \omega \in
\Omega \ |\ \left\vert X\right\vert \left( \omega \right) \geq c\right\}
\right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ \left\vert X\left( \omega \right)
\right\vert \geq c\right\} \right)
\end{eqnarray*}として定まりますが、先の条件が満たされる場合には、以下の関係\begin{equation*}
P\left( \left\vert X\right\vert \geq c\right) \leq \frac{E\left( \left\vert
X\right\vert \right) }{c}
\end{equation*}が成り立つことが保証されます。これもまたマルコフの不等式(Markov’s inequality)と呼ばれます。
\right) \right\vert
\end{equation*}を定める確率変数\(\left\vert X\right\vert :\Omega \rightarrow \mathbb{R} \)を定義する。期待値\(E\left( \left\vert X\right\vert \right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall c>0:P\left( \left\vert X\right\vert \geq c\right) \leq \frac{E\left(
\left\vert X\right\vert \right) }{c}
\end{equation*}という関係が成り立つ。
確率変数との合成関数に関するマルコフの不等式
マルコフの不等式では確率変数\(X:\Omega \rightarrow \mathbb{R} \)が非負の実数のみを値としてとり得る状況を想定しています。一方、\(X\)が負の値をとり得る場合においても、何らかの関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)との合成関数\(g\circ X:\Omega\rightarrow \mathbb{N} \)をとることにより非負の実数のみを値としてとり得る確率変数\(g\left( X\right) =g\circ X\)を生成すれば、この新たな確率変数\(g\left( X\right) \)に対して先の命題と同様の主張が成り立つことを保証できます。具体的には以下の通りです。
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に加えて離散型の確率変数\(X:\Omega \rightarrow \mathbb{R} \)が与えられているものとします。加えて、\(X\)の確率分布が確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)によって記述されているものとします。さらに、関数\(g:\mathbb{R} \rightarrow \mathbb{R} \)を任意に選んだ上で、それぞれの\(\omega \in \Omega \)に対して、\begin{equation*}g\left( X\right) \left( \omega \right) =g\left( X\left( \omega \right)
\right)
\end{equation*}を定める新たな確率変数\(g\left( X\right) :\Omega \rightarrow \mathbb{R} \)を定義します。
この確率変数\(X\)は以下の2つの条件を満たすものとします。1つ目は、\(g\left( X\right) \)が非負の実数のみを値としてとり得るということです。すなわち、\begin{equation*}\forall \omega \in \Omega :g\left( X\right) \left( \omega \right) =g\left(
X\left( \omega \right) \right) \geq 0
\end{equation*}が成り立つということです。2つ目は、\(g\left(X\right) \)の期待値が有限な実数として定まるものとします。LOTUSより、\(g\left( X\right) \)の期待値は、\begin{equation*}E\left( g\left( X\right) \right) =\sum_{x\in X\left( \Omega \right) }\left[
g\left( x\right) \cdot f_{X}\left( x\right) \right]
\end{equation*}として定まることに注意してください。
正の実数\(c>0\)を任意に選んだとき、確率変数\(g\left( X\right) \)の値が\(c\)以上である確率は、\begin{eqnarray*}P\left( g\left( X\right) \geq c\right) &=&P\left( \left\{ \omega \in \Omega
\ |\ g\left( X\right) \left( \omega \right) \geq c\right\} \right) \\
&=&P\left( \left\{ \omega \in \Omega \ |\ g\left( X\left( \omega \right)
\right) \geq c\right\} \right)
\end{eqnarray*}として定まりますが、先の条件が満たされる場合には、以下の関係\begin{equation*}
P\left( g\left( X\right) \geq c\right) \leq \frac{E\left( g\left( X\right)
\right) }{c}
\end{equation*}が成り立つことが保証されます。これもまたマルコフの不等式(Markov’s inequality)と呼ばれます。
\right)
\end{equation*}を定める確率変数\(g\left(X\right) :\Omega \rightarrow \mathbb{R} \)を定義する。ただし、\begin{equation*}\forall \omega \in \Omega :g\left( X\right) \left( \omega \right) \geq 0
\end{equation*}が成り立つとともに、期待値\(E\left( g\left( X\right) \right) \)が有限な実数として定まるものとする。このとき、\begin{equation*}\forall c>0:P\left( g\left( X\right) \geq c\right) \leq \frac{E\left(
g\left( X\right) \right) }{c}
\end{equation*}という関係が成り立つ。
マルコフの不等式の正確性
確率変数\(X\)の確率分布の全容を特定するのが困難な状況においても、期待値\(E\left( X\right) \)さえ明らかであれば、マルコフの不等式を用いることにより、その確率変数\(X\)がある値\(c\)以上の値をとる確率\(P\left( X\geq c\right) \)の上限\(\frac{E\left(X\right) }{c}\)を特定することはできます。つまり、\(X\)が\(c\)以上の値をとる真の確率\(P\left( X\geq c\right) \)を特定するのが困難な状況においても、期待値\(E\left( X\right) \)さえ明らかであれば、確率\(P\left( X\geq c\right) \)の真の値が収まる範囲を特定することはできるということです。言い換えると、\(X\)が\(c\)以上の値をとる真の確率\(P\left( X\geq c\right) \)が\(\frac{E\left( X\right) }{c}\)を超えることはありません。では、真の確率\(P\left(X\geq c\right) \)とマルコフの不等式が与える値\(\frac{E\left(X\right) }{c}\)はどの程度乖離しているのでしょうか。具体例を挙げます。
\end{equation*}であるものとします。ただし、\(k>0\)かつ\(\varepsilon >0\)です。確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{k} & \left( if\ x=k+\varepsilon \right) \\
1-\frac{1}{k} & \left( if\ x=0\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。期待値は、\begin{eqnarray*}
E\left( X\right) &=&\left( k+\varepsilon \right) \cdot f_{X}\left(
k+\varepsilon \right) +0\cdot f_{X}\left( 0\right) \\
&=&\left( k+\varepsilon \right) \cdot \frac{1}{k}+0\cdot \left( 1-\frac{1}{k}\right) \\
&=&\frac{k+\varepsilon }{k}
\end{eqnarray*}であるため、マルコフの不等式より、\begin{eqnarray*}
P\left( X\geq k\right) &\leq &\frac{E\left( X\right) }{k}\quad \because
\text{マルコフの不等式} \\
&=&\frac{k+\varepsilon }{k^{2}}\quad \because E\left( X\right) =\frac{k+\varepsilon }{k} \\
&=&\frac{1}{k}+\frac{\varepsilon }{k^{2}}
\end{eqnarray*}が成り立ちます。つまり、確率変数\(X\)の値が\(k\)以上である確率は\(\frac{1}{k}+\frac{\varepsilon }{k^{2}}\)以下であるはずです。一方、確率変数\(X\)の値が\(k\)以上である確率の真の値は、\begin{eqnarray*}P\left( X\geq k\right) &=&f_{X}\left( k+\varepsilon \right) \\
&=&\frac{1}{k}
\end{eqnarray*}ですが、\(k>0\)かつ\(\varepsilon \geq 0\)ゆえに、\begin{equation*}\frac{1}{k}\leq \frac{1}{k}+\frac{\varepsilon }{k^{2}}
\end{equation*}すなわち、\begin{equation*}
P\left( X\geq k\right) \leq \frac{1}{k}+\frac{\varepsilon }{k^{2}}
\end{equation*}であり、マルコフの不等式の正しさを確認できました。繰り返しになりますが、確率\(P\left( X\geq k\right) \)の真の値は\(\frac{1}{k}\)である一方、マルコフの不等式が与える確率\(P\left( X\geq k\right) \)の最大値は\(\frac{1}{k}+\frac{\varepsilon }{k^{2}}\)であるため、両者の誤差は、\begin{equation*}\left( \frac{1}{k}+\frac{\varepsilon }{k^{2}}\right) -\left( \frac{1}{k}\right) =\frac{\varepsilon }{k^{2}}
\end{equation*}となります。\begin{equation*}
\lim_{\varepsilon \rightarrow 0}\frac{\varepsilon }{k^{2}}=0
\end{equation*}であるため、\(\varepsilon \)を\(0\)に限りなく近づける場合、マルコフの不等式は実際の確率をピンポイントで正確に特定していることになります。
\end{equation*}であるものとします。確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{10} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。つまり、\(X\)は離散型の一様分布にしたがう確率変数です。期待値は、\begin{eqnarray*}E\left( X\right) &=&\sum_{x=1}^{10}\left[ x\cdot f_{X}\left( x\right) \right] \\
&=&\sum_{x=1}^{10}\frac{x}{10} \\
&=&\frac{11}{2}
\end{eqnarray*}であるため、マルコフの不等式より、確率変数\(X\)の値が\(8\)以上の確率について、\begin{eqnarray*}P\left( X\geq 8\right) &\leq &\frac{E\left( X\right) }{8}\quad \because
\text{マルコフの不等式} \\
&=&\frac{11}{16}\quad \because E\left( X\right) =\frac{11}{2}
\end{eqnarray*}が成り立ちます。つまり、確率変数\(X\)の値が\(8\)以上である確率は\(\frac{11}{16}\)以下であるはずです。一方、確率変数\(X\)の値が\(8\)以上である確率の真の値は、\begin{eqnarray*}P\left( X\geq 8\right) &=&f_{X}\left( 8\right) +f_{X}\left( 9\right)
+f_{X}\left( 10\right) \\
&=&\frac{1}{10}+\frac{1}{10}+\frac{1}{10} \\
&=&\frac{3}{10}
\end{eqnarray*}です。両者を比較すると、\begin{equation*}
\frac{3}{10}\leq \frac{11}{16}
\end{equation*}すなわち、\begin{equation*}
P\left( X\geq 8\right) \leq \frac{11}{16}
\end{equation*}であり、マルコフの不等式の正しさを確認できました。繰り返しになりますが、確率\(P\left( X\geq 8\right) \)の真の値は\(\frac{3}{10}\)である一方、マルコフの不等式が与える確率\(P\left( X\geq 8\right) \)の最大値は\(\frac{11}{16}\)であるため、両者の誤差は、\begin{equation*}\frac{11}{16}-\frac{3}{10}=\frac{31}{80}
\end{equation*}であり、両者の間には大きな開きがあります。一様分布のように確率変数がとり得る値が広い範囲に均等に分布している場合、マルコフの不等式が与える確率の範囲は実際の確率を特定する上であまり役に立ちません。マルコフの不等式は期待値だけを拠り所とした指標であるため、致し方ありません。
演習問題
\end{equation*}を満たすものとします。加えて、期待値\begin{equation*}
E\left( X\right) =\sum_{x\in X\left( \Omega \right) }\left[ x\cdot
f_{X}\left( x\right) \right] \end{equation*}は有限な実数として求まるものとします。以上の想定のもと、以下の確率\begin{equation*}
P\left( X\geq 2E\left( X\right) \right)
\end{equation*}の上界を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】