WIIS

不確実性下の意思決定

期待値最大化原理の妥当性(サンクトペテルブルクのパラドクス)

目次

Mailで保存
Xで共有

クジのもとでの結果の期待値

何らかの行動を選択した場合、実際に起こり得る結果として複数の候補が存在し、なおかつ、その中のどの結果が実際に起こるかが完全に予測できない状況、すなわちランダムネスが成立している状況を想定した上で、そのような状況において意思決定主体が直面する個々の選択肢をクジと呼ばれる概念として定式化しました。起こり得るすべての結果からなる集合\(X\)が有限集合や可算集合である場合、クジとは、それぞれの結果\(x\in X\)に対して、その結果が起こる確率\(L\left( x\right) \in \mathbb{R} \)を特定する関数\begin{equation*}L:X\rightarrow \mathbb{R} \end{equation*}として表現されます。一方、結果集合\(X\)が数直線\(\mathbb{R} \)上の区間などの非可算集合である場合、クジ\(L\)は確率密度関数\begin{equation*}f_{L}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として表現されます。

続いて問題になるのは、主体はどのような基準をもとにクジどうしを比較するか、という点です。古典的な考え方は、意思決定主体は期待値(expected value)を最大化するようなクジを選択する、というものです。そこで、以下では期待値の概念を定義するとともに、その欠点について解説します。

まずは、結果集合が有限集合であるとともに、個々の結果が数値である状況\begin{equation*}
X=\left\{ x_{1},\cdots ,x_{N}\right\} \subset \mathbb{R} \end{equation*}を想定します。クジ\(L:X\rightarrow \mathbb{R} \)のもとで個々の結果\(x_{n}\in X\)が起こる確率は\(L\left(x_{n}\right) \)であるため、これと結果\(x_{n}\)の積をとった上で、得られた積の総和をとれば、クジ\(L\)のもとでの結果の期待値(expected value)\begin{eqnarray*}E\left( L\right) &=&L\left( x_{1}\right) \cdot x_{1}+\cdots +L\left(
x_{N}\right) \cdot x_{N} \\
&=&\sum_{n=1}^{N}\left[ L\left( x_{n}\right) \cdot x_{n}\right] \end{eqnarray*}が得られます。仮定より結果\(x_{1},\cdots ,x_{N}\)は有限個の実数であるため、期待値もまた1つの実数として定まることに注意してください。

例(クジのもとでの結果の期待値)
ある人が「\(1000\)万円の資産をどのように運用すべきか」を検討している状況を想定します。以下の3つの行動\begin{eqnarray*}a_{1} &=&\text{国債を購入する} \\
a_{2} &=&\text{株に投資する} \\
a_{3} &=&\text{仮想通貨を購入する}
\end{eqnarray*}が選択肢として与えられているものとします。行動\(a_{1}\)を選択した場合には以下の1通りの結果\begin{equation*}1010\text{万円(利子として}10\text{万円を得る)}
\end{equation*}が起こり得るものとします。つまり、\begin{equation*}
X_{1}=\left\{ 1010\right\}
\end{equation*}です。行動\(a_{2}\)を選択した場合には以下の3通りの結果\begin{eqnarray*}&&1200\text{万円(株価が上昇し}200\text{万円を得る)} \\
&&1000\text{万円(株価はそのまま)} \\
&&800\text{万円(株価が下落し}200\text{万円を失う)}
\end{eqnarray*}が起こり得るものとします。つまり、\begin{equation*}
X_{2}=\left\{ 1200,1000,800\right\}
\end{equation*}です。行動\(a_{3}\)を選択した場合には以下の3通りの結果\begin{eqnarray*}&&2000\text{万円(暗号通貨が暴騰し}1000\text{万円を得る)} \\
&&1000\text{万円(暗号通貨の価格はそのまま)} \\
&&0\text{万円(暗号通貨が暴落し}1000\text{万円を失う)}
\end{eqnarray*}が起こり得るものとします。つまり、\begin{equation*}
X_{3}=\left\{ 2000,1000,0\right\}
\end{equation*}です。結果集合は、\begin{eqnarray*}
X &=&X_{1}\cup X_{2}\cup X_{3} \\
&=&\left\{ 2000,1200,1010,1000,800,0\right\}
\end{eqnarray*}となります。国債からは確実に利子を得られる場合、行動\(a_{1}\)にともなうクジは\(L_{1}:X\rightarrow \mathbb{R} \)は、\begin{equation*}L_{1}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=1010\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}となるため、このクジ\(L_{1}\)のもとで実現する結果の期待値は、\begin{eqnarray*}E\left( L_{1}\right) &=&1010\cdot L_{1}\left( 1010\right) \\
&=&1010\cdot 1 \\
&=&1010
\end{eqnarray*}です。株を購入した場合に株価の値上がり・そのまま・値下がりが等確率で起こるならば、行動\(a_{2}\)にともなうクジは\(L_{2}:X\rightarrow \mathbb{R} \)は、\begin{equation*}L_{2}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ x=1200,1000,800\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}となるため、このクジ\(L_{2}\)のもとで実現する結果の期待値は、\begin{eqnarray*}E\left( L_{2}\right) &=&1200\cdot L_{2}\left( 1200\right) +1000\cdot
L_{2}\left( 1000\right) +800\cdot L_{3}\left( 800\right) \\
&=&1200\cdot \frac{1}{3}+1000\cdot \frac{1}{3}+800\cdot \frac{1}{3} \\
&=&1000
\end{eqnarray*}です。暗号通貨を購入した場合に暗号通貨の値上がり・そのまま・値下がりが等確率で起こるならば、行動\(a_{3}\)にともなうクジは\(L_{3}:X\rightarrow \mathbb{R} \)は、\begin{equation*}L_{2}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ x=2000,1000,0\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}となるため、このクジ\(L_{3}\)のもとで実現する結果の期待値は、\begin{eqnarray*}E\left( L_{2}\right) &=&2000\cdot L_{3}\left( 2000\right) +1000\cdot
L_{3}\left( 1000\right) +0\cdot L_{3}\left( 0\right) \\
&=&2000\cdot \frac{1}{3}+1000\cdot \frac{1}{3}+0\cdot \frac{1}{3} \\
&=&1000
\end{eqnarray*}です。期待値を最大化するクジは\(L_{1}\)であるため、期待値を基準に意思決定をするのであれば\(L_{1}\)を選ぶことになります。

 

結果集合が可算集合である場合の期待値

結果集合が可算集合であるとともに、個々の結果が数値である状況\begin{equation*}
X=\left\{ x_{1},x_{2},\cdots \right\} \subset \mathbb{R} \end{equation*}を想定します。この場合のクジもまた、それぞれの結果\(x_{n}\in X\)に対して、それが選ばれる確率\(L\left( x_{n}\right) \in \mathbb{R} \)を特定する関数\begin{equation*}L:X\rightarrow \mathbb{R} \end{equation*}として表現されます。ただし、クジ\(L\)は以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall n\in \mathbb{N} :L\left( x_{n}\right) \geq 0 \\
&&\left( b\right) \ \sum_{n=1}^{+\infty }L\left( x_{n}\right) =1
\end{eqnarray*}を満たす必要があります。

以上の状況において、クジ\(L\)のもとで実現する結果の期待値は、\begin{eqnarray*}E\left( L\right) &=&L\left( x_{1}\right) \cdot x_{1}+L\left( x_{2}\right)
\cdot x_{2}+\cdots \\
&=&\sum_{n=1}^{\infty }\left[ L\left( x_{n}\right) \cdot x_{n}\right] \end{eqnarray*}と定まります。ただし、これは無限個の実数の和、すなわち無限級数であるため、値を具体的に特定するためには、部分和\begin{equation*}
s_{N}=\sum_{n=1}^{N}\left[ L\left( x_{n}\right) \cdot x_{n}\right] \end{equation*}を項とする数列\(\left\{s_{N}\right\} \)の極限をとります。つまり、結果集合\(X\)が可算集合である場合にクジ\(L\)のもとで実現する結果の期待値は、\begin{eqnarray*}E\left( L\right) &=&\lim_{n\rightarrow \infty }s_{N} \\
&=&\lim_{n\rightarrow \infty }\sum_{n=1}^{N}\left[ L\left( x_{n}\right)
\cdot x_{n}\right] \end{eqnarray*}と定義されるということです。

結果集合\(X\)が可算集合である場合、クジ\(L\)のもとでの結果の期待値\(E\left( L\right) \)は有限な実数として定まるとは限りません。

例(クジのもとでの結果の期待値)
結果集合が、\begin{equation*}
X=\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるものとします。クジ\(L:X\rightarrow \mathbb{R} \)はそれぞれの結果\(x\in X\)に対して、\begin{equation*}L\left( x\right) =\left( \frac{1}{2}\right) ^{x}
\end{equation*}を定めるものとします。このクジ\(L\)のもとでの結果の期待値は、\begin{equation*}E\left( L\right) =2
\end{equation*}です(演習問題)。

 

結果集合が非可算集合である場合の期待値

結果集合\(X\)が数直線\(\mathbb{R} \)上の区間であったり、もしくは互いに素な区間の和集合である場合などには、クジ\(L\)は確率密度関数\begin{equation*}f_{L}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として定義されます。つまり、クジ\(L\)のもとで結果\(x\in X\)が区間\(I\subset \mathbb{R} \)に属する確率が、\begin{equation*}\int_{I}f_{L}\left( x\right) dx
\end{equation*}として定まるということです。確率密度関数の定義より、クジ\(L\)に相当する関数\(f_{L}\)は以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \forall x\in \mathbb{R} :f_{L}\left( x\right) \geq 0 \\
&&\left( b\right) \ \int_{-\infty }^{+\infty }f_{L}\left( x\right) dx=1
\end{eqnarray*}を満たします。条件\(\left( a\right) \)は、\(f_{L}\)は非負の実数を値としてとり得る関数であること意味し、条件\(\left( b\right) \)は\(f_{L}\)を全区間上で積分すると\(1\)になることを意味します。

同様の状況において、クジ\(L\)を分布関数\begin{equation*}F_{L}:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として表現することもできます。つまり、クジ\(L\)のもとで結果が\(x\)以下の値をとる確率が、\begin{equation*}F_{L}\left( x\right) =\int_{-\infty }^{x}f_{L}\left( t\right) dt
\end{equation*}として定まるということです。特に、確率密度関数\(f_{L}\)が点\(x\in \mathbb{R} \)において連続である場合には、微分積分学の基本定理より、\begin{equation*}\frac{d}{dx}F_{L}\left( x\right) =f_{L}\left( x\right)
\end{equation*}が成り立ちます。

以上の状況において、クジ\(L\)のもとで実現する結果の期待値は、\begin{equation*}E\left( L\right) =\int_{-\infty }^{+\infty }xf_{L}\left( x\right) dx
\end{equation*}と定義されます。

結果集合\(X\)が非可算集合である場合にも、クジ\(L\)のもとでの結果の期待値\(E\left( L\right) \)は有限な実数として定まるとは限りません。

例(クジのもとでの結果の期待値)
結果集合が、\begin{equation*}
X=\mathbb{R} \end{equation*}であるものとします。クジ\(L\)に相当する確率密度関数\(f_{L}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{L}\left( x\right) =\left\{
\begin{array}{cl}
\frac{3}{2}x^{2}+x & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。このクジ\(L\)のもとでの結果の期待値は、\begin{equation*}E\left( L\right) =\frac{17}{24}
\end{equation*}です(演習問題)。

 

期待値最大化原理の妥当性

期待値を最大化するようなクジを選択するという仮説は妥当でしょうか。以下の例が示唆するように、この仮説は必ずしも妥当ではありません。

例(期待値最大化原理の妥当性)
確率\(\frac{1}{2}\)で\(1\)億円をもらえる一方で、確率\(\frac{1}{2}\)で賞金を全く得られないクジを引く権利をあなたが入手した状況を想定してください。ある金持ちがあなたに対して、そのクジを引く権利を\(4999\)万円で売ってくれないかと提案してきました。その提案に同意した場合、あなたは確実に\(4999\)万円を得られるものとします。あなたはクジを自分で引くべきでしょうか、それともクジを引く権利を売却すべきでしょうか。結果集合は、\begin{equation*}X=\left\{ 1\text{億},4999\text{万},0\right\}
\end{equation*}です。「自分でクジを引く」という選択肢は、以下のクジ\begin{eqnarray*}
L_{1} &=&\left( L_{1}\left( 1\text{億}\right) ,L_{1}\left( 4999\text{万}\right) ,L_{1}\left( 0\right) \right) \\
&=&\left( \frac{1}{2},0,\frac{1}{2}\right)
\end{eqnarray*}として表現されるため、その場合の結果の期待値は、\begin{eqnarray*}
E_{1}\left( x\right) &=&1\text{億}\times L_{1}\left( 1\text{億}\right) +4999\text{万}\times L_{1}\left( 4999\text{万}\right)
+0\times L_{1}\left( 0\right) \\
&=&1\text{億}\times \frac{1}{2}+4999\text{万}\times 0+0\times
\frac{1}{2} \\
&=&5000\text{万}
\end{eqnarray*}です。「クジを\(4999\)万円で売る」という選択肢は、以下のクジ\begin{eqnarray*}L_{2} &=&\left( L_{2}\left( 1\text{億}\right) ,L_{2}\left( 4999\text{万}\right) ,L_{2}\left( 0\right) \right) \\
&=&\left( 0,1,0\right)
\end{eqnarray*}として表現されるため、その場合の結果の期待値は、\begin{eqnarray*}
E_{2}\left( x\right) &=&1\text{億}\times L_{2}\left( 1\text{億}\right) +4999\text{万}\times L_{2}\left( 4999\text{万}\right)
+0\times L_{2}\left( 0\right) \\
&=&1\text{億}\times 0+4999\text{万}\times 1+0\times 0 \\
&=&4999\text{万}
\end{eqnarray*}です。したがって、期待値を最大化するのであれば、自分でクジを引いた方がよいということになります。ただし、多くの人にとって、これは合理的な選択ではありません。多くの人にとって、\(4999\)万円もらえるはずであったのに\(0\)円になってしまった場合に感じる絶望は、\(1\)億円もらえるチャンスがあったにも関わらず\(4999\)万円で妥協してしまった悔しさよりも大きいため、自分でクジを引かず、クジを引く権利を売却します。

この例が示唆するように、人は期待値を最大化する形で意思決定を行っているとは限りません。したがって、不確実性下での意思決定を正確に描写するためには、期待値とは異なる基準にもとづくモデルが必要です。具体的には、期待値を一般化した期待効用(expected utility)と呼ばれる概念にもとづいた意思決定モデルを採用することになるのですが、詳細は場を改めて解説します。

 

サンクトペテルブルクの逆説

そもそも、クジのもとで実現する結果の期待値は有限な実数として定まるとは限りません。以下の例より明らかです。

例(サンクトペテルブルクの逆説)
「1枚のコインを表が出るまで投げ続けた上で、\(n\)回目に表が出た場合には賞金\(2^{n}\)を獲得できる」というルールのギャンブルについて考えます。ただし、コインに歪みはなく、各回において\(\frac{1}{2}\)ずつの確率で表または裏が出るものとします。ギャンブルに参加しない場合の賞金は\(0\)です。ギャンブルに参加した上で、初回に表が出た場合の賞金は\(2^{1}=2\)であり、\(2\)回目に表が出た場合の賞金は\(2^{2}=4\)であり、\(3\)回目に表が出た場合の賞金は\(2^{3}=8\)です。以降についても同様に考えます。つまり、表が出た時点で終了であり、それまでに裏が連続で出続けるほど、より高額の賞金を獲得できます。このギャンブルの参加費用は\(x\)であるものとします。支払った参加費用は戻ってきません。得られるのは賞金のみです。参加費用\(x\)がいくらまでならば、このギャンブルに参加すべきでしょうか。賞金を結果とみなす場合、結果集合は、\begin{eqnarray*}X &=&\left\{ 0,2^{1},2^{2},2^{3},\cdots ,2^{n},\cdots \right\} \\
&=&\left\{ 0,2,4,8,\cdots ,2^{n},\cdots \right\}
\end{eqnarray*}となります。コインを投げ続けた場合に表が出る保証はないため(ただし、表が出ない確率は限りなく小さいです)、\(X\)は無限集合であることに注意してください。ギャンブルに参加した場合、\(n\)回目に表が出る確率は、\begin{equation*}\left( \frac{1}{2}\right) ^{n}=\frac{1}{2^{n}}
\end{equation*}であるため、「ギャンブルに参加する」という選択肢は以下のクジ\begin{eqnarray*}
L &=&\left( L\left( 0\right) ,L\left( 2\right) ,L\left( 4\right) ,L\left(
8\right) ,\cdots ,L\left( 2^{n}\right) ,\cdots \right) \\
&=&\left( 0,\frac{1}{2},\frac{1}{4},\frac{1}{8},\cdots ,\frac{1}{2^{n}},\cdots \right)
\end{eqnarray*}として表現されます。このクジ\(L\)のもとでの結果の期待値は、\begin{eqnarray*}E\left( x\right) &=&0\times L\left( 0\right) +2\times L\left( 2\right)
+4\times L\left( 4\right) +8\times L\left( 8\right) +\cdots +2^{n}\times
L\left( 2^{n}\right) +\cdots \\
&=&0+2\times \frac{1}{2}+4\times \frac{1}{4}+8\times \frac{1}{8}+\cdots
+2^{n}\times \frac{1}{2^{n}}+\cdots + \\
&=&1+1+1+\cdots +1+\cdots
\end{eqnarray*}という無限級数になります。その和は、\begin{eqnarray*}
E\left( x\right) &=&1+1+1+\cdots +1+\cdots \\
&=&\lim_{n\rightarrow +\infty }\sum_{k=1}^{n}1 \\
&=&\lim_{n\rightarrow +\infty }n \\
&=&+\infty
\end{eqnarray*}となります。したがって、期待値を基準にクジ\(L\)を評価するのであれば、その評価額は無限大であるため、このギャンブルへの参加費用\(x\)としていくらでも支払ってもよいということになります。ただし、多くの人にとって、このギャンブルの参加費用として膨大な金額を支払うことは合理的な選択ではありません。
例(サンクトペテルブルグの逆説)
サンクトペテルブルグの逆説が想定するギャンブルにおいて\(1\)億以上の賞金を獲得するためには最低でも何回連続で裏を出す必要があるでしょうか。裏を\(n\)回連続で出し、\(n+1\)回目に初めて表が出た場合に得る賞金は、\begin{equation*}2^{n+1}
\end{equation*}であるため、\begin{equation*}
2^{n+1}>100000000
\end{equation*}を満たす最小の\(n\in \mathbb{N} \)を特定する必要がありますが、それは\(26\)です(演習問題)。また、同様のギャンブルにおいて\(1\)億以上の賞金を得られる確率は\(\frac{1}{33554432}\)です(演習問題)。つまり、その確率は3千万分の1以下です。

これはスイスの物理学者ダニエル・ベルヌーイ(Daniel Bernoulli)が1738年に発表した問題です。ベルヌーイがこの問題を発表した際にサンクトペテルブルクに滞在していたことから、この問題はサンクトペテルブルクのパラドクス(St. Petersburg Paradox)と呼ばれています。あくまでもこの問題の題材は先述のギャンブルであり、問題そのものはサンクトペテルブルクという都市とは関係ありません。

いずれにせよ、先の問題と同様に、サンクトペテルブルクのパラドクスもまた、人は期待値を最大化する形で意思決定を行っているとは限らないことを示唆しています。期待値ではなく期待効用にもとづく意思決定モデルを利用すれば、サンクトペテルブルクのパラドクスを整合的に説明できます。詳細は後述します。

 

演習問題

問題(クジのもとでの結果の期待値)
結果集合が、\begin{equation*}
X=\left\{ 20,60,90\right\}
\end{equation*}であるものとします。クジ\(L:X\rightarrow \mathbb{R} \)は以下の条件\begin{eqnarray*}L &=&\left( L\left( 20\right) ,L\left( 60\right) ,L\left( 90\right) \right)
\\
&=&\left( \frac{6}{10},\frac{3}{10},\frac{1}{10}\right)
\end{eqnarray*}を満たすものとします。このクジ\(L\)のもとでの結果の期待値を特定してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(クジのもとでの結果の期待値)
結果集合が、\begin{equation*}
X=\left\{ 1,2,3,\cdots \right\}
\end{equation*}であるものとします。クジ\(L:X\rightarrow \mathbb{R} \)はそれぞれの結果\(x\in X\)に対して、\begin{equation*}L\left( x\right) =\left( \frac{1}{2}\right) ^{x}
\end{equation*}を定めるものとします。このクジ\(L\)のもとでの結果の期待値\(E\left(L\right) \)を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(クジのもとでの結果の期待値)
結果集合が、\begin{equation*}
X=\mathbb{R} \end{equation*}であるものとします。クジ\(L\)に相当する確率密度関数\(f_{L}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{L}\left( x\right) =\left\{
\begin{array}{cl}
\frac{3}{2}x^{2}+x & \left( if\ 0\leq x\leq 1\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。このクジ\(L\)のもとでの結果の期待値\(E\left(L\right) \)を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(サンクトペテルブルクの逆説)
サンクトペテルブルグの逆説が想定するギャンブルにおいて\(1\)億以上の賞金を獲得するためには最低でも何回連続で裏を出す必要があるでしょうか。また、同様のギャンブルにおいて\(1\)億以上の賞金が得られる確率を求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録

不確実性下の意思決定