教材一覧
教材一覧
教材検索

不確実性下の意思決定

期待値最大化原理の妥当性

目次

Twitter
Mailで保存

結果の期待値

ある行動を選択した場合、実際に起こり得る結果として複数の候補が存在し、なおかつ、その中のどの結果が実際に起こるかが完全に予測できない状況、すなわちランダムネスが成立している状況を想定した上で、そのような状況において意思決定主体が直面する選択肢をクジと呼ばれる概念として定式化しました。続いて問題になるのは、主体はどのような基準をもとにクジどうしを比較するか、という点です。古典的な考え方は、意思決定主体は期待値(expected value)を最大化するようなクジを選択する、というものです。そこで、以下では期待値の概念を定義するとともに、その欠点について解説します。

結果集合\(X\)が有限集合である場合、その要素を明示的に表現する形で、\begin{equation*}X=\left\{ x_{1},\cdots ,x_{N}\right\}
\end{equation*}と表記します。ただし、個々の結果\(x_{1},\cdots ,x_{N}\)はいずれも実数であるものとします。クジ\(L:X\rightarrow \mathbb{R} \)とは、それぞれの結果\(x_{n}\in X\)に対して、その結果が選ばれる確率\begin{equation*}L\left( x_{n}\right) \in \mathbb{R} \end{equation*}を特定する確率関数です。これを以下のようなベクトル\begin{equation*}
L=\left( L\left( x_{1}\right) ,\cdots ,L\left( x_{N}\right) \right) \in \mathbb{R} ^{N}
\end{equation*}と同一視できます。クジ\(L\)のもとで実現する結果の期待値(expected value)は、\begin{eqnarray*}E\left( x\right) &=&x_{1}L\left( x_{1}\right) +\cdots +x_{N}L\left(
x_{N}\right) \\
&=&\sum_{n=1}^{N}\left[ x_{n}L\left( x_{n}\right) \right] \end{eqnarray*}と定義される指標です。つまり、結果に相当する値\(x_{n}\)と、クジ\(L\)のもとで結果\(x_{n}\)が選ばれる確率\(L\left( x_{n}\right) \)の積をそれぞれとった上で、得られた積の総和をとれば期待値になります。仮定より結果\(x_{1},\cdots ,x_{N}\)はいずれも実数であるため、期待値もまた1つの実数として定まることに注意してください。

例(結果の期待値)
ある人が「\(1000\)万円の資産をどのように運用すべきか」を検討している状況を想定します。以下の3つの行動\begin{eqnarray*}a_{1} &=&\text{国債を購入する} \\
a_{2} &=&\text{株に投資する} \\
a_{3} &=&\text{仮想通貨を購入する}
\end{eqnarray*}が選択肢として与えられているものとします。行動\(a_{1}\)を選択した場合には以下の1通りの結果\begin{equation*}1010\text{万円(利子として}10\text{万円を得る)}
\end{equation*}が起こり得るものとします。つまり、\begin{equation*}
X_{1}=\left\{ 1010\right\}
\end{equation*}です。行動\(a_{2}\)を選択した場合には以下の3通りの結果\begin{eqnarray*}&&1200\text{万円(株価が上昇し}200\text{万円を得る)} \\
&&1000\text{万円(株価はそのまま)} \\
&&800\text{万円(株価が下落し}200\text{万円を失う)}
\end{eqnarray*}が起こり得るものとします。つまり、\begin{equation*}
X_{2}=\left\{ 1200,1000,800\right\}
\end{equation*}です。行動\(a_{3}\)を選択した場合には以下の3通りの結果\begin{eqnarray*}&&2000\text{万円(暗号通貨が暴騰し}1000\text{万円を得る)} \\
&&1000\text{万円(暗号通貨の価格はそのまま)} \\
&&0\text{万円(暗号通貨が暴落し}1000\text{万円を失う)}
\end{eqnarray*}が起こり得るものとします。つまり、\begin{equation*}
X_{3}=\left\{ 2000,1000,0\right\}
\end{equation*}です。結果集合は、\begin{eqnarray*}
X &=&X_{1}\cup X_{2}\cup X_{3} \\
&=&\left\{ 2000,1200,1010,1000,800,0\right\}
\end{eqnarray*}となります。国債からは確実に利子を得られる場合、行動\(a_{1}\)にともなうクジは\(L_{1}:X\rightarrow \mathbb{R} \)は、\begin{equation*}L_{1}\left( x\right) =\left\{
\begin{array}{cl}
1 & \left( if\ x=1010\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}となるため、このクジ\(L_{1}\)のもとで実現する結果の期待値は、\begin{eqnarray*}E_{1}\left( x\right) &=&1010\cdot L_{1}\left( 1010\right) \\
&=&1010\cdot 1 \\
&=&1010
\end{eqnarray*}です。株を購入した場合に株価の値上がり・そのまま・値下がりが等確率で起こるならば、行動\(a_{2}\)にともなうクジは\(L_{2}:X\rightarrow \mathbb{R} \)は、\begin{equation*}L_{2}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ x=1200,1000,800\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}となるため、このクジ\(L_{2}\)のもとで実現する結果の期待値は、\begin{eqnarray*}E_{2}\left( x\right) &=&1200\cdot L_{2}\left( 1200\right) +1000\cdot
L_{2}\left( 1000\right) +800\cdot L_{3}\left( 800\right) \\
&=&1200\cdot \frac{1}{3}+1000\cdot \frac{1}{3}+800\cdot \frac{1}{3} \\
&=&1000
\end{eqnarray*}です。暗号通貨を購入した場合に暗号通貨の値上がり・そのまま・値下がりが等確率で起こるならば、行動\(a_{3}\)にともなうクジは\(L_{3}:X\rightarrow \mathbb{R} \)は、\begin{equation*}L_{2}\left( x\right) =\left\{
\begin{array}{cl}
\frac{1}{3} & \left( if\ x=2000,1000,0\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}となるため、このクジ\(L_{3}\)のもとで実現する結果の期待値は、\begin{eqnarray*}E_{3}\left( x\right) &=&2000\cdot L_{3}\left( 2000\right) +1000\cdot
L_{3}\left( 1000\right) +0\cdot L_{3}\left( 0\right) \\
&=&2000\cdot \frac{1}{3}+1000\cdot \frac{1}{3}+0\cdot \frac{1}{3} \\
&=&1000
\end{eqnarray*}です。期待値を最大化するクジは\(L_{1}\)であるため、期待値を基準に意思決定をするのであれば\(L_{1}\)を選ぶことになります。

 

結果集合が可算集合である場合の期待値

結果集合が可算集合\begin{equation*}
X=\left\{ x_{1},x_{2},\cdots \right\}
\end{equation*}である場合のクジは結果集合\(X\)上の確率関数\begin{equation*}L:X\rightarrow \mathbb{R} \end{equation*}として定義されます。つまり、クジ\(L\)のもとで結果\(x_{n}\in X\)が選ばれる確率は、\begin{equation*}L\left( x_{n}\right) \in \mathbb{R} \end{equation*}です。この場合のクジは以下の2つの条件\begin{eqnarray*}
&&\left( a\right) \ \forall n\in \mathbb{N} :L\left( x_{n}\right) \geq 0 \\
&&\left( b\right) \ \sum_{n=1}^{+\infty }L\left( x_{n}\right) =1
\end{eqnarray*}を満たします。クジ\(L\)のもとで実現する結果の期待値は、\begin{eqnarray*}E\left( x\right) &=&x_{1}L\left( x_{1}\right) +x_{2}L\left( x_{2}\right)
+\cdots \\
&=&\sum_{n=1}^{\infty }\left[ x_{n}L\left( x_{n}\right) \right] \end{eqnarray*}と定義されます。ただし、これは部分和\begin{equation*}
s_{n}=\sum_{v=1}^{n}\left[ x_{v}L\left( x_{v}\right) \right] \end{equation*}を項とする数列\(\left\{s_{n}\right\} \)の極限として定義されます。つまり、この場合の期待値を正確に表現すると、\begin{equation*}E\left( x\right) =\lim_{n\rightarrow \infty }s_{n}=\lim_{n\rightarrow \infty
}\sum_{v=1}^{n}\left[ x_{v}L\left( x_{v}\right) \right] \end{equation*}となります。

 

結果集合が非可算集合である場合の期待値

結果集合\(X\)が数直線\(\mathbb{R} \)上の区間であったり、もしくは互いに素な区間の和集合である場合などには、クジは確率密度関数\begin{equation*}L:\mathbb{R} \rightarrow \mathbb{R} \end{equation*}として定義されます。つまり、クジ\(L\)のもとで結果\(x\in X\)が区間\(I\subset \mathbb{R} \)に属する確率が、\begin{equation*}\int_{I}L\left( x\right) dx
\end{equation*}として定まるということです。確率密度関数の定義より、この場合のクジは以下の2つの条件\begin{eqnarray*}
&&\left( a\right) \ \forall x\in \mathbb{R} :L\left( x\right) \geq 0 \\
&&\left( b\right) \ \int_{-\infty }^{+\infty }L\left( x\right) dx=1
\end{eqnarray*}を満たします。クジ\(L\)のもとで実現する結果の期待値は、\begin{equation*}E\left( x\right) =\int_{-\infty }^{+\infty }xL\left( x\right) dx
\end{equation*}と定義されます。

 

期待値最大化原理の妥当性

意思決定主体は期待値を最大化するようなクジを選択するという仮定は妥当でしょうか。以下の例が示唆するように、この仮定は必ずしも妥当ではありません。

例(期待値最大化原理の妥当性)
確率\(\frac{1}{2}\)で\(1\)億円をもらえる一方で、確率\(\frac{1}{2}\)で賞金を全く得られないクジを引く権利をあなたが入手した状況を想定してください。ある金持ちがあなたに対して、そのクジを引く権利を\(4999\)万円で売ってくれないかと提案してきました。その提案に同意した場合、あなたは確実に\(4999\)万円を得られるものとします。あなたはクジを自分で引くべきでしょうか、それともクジを引く権利を売るべきでしょうか。結果集合は、\begin{equation*}X=\left\{ 1\text{億},4999\text{万},0\right\}
\end{equation*}です。「自分でクジを引く」という選択肢は、以下のクジ\begin{eqnarray*}
L_{1} &=&\left( L_{1}\left( 1\text{億}\right) ,L_{1}\left( 4999\text{万}\right) ,L_{1}\left( 0\right) \right) \\
&=&\left( \frac{1}{2},0,\frac{1}{2}\right)
\end{eqnarray*}として表現されるため、その場合の結果の期待値は、\begin{eqnarray*}
E_{1}\left( x\right) &=&1\text{億}\times L_{1}\left( 1\text{億}\right) +4999\text{万}\times L_{1}\left( 4999\text{万}\right)
+0\times L_{1}\left( 0\right) \\
&=&1\text{億}\times \frac{1}{2}+4999\text{万}\times 0+0\times
\frac{1}{2} \\
&=&5000\text{万}
\end{eqnarray*}です。「クジを\(4999\)万円で売る」という選択肢は、以下のクジ\begin{eqnarray*}L_{2} &=&\left( L_{2}\left( 1\text{億}\right) ,L_{2}\left( 4999\text{万}\right) ,L_{2}\left( 0\right) \right) \\
&=&\left( 0,1,0\right)
\end{eqnarray*}として表現されるため、その場合の結果の期待値は、\begin{eqnarray*}
E_{2}\left( x\right) &=&1\text{億}\times L_{2}\left( 1\text{億}\right) +4999\text{万}\times L_{2}\left( 4999\text{万}\right)
+0\times L_{2}\left( 0\right) \\
&=&1\text{億}\times 0+4999\text{万}\times 1+0\times 0 \\
&=&4999\text{万}
\end{eqnarray*}です。したがって、期待値を最大化するのであれば、自分でクジを引いた方がよいということになります。ただし、多くの人にとって、これは合理的な選択肢ではありません。多くの人にとって、\(4999\)万円もらえるはずであったのに\(0\)円になってしまった場合に感じる絶望は、\(1\)億円もらえるチャンスがあったにも関わらず\(4999\)万円で妥協してしまった悔しさよりも大きいため、自分でクジを引かず、クジを引く権利を売却します。
Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

複合クジと結果主義の仮定

リスクが存在する状況における選択肢をクジと呼ばれる概念として表現しましたが、何らかの確率分布にもとづいてクジをランダムに選ぶことも考えられるため、そのような意思決定を複合クジと呼ばれる概念として表現します。

離散型確率変数の期待値

確率変数がとり得るそれぞれの値に対して、その値が実現する確率との積をとった上で、得られた積の総和をとると期待値と呼ばれる指標が得られます。

離散型の一様分布

離散型の確率変数がすべての値を等しい確率でとる場合、そのような確率変数は離散型の一様分布にしたがうと言います。離散型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型確率変数の分散と標準偏差

離散型の確率変数がとり得るそれぞれの値に対して、その値と期待値の差の平方をとった上で、得られた平方の総和をとると分散と呼ばれる指標が得られます。分散の正の平方根を標準偏差と呼びます。

離散型確率変数の中央化・標準化・正規化

期待値が0になるように確率変数を変換する操作を中央化と呼び、期待値が0で分散が1になるように確率変数を変換する操作を標準化と呼び、確率変数がとり得る値の範囲が0以上1以下になるように確率変数を変換する操作を正規化と呼びます。

不確実性を評価する選好関係

リスクが存在する状況における意思決定は、その人が持つ不確実性に対する好みの体系によって左右されます。そこで、そのような好みをクジどうしを比較する選好関係として定式化します。

不確実性を評価する効用関数

リスクが存在する状況において、意思決定主体がクジどうしを比較する選好を表現する効用関数が存在する場合には、クジの間の相対的な望ましさを、実数の大小関係として表現することができます。

期待効用関数の定義とその性質

リスクが存在する状況において、意思決定主体がクジどうしを比較する選好を表現する効用関数が線型性と呼ばれる性質を満たす場合、そのような効用関数を期待効用関数と呼びます。通常の効用関数とは異なり、期待効用関数は一定の基数性を満たします。

不確実性を評価する選好関係の完備性

2つのクジを任意に選んだとき、意思決定主体が一方を他方以上に好むか、もしくは両者を同じ程度望ましいものと考えている場合には、主体の選好関係は完備性を満たすと言います。

不確実性を評価する選好関係の推移性

不確実性に直面する意思決定主体がクジどうしを比較する選好が循環しないことを保証するために、選好関係に対して推移性と呼ばれる性質を要求します。選好関係を表す効用関数が存在する場合、その選好は推移性を満たします。

不確実性を評価する選好関係の連続性

不確実性に直面する意思決定主体がクジどうしを比較する選好が連続的に変化することを保証するために、選好関係に対して連続性と呼ばれる性質を要求します。選好関係を表す連続な効用関数や期待効用関数が存在する場合、その選好は連続性を満たします。

連続型の一様分布

連続型の確率変数の確率分布を記述する確率密度関数が定数関数である場合、その確率変数は連続型の一様分布にしたがうと言います。連続型一様分布にしたがう確率変数を定義するとともに、その期待値と分散を求めます。

離散型同時確率変数の期待値

離散型の同時確率変数の期待値を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の期待値を求める方法を解説します。また、独立な確率変数の積の期待値は個々の確率変数の期待値の積と一致することを示します。

連続型確率変数の期待値

連続型の確率変数の値と確率密度関数の値の積を全区間上で積分することにより得られる値を確率変数の期待値と呼びます。期待値は確率変数の実現値の見込みの値を表す指標です。

連続型同時確率変数の期待値

連続型の同時確率変数の期待値を定義するとともに、同時確率変数と2変数関数の合成関数として定義される確率変数の期待値を求める方法を解説します。また、独立な確率変数の積の期待値は個々の確率変数の期待値の積と一致することを示します。