複数均衡問題に対する説明体系の種類
問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。ゲーム\(G\)に複数のナッシュ均衡が存在するとともに、それらがいずれも支配戦略均衡や支配される戦略の逐次消去による解ではない場合、プレイヤーたちがその中のどれを実際にプレーすることになるかを合理性や警戒心の仮定、もしくはそれらが共有知識であることを根拠として説明できるとは限りません。
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & R & L \\ \hline
R & 1^{\ast },1^{\ast } & 0,0 \\ \hline
L & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$
\(\left( R,R\right) \)と\(\left( L,L\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。このゲーム\(G\)において任意のプレイヤーは支配戦略を持たないため、ナッシュ均衡である\(\left(R,R\right) \)と\(\left( L,L\right) \)はともに支配戦略均衡ではなく、支配される戦略の逐次消去の解でもありません。したがって、\(\left( R,R\right) \)と\(\left( L,L\right) \)のどちらが実際にプレーされることになるかを、プレイヤーの合理性や警戒心の仮定、もしくはそれらが共有知識であるという仮定を根拠に説明できるとは限りません。
このような事情を踏まえると、複数均衡の問題に対しては、特定のナッシュ均衡がプレーされる根拠を与える何らかの説明体系が必要です。複数均衡問題の説明体系としては、大きく分けて2種類あります。1つ目はゲームの利得構造から説明する方法であり、2つ目はゲームに記述されていない要素、特にプレイヤーの心理的な側面から説明する方法です。今回は前者の立場から複数均衡の問題について考えます。
2人ゲームにおけるリスク支配
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、\(G\)には複数の純粋戦略ナッシュ均衡が存在するものとします。その上で、異なる2つの純粋戦略ナッシュ均衡\begin{eqnarray*}s_{I} &=&\left( s_{1},s_{2}\right) \in S_{I} \\
s_{I}^{\prime } &=&\left( s_{1}^{\prime },s_{2}^{\prime }\right) \in S_{I}
\end{eqnarray*}をそれぞれ任意に選んだ上で、プレイヤーたちがそれぞれどちらか一方を選択しようとしている状況を想定します。ただし、それぞれのプレイヤーは、相手がどちらの戦略を選ぶか確率を主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。
それぞれのプレイヤー\(i\in I\)は相手プレイヤー\(j\in I\backslash \left\{ i\right\} \)が\(s_{j}\)を選ぶ確率を\(f_{i}\left( s_{j}\right) \)と予想しているものとします。\(0\leq f_{i}\left( s_{j}\right) \leq 1\)です。これは同時に、相手が\(s_{j}^{\prime }\)を選ぶ確率を\(f_{i}\left( s_{j}^{\prime }\right) =1-f_{i}\left(s_{j}\right) \)と予想していることを意味します。以上の予想を踏まえた場合、プレイヤー\(i\)が\(s_{i}\)を選んだときに直面する利得の期待値は、\begin{equation}u_{i}\left( s_{i},s_{j}\right) \cdot f_{i}\left( s_{j}\right) +u_{i}\left(
s_{i},s_{j}^{\prime }\right) \cdot \left[ 1-f_{i}\left( s_{j}\right) \right]
\quad \cdots (1)
\end{equation}である一方で、\(s_{i}^{\prime }\)を選んだときに直面する利得の期待値は、\begin{equation}u_{i}\left( s_{i}^{\prime },s_{j}\right) \cdot f_{i}\left( s_{j}\right)
+u_{i}\left( s_{i}^{\prime },s_{j}^{\prime }\right) \cdot \left[
1-f_{i}\left( s_{j}\right) \right] \quad \cdots (2)
\end{equation}となります。\(\left( 1\right) \)が\(\left( 2\right) \)以上になるために確率\(f_{i}\left( s_{j}\right) \)が満たすべき条件を導出すると、\begin{equation*}f_{i}\left( s_{j}\right) \geq \frac{u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) }{u_{i}\left( s_{i},s_{j}\right) +u_{i}\left( s_{i}^{\prime },s_{j}^{\prime
}\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) -u_{i}\left(
s_{i}^{\prime },s_{j}\right) }
\end{equation*}となります。右辺を、\begin{equation}
\rho _{i}\left( s_{j}\right) =\frac{u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) }{u_{i}\left( s_{i},s_{j}\right) +u_{i}\left( s_{i}^{\prime },s_{j}^{\prime
}\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) -u_{i}\left(
s_{i}^{\prime },s_{j}\right) } \quad \cdots (3)
\end{equation}とおいた上で、これをプレイヤー\(i\)のリスク係数(risk parameter)と呼ぶこととします。ただし、\begin{equation*}f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \Leftrightarrow
\left( 1\right) >\left( 2\right)
\end{equation*}すなわち、\begin{equation*}
f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \Leftrightarrow
\text{プレイヤー}i\text{にとって}s_{i}\text{は}s_{i}^{\prime }\text{以上に望ましい}
\end{equation*}という関係が成り立つことに注意してください。\(\left( 3\right) \)から明らかであるように、リスク係数\(\rho _{i}\left( s_{j}\right) \)の水準はプレイヤーたちの利得関数のみから決定されます。一方、プレイヤー\(i\)が予想\(f_{i}\left( s_{j}\right) \)をランダムに決定するのであれば、すなわち相手が\(s_{j}\)を選ぶ確率がランダムに決まるものとみなすのであれば、\(f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \)が成り立つ確率、すなわちプレイヤー\(i\)にとって\(s_{i}\)が\(s_{i}^{\prime }\)以上に望ましい確率は\(1-\rho _{i}\left(s_{j}\right) \)であり、逆に、\(f_{i}\left( s_{j}\right) <\rho _{i}\left( s_{j}\right) \)が成り立つ確率、すなわちプレイヤー\(i\)にとって\(s_{i}^{\prime }\)が\(s_{i}\)よりも望ましい確率は\(\rho _{i}\left(s_{j}\right) \)になります。つまり、プレイヤー\(i\)がリスクを勘案しながら\(s_{i}\)と\(s_{i}^{\prime }\)のどちらを選ぶべきか考察する場合、その根拠の確かさを確率を用いて表現した指標がリスク係数\(\rho _{i}\left( s_{j}\right) \)であるということです。具体的には、プレイヤー\(i\)が\(s_{i}\)を選ぶべき根拠の確かさが\(1-\rho_{i}\left( s_{j}\right) \)の大きさとして、\(s_{i}^{\prime }\)を選ぶべき根拠の確かさが\(\rho _{i}\left(s_{j}\right) \)の大きさとしてそれぞれ表現されます。
完備情報の静学ゲームではプレイヤーたちの利得関数が共有知識であるため、プレイヤーたちのリスク係数\(\rho _{i}\left( s_{j}\right) ,p_{j}\left(s_{i}\right) \)もまた共有知識となります。プレイヤーたちはお互いのリスク係数\(\rho _{i}\left( s_{j}\right),p_{j}\left( s_{i}\right) \)を観察した上で、2つのナッシュ均衡\(s_{I},s_{I}^{\prime }\)のどちらをプレーすべきか考察する状況を想定します。仮に、\begin{equation}1-\rho _{i}\left( s_{j}\right) >\rho _{j}\left( s_{i}\right) \quad \cdots (1)
\end{equation}が成り立つ場合、リスク係数に関する先の議論より、プレイヤー\(i\)が\(s_{i}\)を選ぶべき根拠の確かさ\(1-\rho _{i}\left(s_{j}\right) \)が、プレイヤー\(j\)が\(s_{j}^{\prime }\)を選ぶべき根拠の確かさ\(\rho _{j}\left( s_{i}\right) \)よりも強固であることが客観的に明らかであるため、プレイヤー\(i\)は自身の根拠にもとづいて\(s_{i}\)をプレーする一方で、プレイヤー\(j\)は相手にあわせて\(s_{j}\)をプレーし、その結果、ナッシュ均衡\(s_{I}\)が実現することが予想されます。そこで、条件\(\left( 1\right) \)が成り立つ場合、\(s_{I}\)は\(s_{I}^{\prime }\)をリスク支配する(risk dominate)と言います。同じことを、\(s_{I}^{\prime }\)は\(s_{I}\)によってリスク支配される(risk dominated)と言うこともできます。リスク支配の定義では、ナッシュ均衡どうしの比較が問題になっていることに注意してください。
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 99^{\ast },49^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },51^{\ast } \\ \hline
\end{array}$$
\(\left( U,L\right) \)と\(\left( D,R\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。プレイヤー\(1\)のリスク係数\(\rho _{1}\left(L\right) \)は、\begin{equation*}99\cdot \rho _{1}\left( L\right) +0\cdot \left[ 1-\rho _{1}\left( L\right) \right] =0\cdot \rho _{1}\left( L\right) +1\cdot \left[ 1-\rho _{1}\left(
L\right) \right]
\end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{1}\left( L\right) =\frac{1}{100} \quad \cdots (1)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{1}\left( R\right) =1-\rho _{1}\left( L\right) =\frac{99}{100} \quad \cdots (2)
\end{equation}となります。一方、プレイヤー\(2\)のリスク係数\(\rho _{2}\left( U\right) \)は、\begin{equation*}49\cdot \rho _{2}\left( U\right) +0\cdot \left[ 1-\rho _{2}\left( U\right) \right] =0\cdot \rho _{2}\left( U\right) +51\cdot \left[ 1-\rho _{2}\left(
U\right) \right]
\end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{2}\left( U\right) =\frac{51}{100} \quad \cdots (3)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{2}\left( D\right) =1-\rho _{2}\left( U\right) =\frac{49}{100} \quad \cdots (4)
\end{equation}となります。\(\left( 1\right) ,\left(3\right) \)を踏まえると、\begin{eqnarray*}1-\rho _{1}\left( L\right) &=&1-\frac{1}{100}\quad \because \left( 1\right)
\\
&=&\frac{99}{100} \\
&>&\frac{51}{100} \\
&=&\rho _{2}\left( U\right) \quad \because \left( 2\right)
\end{eqnarray*}が成り立つため、\(\left(U,L\right) \)は\(\left( D,R\right) \)をリスク支配します。一方、\(\left( 2\right) ,\left( 4\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( R\right) >\rho _{2}\left( D\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( U,L\right) \)をリスク支配しません。
戦略型ゲーム\(G\)に複数の純粋戦略ナッシュ均衡が存在する場合でも、それらの間にリスク支配関係は成立するとは限りません。以下の例より明らかです。
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 1^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$
\(\left( U,L\right) \)と\(\left( D,R\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。プレイヤー\(1\)のリスク係数\(\rho _{1}\left(L\right) \)は、\begin{equation*}1\cdot \rho _{1}\left( L\right) +0\cdot \left[ 1-\rho _{1}\left( L\right) \right] =0\cdot \rho _{1}\left( L\right) +1\cdot \left[ 1-\rho _{1}\left(
L\right) \right]
\end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{1}\left( L\right) =\frac{1}{2} \quad \cdots (1)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{1}\left( R\right) =1-\rho _{1}\left( L\right) =\frac{1}{2} \quad \cdots (2)
\end{equation}となります。一方、プレイヤー\(2\)のリスク係数\(\rho _{2}\left( U\right) \)は、\begin{equation*}1\cdot \rho _{2}\left( U\right) +0\cdot \left[ 1-\rho _{2}\left( U\right) \right] =0\cdot \rho _{2}\left( U\right) +1\cdot \left[ 1-\rho _{2}\left(
U\right) \right]
\end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{2}\left( U\right) =\frac{1}{2} \quad \cdots (3)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{2}\left( D\right) =1-\rho _{2}\left( U\right) =\frac{1}{2} \quad \cdots (4)
\end{equation}となります。\(\left( 1\right) ,\left(3\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( L\right) >\rho _{2}\left( U\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( R,L\right) \)をリスク支配しません。一方、\(\left( 2\right) ,\left( 4\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( R\right) >\rho _{2}\left( D\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( U,L\right) \)をリスク支配しません。
離脱損失とリスク支配
リスク係数の定義を踏まえると、リスク支配を以下のように表現することもできます。
},s_{j}\right) \right] \left[ u_{j}\left( s_{j},s_{i}\right) -u_{j}\left(
s_{j}^{\prime },s_{i}\right) \right] >\left[ u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) \right] \left[ u_{j}\left( s_{j}^{\prime },s_{i}^{\prime }\right) -u_{j}\left(
s_{j},s_{i}^{\prime }\right) \right] \end{equation*}が成り立つことと、\(s_{I}\)が\(s_{I}^{\prime }\)をリスク支配することは必要十分である。
戦略ゲーム\(G\)において、プレイヤー\(i,j\)が異なる2つの純粋戦略ナッシュ均衡\(s_{I},s_{I}^{\prime }\in S_{I}\)のどちらをプレーすべきか考察している状況を想定します。本来、\(s_{I}\)をプレーすべきところをプレイヤー\(i\)だけが読み間違えて\(s_{i}\)ではなく\(s_{i}^{\prime }\)を選んでしまった場合、プレイヤー\(i\)に課される機会費用は、\begin{equation*}u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime },s_{j}\right)
\end{equation*}となります。これをプレイヤー\(i\)にとっての\(s_{I}\)からの離脱損失(deriation loss)と呼びます。同様に、プレイヤー\(j\)にとっての\(s_{I}\)からの離脱損失は、\begin{equation*}u_{j}\left( s_{j},s_{i}\right) -u_{j}\left( s_{j}^{\prime },s_{i}\right)
\end{equation*}となります。その上で、両者の\(s_{I}\)からの離脱損失の積\begin{equation*}\left[ u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime
},s_{j}\right) \right] \left[ u_{j}\left( s_{j},s_{i}\right) -u_{j}\left(
s_{j}^{\prime },s_{i}\right) \right]
\end{equation*}を\(s_{I}\)のナッシュ積(Nash product)と呼びます。同様に考えると、もう一方のナッシュ均衡\(s_{I}^{\prime }\)のナッシュ積は、\begin{equation*}\left[ u_{i}\left( s_{i}^{\prime },s_{j}^{\prime }\right) -u_{i}\left(
s_{i},s_{j}^{\prime }\right) \right] \left[ u_{j}\left( s_{j}^{\prime
},s_{i}^{\prime }\right) -u_{j}\left( s_{j},s_{i}^{\prime }\right) \right]
\end{equation*}となります。先の命題より、\(s_{I}\)が\(s_{I}^{\prime }\)をリスク支配することとは、\(s_{I}\)のナッシュ積が\(s_{I}^{\prime }\)のナッシュ積よりも大きいことを意味します。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】