複数均衡問題と利得支配

複数均衡問題に対する説明体系の種類

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム$G$として表現されているものとします。ゲーム$G$に複数のナッシュ均衡が存在するとともに、それらがいずれも支配戦略均衡や支配される戦略の逐次消去による解ではない場合、プレイヤーたちがその中のどれを実際にプレーすることになるかを合理性や警戒心の仮定、もしくはそれらが共有知識であることを根拠として説明できるとは限りません。

例（複数均衡の問題）

以下の利得行列で表される完備情報の静学ゲーム$G$について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & R & L \\ \hline
R & 1^{\ast },1^{\ast } & 0,0 \\ \hline
L & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表：利得行列

$\left( R,R\right) $と$\left( L,L\right) $がともに純粋戦略ナッシュ均衡であることは明らかです。このゲーム$G$において任意のプレイヤーは支配戦略を持たないため、ナッシュ均衡である$\left(R,R\right) $と$\left( L,L\right) $はともに支配戦略均衡ではなく、支配される戦略の逐次消去の解でもありません。したがって、$\left( R,R\right) $と$\left( L,L\right) $のどちらが実際にプレーされることになるかを、プレイヤーの合理性や警戒心の仮定、もしくはそれらが共有知識であるという仮定を根拠に説明できるとは限りません。

このような事情を踏まえると、複数均衡の問題に対しては、特定のナッシュ均衡がプレーされる根拠を与える何らかの説明体系が必要です。複数均衡問題の説明体系としては、大きく分けて2種類あります。1つ目はゲームの利得構造から説明する方法であり、2つ目はゲームに記述されていない要素、特にプレイヤーの心理的な側面から説明する方法です。今回は前者の立場から複数均衡の問題について考えます。

利得支配

戦略型ゲーム$G$において2つの純粋戦略の組$s_{I},s_{I}^{\prime }\in S_{I}$の間に、\begin{equation*}\forall i\in I:u_{i}\left( s_{I}^{\prime }\right) >u_{i}\left( s_{I}\right)
\end{equation*}という条件が成り立つ場合、つまり、任意のプレイヤーについて、$s_{I}^{\prime }$において得る利得が$s_{I}$において得る利得よりも大きい場合、$s_{I}^{\prime }$は$s_{I}$を狭義パレート支配する（strictly Pareto dominate）と言います。同じことを、$s_{I}$は$s_{I}^{\prime }$によって狭義パレート支配される（strictly Pareto dominated）と言うこともできます。$s_{I}^{\prime }$が$s_{I}$を狭義パレートする場合、$s_{I}$から$s_{I}^{\prime }$へ移行することにより全員の利得を高めることができます。そのような意味において、$s_{I}$から$s_{I}^{\prime }$へ移行することを狭義のパレート改善（strictly Pareto improvement）と呼びます。全員の利得を高めることができるのであれば、それは明らかに全員にとって望ましい変化です。

戦略型ゲーム$G$に複数の純粋戦略ナッシュ均衡が存在するものとします。2つの異なるナッシュ均衡$s_{I},s_{I}^{\prime}\in S_{I}$に注目したときに、$s_{I}^{\prime }$が$s_{I}$を狭義パレート支配するのであれば、すなわち、\begin{equation*}\forall i\in I:u_{i}\left( s_{I}^{\prime }\right) >u_{i}\left( s_{I}\right)
\end{equation*}が成り立つ場合には、$s_{I}^{\prime }$は$s_{I}$を利得支配する（payoff dominate）と言います。同じことを、$s_{I}$は$s_{I}^{\prime }$によって利得支配される（payoff dominated）と言うこともできます。利得支配の定義では、ナッシュ均衡どうしの比較が問題になっていることに注意してください。

例（利得支配）

以下の利得行列で表される完備情報の静学ゲーム$G$について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 2^{\ast },2^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表：利得行列

$\left( C,C\right) $と$\left( D,D\right) $がともに純粋戦略ナッシュ均衡であるとともに、この2つの均衡の間には、\begin{equation*}\forall i\in I:u_{i}\left( C,C\right) =2>1=u_{i}\left( D,D\right)
\end{equation*}という関係が成り立つため、$\left( C,C\right) $は$\left(D,D\right) $を利得支配しています。

戦略型ゲーム$G$に複数の純粋戦略ナッシュ均衡が存在する場合でも、それらの間に利得支配関係は成立するとは限りません。以下の例より明らかです。

例（利得支配）

以下の利得行列で表される完備情報の静学ゲーム$G$について再び考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & R & L \\ \hline
R & 1^{\ast },1^{\ast } & 0,0 \\ \hline
L & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表：利得行列

$\left( R,R\right) $と$\left( L,L\right) $はともに純粋戦略ナッシュ均衡ですが、この2つの均衡の間には、\begin{equation*}\forall i\in I:u_{i}\left( R,R\right) =1=u_{i}\left( L,L\right)
\end{equation*}という関係が成り立つため、$\left( R,R\right) $と$\left(L,L\right) $のどちらか一方が他方を利得支配するわけではありません。

利得支配とプレイヤーの合理性

戦略型ゲーム$G$に複数の純粋戦略ナッシュ均衡が存在するとともに、その中の1つのナッシュ均衡$s_{I}$が他のすべてのナッシュ均衡を利得支配するものとします。加えて、$s_{I}$はナッシュ均衡であるとは限らない他のすべての純粋戦略の組を狭義にパレート支配するものとします。つまり、$s_{I}$はゲームの純粋戦略ナッシュ均衡であるとともに、プレイヤーたちが$s_{I}$をプレーすれば全員がゲーム$G$において実現し得る最大の利得を獲得できるということです。この場合、プレイヤーたちが合理的であれば、彼らは互いに協調して$s_{I}$をプレーするのが自然のように思われます。ただ、実際には、このような場合においても、プレイヤーたちが$s_{I}$をプレーすることを合理性の仮定から保証できるとは限りません。以下の例より明らかです。

例（利得支配とプレイヤーの合理性）

以下の利得行列で表される完備情報の静学ゲーム$G$について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 2^{\ast },2^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表：利得行列

$\left( C,C\right) $と$\left( D,D\right) $がともに純粋戦略ナッシュ均衡であるとともに、$\left( C,C\right) $は$\left( D,D\right) $を利得支配しています。加えて、$\left( C,C\right) $は$\left(D,D\right) $とは限らない他の任意の純粋戦略の組を狭義にパレート支配しています。それにも関わらず、プレイヤーたちが$\left( C,C\right) $をプレーすることを合理性の仮定から保証することはできません。実際、それぞれのプレイヤーにとって$C$は支配戦略ではないため、相手の選択とは関係なく無条件で$C$を選ぶことが最適であるわけではなく、相手が$C$を選ぶ場合、そしてその場合にのみ自分もまた$C$を選ぶことが最適になります。したがって、プレイヤーたちが$\left(C,C\right) $を実際にプレーするためには、お互いに相手が$C$をプレーすることを予想し合っている状態が成立している必要があります。ただ、プレイヤーが合理的であることは、そのプレイヤーが「相手が$C$をプレーすることを予想する」ことの明確な根拠にはならないため、結局、プレイヤーたちが$\left( C,C\right) $をプレーすることを合理性だけを根拠に保証することはできません。

事前交渉の効果

戦略型ゲーム$G$に複数の純粋戦略ナッシュ均衡が存在するとともに、その中の1つのナッシュ均衡$s_{I}$が他の任意のナッシュ均衡を利得支配するだけでなく、ナッシュ均衡とは限らない他の任意の純粋戦略の組を狭義パレート支配する場合においても、プレイヤーたちが$s_{I}$を実際にプレーすることを合理性の仮定から保証できるとは限らないことが明らかになりました。ゲーム$G$の構造を変えず、なおかつプレイヤーの合理性だけを根拠に、プレイヤーたちが$s_{I}$をプレーすることを保証するような理屈は存在しないのでしょうか。

完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意が成立しないことが前提になっていますが、その一方で、プレイヤーたちが意思決定を行う前に交渉を行う可能性までは否定していません。交渉を行い何らかの合意に至った場合でも、それを強制する仕組みが存在しない場合には、やはり完備情報の静学ゲームの枠組みの中で分析することになります。では、プレイヤーたちが事前交渉を通じて$s_{I}$をプレーするよう合意した場合、実際に、彼らが$s_{I}$をプレーすることを保証できるのでしょうか。つまり、$s_{I}$をプレーするという合意はプレイヤーたちにとって自己拘束的になるのでしょうか。以下の例から明らかであるように、そのような合意は自己拘束的になるとは限りません。

例（事前交渉の効果）

以下の利得行列で表される完備情報の静学ゲーム$G$について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 9^{\ast },9^{\ast } & 0,8 \\ \hline
D & 8,0 & 7^{\ast },7^{\ast } \\ \hline
\end{array}$$

表：利得行列

$\left( C,C\right) $と$\left( D,D\right) $がともに純粋戦略ナッシュ均衡であるとともに、$\left( C,C\right) $は$\left( D,D\right) $を利得支配しています。加えて、$\left( C,C\right) $は$\left(D,D\right) $とは限らない他の任意の純粋戦略の組を狭義にパレート支配しています。プレイヤーたちが事前交渉において$\left( C,C\right) $をプレーするよう約束する状況を想定します。ただし、この合意に拘束力はありません。この合意は自己拘束的でしょうか。リスク管理という観点から評価すると、合意$\left( C,C\right) $は自己拘束的であると言えなくなります。実際、プレイヤー$1$の立場から考えてみると、自分が約束通りに$C$を選択した場合、相手も約束通りに$C$を選択すれば自分は利得$9$を得られる一方で、仮に相手が約束を破って$D$を選択すれば自分の利得が$0$になってしまいます。一方、自分が約束を破って$D$を選択した場合、相手が約束を守るかどうかに関わらず、最低でも利得$7$を確保できることは保証されています。したがって、相手が約束を守るというよほどの確信がなければ、安全策の$D$を選ぶと考えるのがもっともらしいでしょう。プレイヤー$2$の立場から考えた場合にも同様です。したがって、2人はともに、相手が約束を守るというよほどの確信がない場合には、安全策をとって約束を破ることになります。このような予測は、読み合いの要素を考慮することでさらに確かなものになります。つまり、それぞれのプレイヤーは「相手が約束を守るというよほどの確信がなければ安全策の裏切りを選ぶ」だけでなく、相手もまた同じように考えるであろうと推測するのであれば、相手が裏切るであろうという疑念はさらに強固になります。このような読み合いをより深く重ねれば重なるほど、相手が裏切るであろうという疑念はより強固なものになります。以上の考察により、プレイヤーたちは約束$\left( C,C\right) $を守るシナリオよりも、お互いに約束を破って$\left( D,D\right) $をプレーするシナリオのほうが信憑性が高いことが明らかになりました。したがって、ナッシュ均衡$\left( C,C\right) $は自己拘束的であるとは言えません。

読み合いが疑念を増幅させ、その結果としてお互いが裏切ってしまうのであれば、プレイヤーたちがもう少し上手くコミュニケーションすれば問題を解決できるのでは思うかもしれません。事前交渉にじっくりと時間をかけたり、自分は約束を守ることを熱意をもってアピールするなど、コミュニケーションの方法を改善すれば約束$\left( C,C\right) $が自己拘束的になるのでは、という意見です。この意見は正しくはありません。以下の例より明らかです。

例（事前交渉の効果）

引き続き以下の利得行列で表される戦略型ゲーム$G$について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 9^{\ast },9^{\ast } & 0,8 \\ \hline
D & 8,0 & 7^{\ast },7^{\ast } \\ \hline
\end{array}$$

表：利得行列

先と同様、プレイヤーたちは事前交渉において$\left( C,C\right) $をプレーするよう約束する状況を想定します。ただし、この合意に拘束力はありません。先の議論から明らかになったように、プレイヤー$1$は相手が約束を守るというよほどの確信がなければ安全策の$D$を選びます。ここで、プレイヤー$2$が「自分は約束通り$C$をプレーするからあなたも約束通り$C$をプレーするよう」熱心にアピールしてきたとします。このようなアピールの結果として、プレイヤー$1$は相手が$C$をプレーするだろうと少しでも信じるようになるでしょうか。なりません。なぜなら、プレイヤー$2$がこのようなアピールをしても、プレイヤー$1$が相手の真の意図を見抜く助けにはならないからです。実際、プレイヤー$2$の真の意図が$C$である場合（約束を守る）、相手が$C$を選べば自分はより多くの利得を得られます（$9>0$）。プレイヤー$2$の真の意図が$D$である場合（約束を破る）にも、やはり相手が$C$を選べば自分はより多くの利得を得られます（$8>7$）。つまり、プレイヤー$2$の真の意図がどちらの場合においても、彼は相手に約束を守って欲しいことに変わりはないため、自分がどのようにアピールしても、相手はそのアピールがどちらの意図にもとづいて行われているか見分けられないのです。したがってアピールは無意味であり、プレイヤー$1$の疑念を払しょくする助けにはなりません。プレイヤー$1$がアピールする場合にも同様の議論が成り立ちます。以上の議論により、事前交渉におけるコミュニケーションの方法を変えても、約束$\left( C,C\right) $は自己拘束的にならないことが明らかになりました。

利得支配の原理

ゲームの構造を変えず、なおかつプレイヤーの行動原理として合理性の仮定だけを認める場合には、利得支配するナッシュ均衡が実際にプレーされることの明確な根拠が得られないことが明らかになりました。したがって、利得支配するナッシュ均衡が実際にプレーされることを保証するためには、それをプレイヤーたちの新たな行動原理として認める必要があります。

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム$G$として表現されているものとします。ゲーム$G$に複数の純粋戦略ナッシュ均衡が存在するとともに、その中の1つのナッシュ均衡$s_{I}$が他の任意のナッシュ均衡を利得支配する場合、プレイヤーたちが$s_{I}$を実際にプレーすることを仮定するのであれば、これを利得支配の原理（payoff dominance principle）と呼びます。

ただ、複数均衡問題に対して利得支配の原理を適用する場合、それは分析者として思考停止していることと実質的に等しいため、あまり望ましい態度ではありません。多くの研究者は代替的なアプローチとして、ゲームの構造を読み替えたり、プレイヤーの行動原理を別の形に改変するなど、様々な切り口で複数均衡問題に取り組んでいます。

WIIS

数学のコース

経済学のコース

アカウント

WIIS

完備情報の静学ゲーム

複数均衡問題と利得支配

目次

関連知識

複数均衡問題に対する説明体系の種類

利得支配

利得支配とプレイヤーの合理性

事前交渉の効果

利得支配の原理

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率