WIIS

完備情報の静学ゲーム

ナッシュ均衡と自己拘束的な合意

目次

Mailで保存
Xで共有

自己拘束的な合意

完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意が成立しないことが前提になっていますが、その一方で、プレイヤーたちが意思決定を行う前に交渉を行う可能性までは否定していません。交渉を行い何らかの合意に至った場合でも、それを強制する仕組みが存在しない場合には、やはり完備情報の静学ゲームの枠組みの中で分析することになります。

プレイヤーたちが事前交渉を行い何らかの合意に至った場合、それを強制する仕組みが存在しないにも関わらず、すべてのプレイヤーが進んで合意通りに行動する場合があります。罰則や報酬など、プレイヤーたちが合意にしたがうことを外部から強制する要因が存在しないにも関わらず、プレイヤーたちが自ら進んで合意を守る場合、そのような合意を自己拘束的な合意(self-enforcing agreement)と呼びます。合意が自己拘束的であるためには、その合意はどのような性質を満たしている必要があるのでしょうか。

 

自己拘束的な合意はナッシュ均衡

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。プレイヤーたちは意思決定を行う前に事前交渉を行い、ある純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)をプレーするという合意に至ったとします。ただし、この合意に拘束力は存在しないため、それぞれのプレイヤー\(i\in I\)は合意した純粋戦略\(s_{i}^{\ast }\in S_{i}\)をプレーすることを強制されません。つまり、仮にプレイヤー\(i\)が\(s_{i}^{\ast }\)とは異なる戦略を選んだ場合においても、ゲーム\(G\)に記述されていないような罰則を課されたり報酬を得られるわけではないということです。それにも関わらず、ゲーム\(G\)をプレーする段階になって、すべてのプレイヤーたちが合意\(s_{I}^{\ast }\)通りに意思決定を行ったものとします。つまり、この合意\(s_{I}^{\ast}\)が自己拘束的である状況を想定するということです。この場合、この合意\(s_{I}^{\ast }\)はナッシュ均衡でなければなりません。なぜなら、仮に合意\(s_{I}^{\ast}\)がナッシュ均衡ではないものと仮定すると、ナッシュ均衡の定義より、\begin{equation*}\exists i\in I,\ \exists s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast
},s_{-i}^{\ast }\right) <u_{i}\left( s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つため、少なくとも1人のプレイヤー\(i\)は合意した戦略\(s_{i}^{\ast }\)とは異なる戦略\(s_{i}\)を選択することにより、より多くの利得が得られるはずだからです。それにも関わらず合意した戦略\(s_{i}^{\ast }\)を実際にプレーすることは、プレイヤーの合理性の仮定と矛盾します。したがって背理法より、合意\(s_{I}^{\ast }\)はナッシュ均衡でなければなりません。自己拘束的な合意はナッシュ均衡でなければならないことが明らかになりました。

命題(自己拘束的な合意はナッシュ均衡)
完備情報の静学ゲーム\(G\)において、純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が自己拘束的な合意であるものとする。合理性の仮定を認める場合、この合意\(s_{I}^{\ast }\)はゲーム\(G\)における広義の純粋戦略ナッシュ均衡である。

上の命題の対偶より、合意\(s_{I}^{\ast }\)がナッシュ均衡でない場合には、その合意は自己拘束的ではありません。実際、合意\(s_{I}^{\ast }\)がナッシュ均衡ではない場合には、\begin{equation*}\exists i\in I,\ \exists s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast
},s_{-i}^{\ast }\right) <u_{i}\left( s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つため、少なくとも1人のプレイヤー\(i\)は合意した戦略\(s_{i}^{\ast }\)とは異なる戦略\(s_{i}\)を選択することにより、より多くの利得を得られるため、プレイヤーが合理的である限りにおいて、プレイヤー\(i\)は実際に\(s_{i}\)を選択し、その結果、合意\(s_{I}^{\ast }\)は守られないことになります。

 

ナッシュ均衡は自己拘束的であるとは限らない

自己拘束的な合意は必ずナッシュ均衡であることが明らかになりましたが、その逆は成立するとは限りません。つまり、ナッシュ均衡は自己拘束的な合意になるとは限らないということです。言い換えると、プレイヤーたちが事前にナッシュ均衡をプレーすることを合意した場合、必ずしも合意通りに行動するとは限らないということです。以下の例より明らかです。

例(自己拘束的ではないナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 9^{\ast },9^{\ast } & 0,8 \\ \hline
D & 8,0 & 7^{\ast },7^{\ast } \\ \hline
\end{array}$$

表:利得行列

このゲームには2つの純粋戦略ナッシュ均衡\(\left( U,L\right) ,\left( D,R\right) \)が存在します。両者を比較した場合、双方のプレイヤーは\(\left( U,L\right) \)においてより多くの利得を得られる(\(9>7\))ため、その意味において\(\left( U,L\right) \)は\(\left( D,R\right) \)よりも望ましいと言えます。それだけでなく、他の任意の純粋戦略の組と比較した場合においても、双方のプレイヤーは\(\left( U,L\right) \)において最大の利得を得られます。そこで、彼らは事前交渉において\(\left( U,L\right) \)をプレーするよう約束する状況を想定します。ただし、この合意に拘束力はありません。この合意は自己拘束的でしょうか。リスク管理という観点から評価すると、合意\(\left( U,L\right) \)は自己拘束的であると言えなくなります。実際、プレイヤー\(1\)の立場から考えてみると、自分が約束通りに\(U\)を選択した場合、相手も約束通りに\(L\)を選択すれば自分は利得\(9\)を得られる一方で、仮に相手が約束を破って\(R\)を選択すれば自分の利得が\(0\)になってしまいます。一方、自分が約束を破って\(D\)を選択した場合、相手が約束を守るかどうかに関わらず、最低でも利得\(7\)を確保できることは保証されています。したがって、相手が約束を守るというよほどの確信がなければ、安全策の\(D\)を選ぶと考えるのがもっともらしいでしょう。プレイヤー\(2\)の立場から考えた場合にも同様です。したがって、2人はともに、相手が約束を守るというよほどの確信がない場合には、安全策をとって約束を破ることになります。このような予測は、読み合いの要素を考慮することでさらに確かなものになります。つまり、それぞれのプレイヤーは「相手が約束を守るというよほどの確信がなければ安全策の裏切りを選ぶ」だけでなく、相手もまた同じように考えるであろうと推測するのであれば、相手が裏切るであろうという疑念はさらに強固になります。このような読み合いをより深く重ねれば重なるほど、相手が裏切るであろうという疑念はより強固なものになります。以上の考察により、プレイヤーたちは約束\(\left( U,L\right) \)を守るシナリオよりも、お互いに約束を破って\(\left( D,R\right) \)をプレーするシナリオのほうが信憑性が高いことが明らかになりました。したがって、ナッシュ均衡\(\left( U,L\right) \)は自己拘束的であるとは言えません。

読み合いが疑念を増幅させ、その結果としてお互いが裏切ってしまうのであれば、プレイヤーたちがもう少し上手くコミュニケーションすれば問題を解決できるのでは思うかもしれません。事前交渉にじっくりと時間をかけたり、自分は約束を守ることを熱意をもってアピールするなど、コミュニケーションの方法を改善すれば約束\(\left( U,L\right) \)が自己拘束的になるのでは、という意見です。この意見は正しくはありません。以下の例より明らかです。

例(自己拘束的ではないナッシュ均衡)
引き続き以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 9^{\ast },9^{\ast } & 0,8 \\ \hline
D & 8,0 & 7^{\ast },7^{\ast } \\ \hline
\end{array}$$

表:利得行列

先と同様、プレイヤーたちは事前交渉において\(\left( U,L\right) \)をプレーするよう約束する状況を想定します。ただし、この合意に拘束力はありません。先の議論から明らかになったように、プレイヤー\(1\)は相手が約束を守るというよほどの確信がなければ安全策の\(D\)を選びます。ここで、プレイヤー\(2\)が「自分は約束通り\(L\)をプレーするからあなたも約束通り\(U\)をプレーするよう」熱心にアピールしてきたとします。このようなアピールの結果として、プレイヤー\(1\)は相手が\(L\)をプレーするだろうと少しでも信じるようになるでしょうか。なりません。なぜなら、プレイヤー\(2\)がこのようなアピールをしても、プレイヤー\(1\)が相手の真の意図を見抜く助けにはならないからです。実際、プレイヤー\(2\)の真の意図が\(L\)である場合(約束を守る)、相手が\(U\)を選べば自分はより多くの利得を得られます(\(9>0\))。プレイヤー\(2\)の真の意図が\(R\)である場合(約束を破る)にも、やはり相手が\(U\)を選べば自分はより多くの利得を得られます(\(8>7\))。つまり、プレイヤー\(2\)の真の意図がどちらの場合においても、彼は相手に約束を守って欲しいことに変わりはないため、自分がどのようにアピールしても、相手はそのアピールがどちらの意図にもとづいて行われているか見分けられないのです。したがってアピールは無意味であり、プレイヤー\(1\)の疑念を払しょくする助けにはなりません。プレイヤー\(1\)がアピールする場合にも同様の議論が成り立ちます。以上の議論により、事前交渉におけるコミュニケーションの方法を変えても、約束\(\left( U,L\right) \)は自己拘束的にならないことが明らかになりました。

自己拘束的な合意は必ずナッシュ均衡である一方、ナッシュ均衡は自己拘束的な合意になるとは限らないことが明らかになりました。ただ、すべてのナッシュ均衡が自己拘束的な合意にならないというわけではなく、ナッシュ均衡が自己拘束的になる場合も起こり得ます。以下の例より明らかです。

例(自己拘束的なナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 2^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$

表:利得行列

このゲームには2つの純粋戦略ナッシュ均衡\(\left( U,L\right) ,\left( D,R\right) \)が存在します。両者を比較した場合、プレイヤー\(1\)にとっては\(\left( U,L\right) \)のほうが望ましく、プレイヤー\(2\)にとっては\(\left( D,R\right) \)のほうが望ましいです。ただ、ナッシュ均衡と他の任意の純粋戦略の組と比較した場合においても、双方のプレイヤーはナッシュ均衡においてより多くの利得を得られるため、ナッシュ均衡はそうではない任意の結果よりも望ましいと言えます。ここで、彼らは事前交渉において\(\left( U,L\right) \)をプレーするよう約束する状況を想定します。ただし、この合意に拘束力はありません。この合意は自己拘束的でしょうか。ここで、プレイヤー\(2\)が「自分は約束通り\(L\)をプレーするからあなたも約束通り\(U\)をプレーするよう」熱心にアピールしてきたとします。このようなアピールの結果として、プレイヤー\(1\)は相手が\(L\)をプレーするだろうと少しでも信じるようになるでしょうか。先の例とは異なり、この例では、そのようなアピールが功を奏します。なぜなら、プレイヤー\(2\)がこのようなアピールをすることにより、プレイヤー\(1\)が相手の真の意図を見抜く助けになるからです。実際、プレイヤー\(2\)の真の意図が\(L\)である場合(約束を守る)、相手が\(U\)を選べば自分はより多くの利得を得られます(\(1>0\))。一方、プレイヤー\(2\)の真の意図が\(R\)である場合(約束を破る)には、相手が\(L\)を選べば自分はより多くの利得を得られます(\(2>0\))。つまり、先のゲームとは異なり、このゲームにおいては、プレイヤー\(2\)は自分が約束を守る意思がある場合にのみ相手にも約束を守ってもらいたいという構造になっているため、先のようなアピールが信憑性のあるものになっています。プレイヤー\(1\)がアピールする場合にも同様の議論が成り立ちます。以上の議論により、約束\(\left(U,L\right) \)はナッシュ均衡であるとともに自己拘束的であることが明らかになりました。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録