WIIS

完備情報の静学ゲーム

狭義の純粋戦略ナッシュ均衡

目次

Mailで保存
Xで共有

純粋戦略の範囲での狭義の最適反応

問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

ゲームの静学性より、それぞれのプレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ純粋戦略\(s_{-i}\in S_{-i}\)を事前に観察できません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る純粋戦略からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して、自分が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得られる利得\(u_{i}\left( s_{i},s_{-i}\right) \)を把握しています。

以上を踏まえた上で、他のプレイヤーたちがある純粋戦略\(s_{-i}\in S_{-i}\)を選ぶ状況を想定したとき、自身が純粋戦略\(s_{i}^{\ast }\in S_{i}\)を選んだときに得る利得\(u_{i}\left(s_{i}^{\ast },s_{-i}\right) \)が他の任意の純粋戦略\(s_{i}\in S_{i}\backslash \left\{s_{i}^{\ast }\right\} \)を選んだときに得られる利得よりも大きい場合には、すなわち、\begin{equation*}\forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast }\right\} :u_{i}\left(
s_{i}^{\ast },s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つのであれば、\(s_{i}^{\ast }\)は\(s_{-i}\)に対する狭義の最適反応(strict best response)であると言います。これは、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで狭義に最大化されることを意味します。

プレイヤー\(i\)の狭義の最適反応は、他のプレイヤーたちの純粋戦略に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の狭義の最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の狭義の最適反応は\(s_{i}^{\ast}\)と一致するとは限りません。以下の例より明らかです。

例(狭義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 2,8 \\ \hline
D & 8,2 & 0,0 \\ \hline
\end{array}$$

プレイヤー\(1\)については、\begin{eqnarray*}u_{1}\left( D,L\right) &=&8>5=u_{1}\left( U,L\right) \\
u_{1}\left( U,R\right) &=&2>0=u_{1}\left( D,R\right)
\end{eqnarray*}が成り立つため、相手の\(L\)に対する狭義の最適反応は\(D\)である一方、相手の\(R\)に対する狭義の最適反応は\(U\)です。プレイヤー\(2\)については、\begin{eqnarray*}u_{2}\left( U,R\right) &=&8>5=u_{2}\left( U,L\right) \\
u_{2}\left( D,L\right) &=&2>0=u_{2}\left( D,R\right)
\end{eqnarray*}が成り立つため、相手の\(U\)に対する狭義の最適反応は\(R\)である一方、相手の\(D\)に対する狭義の最適反応は\(L\)です。

以下の例が示唆するように、狭義の最適反応は存在するとは限りません。

例(狭義の最適反応が存在しない場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 5,5 \\ \hline
D & 5,5 & 5,5 \\ \hline
\end{array}$$

プレイヤー\(1\)について、\begin{eqnarray*}u_{1}\left( U,L\right) &=&5=u_{1}\left( D,L\right) \\
u_{1}\left( U,R\right) &=&5=u_{1}\left( D,R\right)
\end{eqnarray*}が成り立ちますが、以上の事実は、相手の\(L\)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応がいずれも存在しないことを意味します。プレイヤー\(2\)についても同様です。

他のプレイヤーたちのある純粋戦略\(s_{-i}\)に注目したとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限らないことが明らかになりました。一方、\(s_{-i}\)に対する狭義の最適反応が存在する場合、それは一意的です。

命題(狭義の最適反応の一意性)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{i}\)に対する狭義の最適反応を持つ場合、それは一意的である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

狭義の純粋戦略ナッシュ均衡

プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する狭義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}\backslash \{s_{i}^{\ast }\}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つこととして定義されます。これは、他のプレイヤーたちが\(s_{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(s_{i}^{\ast }\)を選ぶことにより自身の利得を狭義に最大化できることを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast}=\left( s_{i}^{\ast }\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} :u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)を\(G\)における狭義のナッシュ均衡(strict Nash equilibrium)や狭義の純粋戦略ナッシュ均衡(strict pure Nash equilibrium)などと呼びます。

純粋戦略の組\(s_{I}^{\ast }\)が狭義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを前提とする場合、プレイヤー\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、狭義のナッシュ均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つため、プレイヤー\(i\)はそのような逸脱によって損をしてしまいます。同様の議論は任意のプレイヤーについて成り立ちます。つまり、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱すると損をしてしまいます。狭義の純粋戦略ナッシュ均衡ではプレイヤーたちの戦略がお互いに狭義の最適反応になっているため、全員がそこに留まる動機を持つということです。ただし、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

逆に、純粋戦略の組\(s_{I}^{\ast }\)が狭義のナッシュ均衡ではないものとします。つまり、\begin{equation*}\exists i\in I,\ \exists s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} :u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) \leq u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つということです。上の命題において存在が保証されるプレイヤー\(i\)以外のプレイヤーたちが\(s_{-i}^{\ast }\)にしたがうことを前提とする場合、プレイヤー\(i\)は\(s_{i}^{\ast }\)とは異なる戦略\(s_{i}\)を選ぶことにより、\(s_{i}^{\ast }\)を選ぶ場合以上の利得を獲得できます。純粋戦略の組が狭義のナッシュ均衡ではない場合には、少なくとも1人のプレイヤーはそこから逸脱する動機を持つということです。

例(狭義の純粋戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8^{\ast } \\ \hline
D & 8^{\ast },0 & 2^{\ast },2^{\ast } \\ \hline
\end{array}$$

表にはそれぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これは狭義の純粋戦略ナッシュ均衡です。

狭義の純粋戦略ナッシュ均衡は存在するとは限りません。まずは、プレイヤーたちがそもそも狭義の最適反応を持たない例を挙げます。

例(狭義の純粋戦略ナッシュ均衡が存在しない場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 5,5 \\ \hline
D & 5,5 & 5,5 \\ \hline
\end{array}$$

プレイヤー\(1\)は相手の\(L \)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応を持ちません。プレイヤー\(2\)もまた相手の\(L \)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応を持ちません。したがって、このゲームには狭義の最適反応からなる組、すなわち狭義の純粋戦略ナッシュ均衡は存在しません。

続いて、プレイヤーたちが狭義の最適反応を持つにもかかわらず、狭義の純粋戦略ナッシュ均衡は存在しない例を挙げます。

例(狭義の純粋戦略ナッシュ均衡が存在しない場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
D & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、このゲームには狭義の最適反応からなる組、すなわち狭義の純粋戦略ナッシュ均衡は存在しません。

狭義の純粋戦略ナッシュ均衡が存在する場合、それは1つだけであるとは限りません。

例(複数の狭義の純粋戦略ナッシュ均衡が存在する場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 2^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( U,L\right) ,\ \left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これらはともに狭義の純粋戦略ナッシュ均衡です。

 

演習問題

問題(狭義の純粋戦略ナッシュ均衡)
自治体の首長選挙へ出馬するにあたり、ある政党から公認を得ようとしている2人がゲームのプレイヤーです。公認枠は1人だけです。2人はそれぞれ「公認をめぐって争う」か「公認をめぐって争わない」かのどちらか一方を選択します。2人がともに公認をめぐって争う場合、どちらか一方が政党から公認を得て首長選へ出馬することになります。ただ、公認をめぐる激しい争いは資金面での枯渇や人間関係のトラブルをもたらすため、仮に公認を得て首長選へ出馬できた場合でにも落選が確実です。これは双方にとって最悪の結果です。また、1人が公認を求め、もう1人が身を引く場合、公認を求めた方が実際に公認を得て、その後の首長選でも確実に勝利できます。身を引いた方は首長選に立候補できませんが、公認をめぐる激しい争いは回避できます。また、双方が公認から身を引く場合、双方ともに首長選へ出馬できませんが、公認をめぐる激しい争いは回避できます。以上の状況を戦略型ゲーム\(G\)として定式化した上で、狭義の純粋戦略ナッシュ均衡が存在するかどうか議論してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(狭義のナッシュ均衡と広義のナッシュ均衡の関係)
以下の問いに答えてください。

  1. 戦略型ゲーム\(G\)において純粋戦略の組\(s_{I}^{\ast}\in S_{I}\)が狭義の純粋戦略ナッシュ均衡である場合には、\(s_{I}^{\ast }\)は広義の純粋戦略ナッシュ均衡であることを示してください。
  2. 戦略型ゲーム\(G\)において純粋戦略の組\(s_{I}^{\ast}\in S_{I}\)が広義の純粋戦略ナッシュ均衡である場合には、\(s_{I}^{\ast }\)は狭義の純粋戦略ナッシュ均衡であるとは限らないことを示してください。
  3. 狭義の純粋戦略ナッシュ均衡と広義の純粋戦略ナッシュ均衡の双方が存在しないような戦略型ゲーム\(G\)の例を挙げてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録