純粋戦略の範囲での狭義の最適反応
問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。
ゲームの静学性より、それぞれのプレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ純粋戦略\(s_{-i}\in S_{-i}\)を事前に観察できません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る純粋戦略からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して、自分が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得られる利得\(u_{i}\left( s_{i},s_{-i}\right) \)を把握しています。
以上を踏まえた上で、他のプレイヤーたちがある純粋戦略\(s_{-i}\in S_{-i}\)を選ぶ状況を想定したとき、自身が純粋戦略\(s_{i}^{\ast }\in S_{i}\)を選んだときに得る利得\(u_{i}\left(s_{i}^{\ast },s_{-i}\right) \)が他の任意の純粋戦略\(s_{i}\in S_{i}\backslash \left\{s_{i}^{\ast }\right\} \)を選んだときに得られる利得よりも大きい場合には、すなわち、\begin{equation*}\forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast }\right\} :u_{i}\left(
s_{i}^{\ast },s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つのであれば、\(s_{i}^{\ast }\)は\(s_{-i}\)に対する狭義の最適反応(strict best response)であると言います。これは、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで狭義に最大化されることを意味します。
プレイヤー\(i\)の狭義の最適反応は、他のプレイヤーたちの純粋戦略に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の狭義の最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の狭義の最適反応は\(s_{i}^{\ast}\)と一致するとは限りません。以下の例より明らかです。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 2,8 \\ \hline
D & 8,2 & 0,0 \\ \hline
\end{array}$$
プレイヤー\(1\)については、\begin{eqnarray*}u_{1}\left( D,L\right) &=&8>5=u_{1}\left( U,L\right) \\
u_{1}\left( U,R\right) &=&2>0=u_{1}\left( D,R\right)
\end{eqnarray*}が成り立つため、相手の\(L\)に対する狭義の最適反応は\(D\)である一方、相手の\(R\)に対する狭義の最適反応は\(U\)です。プレイヤー\(2\)については、\begin{eqnarray*}u_{2}\left( U,R\right) &=&8>5=u_{2}\left( U,L\right) \\
u_{2}\left( D,L\right) &=&2>0=u_{2}\left( D,R\right)
\end{eqnarray*}が成り立つため、相手の\(U\)に対する狭義の最適反応は\(R\)である一方、相手の\(D\)に対する狭義の最適反応は\(L\)です。
以下の例が示唆するように、狭義の最適反応は存在するとは限りません。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 5,5 \\ \hline
D & 5,5 & 5,5 \\ \hline
\end{array}$$
プレイヤー\(1\)について、\begin{eqnarray*}u_{1}\left( U,L\right) &=&5=u_{1}\left( D,L\right) \\
u_{1}\left( U,R\right) &=&5=u_{1}\left( D,R\right)
\end{eqnarray*}が成り立ちますが、以上の事実は、相手の\(L\)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応がいずれも存在しないことを意味します。プレイヤー\(2\)についても同様です。
他のプレイヤーたちのある純粋戦略\(s_{-i}\)に注目したとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限らないことが明らかになりました。一方、\(s_{-i}\)に対する狭義の最適反応が存在する場合、それは一意的です。
狭義の純粋戦略ナッシュ均衡
プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する狭義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}\backslash \{s_{i}^{\ast }\}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つこととして定義されます。これは、他のプレイヤーたちが\(s_{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(s_{i}^{\ast }\)を選ぶことにより自身の利得を狭義に最大化できることを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast}=\left( s_{i}^{\ast }\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} :u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)を\(G\)における狭義のナッシュ均衡(strict Nash equilibrium)や狭義の純粋戦略ナッシュ均衡(strict pure Nash equilibrium)などと呼びます。
純粋戦略の組\(s_{I}^{\ast }\)が狭義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを前提とする場合、プレイヤー\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、狭義のナッシュ均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つため、プレイヤー\(i\)はそのような逸脱によって損をしてしまいます。同様の議論は任意のプレイヤーについて成り立ちます。つまり、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱すると損をしてしまいます。狭義の純粋戦略ナッシュ均衡ではプレイヤーたちの戦略がお互いに狭義の最適反応になっているため、全員がそこに留まる動機を持つということです。ただし、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。
逆に、純粋戦略の組\(s_{I}^{\ast }\)が狭義のナッシュ均衡ではないものとします。つまり、\begin{equation*}\exists i\in I,\ \exists s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} :u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) \leq u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つということです。上の命題において存在が保証されるプレイヤー\(i\)以外のプレイヤーたちが\(s_{-i}^{\ast }\)にしたがうことを前提とする場合、プレイヤー\(i\)は\(s_{i}^{\ast }\)とは異なる戦略\(s_{i}\)を選ぶことにより、\(s_{i}^{\ast }\)を選ぶ場合以上の利得を獲得できます。純粋戦略の組が狭義のナッシュ均衡ではない場合には、少なくとも1人のプレイヤーはそこから逸脱する動機を持つということです。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8^{\ast } \\ \hline
D & 8^{\ast },0 & 2^{\ast },2^{\ast } \\ \hline
\end{array}$$
表にはそれぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これは狭義の純粋戦略ナッシュ均衡です。
狭義の純粋戦略ナッシュ均衡は存在するとは限りません。まずは、プレイヤーたちがそもそも狭義の最適反応を持たない例を挙げます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 5,5 \\ \hline
D & 5,5 & 5,5 \\ \hline
\end{array}$$
プレイヤー\(1\)は相手の\(L \)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応を持ちません。プレイヤー\(2\)もまた相手の\(L \)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応を持ちません。したがって、このゲームには狭義の最適反応からなる組、すなわち狭義の純粋戦略ナッシュ均衡は存在しません。
続いて、プレイヤーたちが狭義の最適反応を持つにもかかわらず、狭義の純粋戦略ナッシュ均衡は存在しない例を挙げます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
D & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$
それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、このゲームには狭義の最適反応からなる組、すなわち狭義の純粋戦略ナッシュ均衡は存在しません。
狭義の純粋戦略ナッシュ均衡が存在する場合、それは1つだけであるとは限りません。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 2^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$
それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( U,L\right) ,\ \left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これらはともに狭義の純粋戦略ナッシュ均衡です。
演習問題
- 戦略型ゲーム\(G\)において純粋戦略の組\(s_{I}^{\ast}\in S_{I}\)が狭義の純粋戦略ナッシュ均衡である場合には、\(s_{I}^{\ast }\)は広義の純粋戦略ナッシュ均衡であることを示してください。
- 戦略型ゲーム\(G\)において純粋戦略の組\(s_{I}^{\ast}\in S_{I}\)が広義の純粋戦略ナッシュ均衡である場合には、\(s_{I}^{\ast }\)は狭義の純粋戦略ナッシュ均衡であるとは限らないことを示してください。
- 狭義の純粋戦略ナッシュ均衡と広義の純粋戦略ナッシュ均衡の双方が存在しないような戦略型ゲーム\(G\)の例を挙げてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】