最適反応と戦略どうしの支配関係
問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。
プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの何らかの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する広義の最適反応である場合、すなわち、\begin{equation*}\exists s_{-i}\in S_{-i},\ \forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) \geq u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つ場合、\(s_{i}^{\ast}\)は自身の他のいかなる純粋戦略によっても狭義支配されません。つまり、\begin{equation*}\forall s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left(
s_{i}^{\ast },s_{-i}\right)
\end{equation*}を満たす\(s_{i}\in S_{i}\backslash \left\{s_{i}^{\ast }\right\} \)は存在しません。
広義の最適反応は狭義支配されないことが明らかになりましたが、広義の最適反応が広義支配されることはあります。以下の例より明らかです。
$$\begin{array}{|c|c|c|}
\hline
1/2 & L & R \\ \hline
T & 1^{\ast },1^{\ast } & 0^{\ast },0 \\ \hline
B & 0,0^{\ast } & 0^{\ast },0^{\ast } \\ \hline
\end{array}$$
表ではプレイヤーが広義の最適反応を選んだ場合に得られる利得に\(\ast \)を記してあります。プレイヤー\(1\)の純粋戦略\(B\)はプレイヤー\(2\)の純粋戦略\(R\)に対する広義の最適反応の1つです。その一方で、プレイヤー\(1\)の純粋戦略\(T\)は広義支配戦略であるため、\(B\)は\(T\)によって広義支配されます。
広義の最適反応は狭義支配されることはない一方で、広義支配される可能性があることが明らかになりました。一方、狭義の最適反応は広義支配される可能性はありません。つまり、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの何らかの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する狭義の最適反応である場合には、すなわち、\begin{equation*}\exists s_{-i}\in S_{-i},\ \forall s_{i}\backslash \left\{ s_{i}^{\ast
}\right\} \in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) >u_{i}\left(
s_{i},s_{-i}\right)
\end{equation*}が成り立つ場合には、\begin{equation*}
\forall s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) \geq u_{i}\left(
s_{i}^{\ast },s_{-i}\right)
\end{equation*}を満たす\(s_{i}\in S_{i}\backslash \left\{s_{i}^{\ast }\right\} \)は存在しません。
ナッシュ均衡と戦略の支配関係
広義の最適反応は狭義支配されないことが明らかになりました。以上の事実に加え、広義の純粋戦略ナッシュ均衡は広義の最適反応の組として定義されることを踏まえると以下を得ます。
広義の純粋戦略ナッシュ均衡を構成する均衡戦略は狭義支配されないことが明らかになりましたが、広義の純粋戦略ナッシュ均衡を構成する均衡戦略が広義支配されることはあります。以下の例より明らかです。
$$\begin{array}{|c|c|c|}
\hline
1/2 & L & R \\ \hline
T & 1^{\ast },1^{\ast } & 0^{\ast },0 \\ \hline
B & 0,0^{\ast } & 0^{\ast },0^{\ast } \\ \hline
\end{array}$$
表ではプレイヤーが広義の最適反応を選んだ場合に得られる利得に\(\ast \)を記してあります。表から明らかであるように、\begin{equation*}\left( T,L\right) ,\ \left( B,R\right)
\end{equation*}はともに広義の純粋戦略ナッシュ均衡です。\(\left( B,R\right) \)におけるプレイヤー\(1\)の均衡戦略\(B\)は自身の純粋戦略\(T\)によって広義支配されます。
広義の純粋戦略ナッシュ均衡の均衡戦略は狭義支配されることはない一方で、広義支配される可能性があることが明らかになりました。一方、狭義の純粋戦略ナッシュ均衡の均衡戦略が広義支配される可能性はありません。
純粋戦略ナッシュ均衡と支配される戦略の逐次消去
戦略型ゲーム\(G\)に広義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\in S_{I}\)が存在するものとします。この場合、任意のプレイヤー\(i\in I\)の均衡戦略\(s_{i}^{\ast }\)は自身の他の任意の純粋戦略によって狭義支配されないため、このゲーム\(G\)に対して純粋戦略によって狭義支配される戦略の逐次消去を適用した場合、\(s_{I}^{\ast }\)を構成する任意の戦略は消去されません。したがって、このゲームが\(G\)が逐次消去によって解けるかどうかとは関係なく、最終的な結果の中に\(s_{I}^{\ast}\)が含まれることが保証されます。
戦略型ゲームに広義の純粋戦略ナッシュ均衡が存在する場合、それは狭義支配される戦略の逐次消去によって消去されずに最後まで残ることが明らかになりました。ただ、ゲームは逐次消去によって解けるとは限らず、最終的に複数の戦略の組が残る場合もあります。そのような場合、先の命題より、残された戦略の組の中にはナッシュ均衡が必ず含まれますが、その一方で、ナッシュ均衡ではないような戦略の組が残る場合もあります。以下の例より明らかです。
$$\begin{array}{|c|c|c|c|}
\hline
1/2 & L & C & R \\ \hline
T & 0,4^{\ast } & 4^{\ast },0 & 5,3 \\ \hline
M & 4^{\ast },0 & 0,4^{\ast } & 5,3 \\ \hline
B & 3,5 & 3,5 & 6^{\ast },6^{\ast } \\ \hline
\end{array}$$
表ではプレイヤーが広義の最適反応を選んだ場合に得られる利得に\(\ast \)を記してあります。表より、純粋戦略の組\begin{equation*}\left( B,R\right)
\end{equation*}が広義の純粋戦略ナッシュ均衡である一方、それ以外の任意の純粋戦略の組は広義の純粋戦略ナッシュ均衡ではありません。一方、任意のプレイヤーは広義支配される純粋戦略を持たないため、狭義支配される戦略の逐次消去を適用するとすべての純粋戦略の組が消去されずに残ります。
戦略型ゲームに広義の純粋戦略ナッシュ均衡が存在する場合、それは狭義支配される戦略の逐次消去によって消去されずに最後まで残りますが、その一方で、ナッシュ均衡とは異なる戦略の組もまた消去されずに場合もあることが明らかになりました。一方、そのゲームが狭義支配される戦略の逐次消去によって解ける場合、最終的に残るのは純粋戦略の1つの組だけですが、それは広義の純粋戦略ナッシュ均衡であることが保証されます。しかも、それはゲームにおける唯一の広義の純粋戦略ナッシュ均衡です。
$$\begin{array}{|c|c|c|c|}
\hline
1\diagdown 2 & L & C & R \\ \hline
U & 1^{\ast },0 & 1^{\ast },2^{\ast } & 0,1 \\ \hline
D & 0,3^{\ast } & 0,1 & 2^{\ast },0 \\ \hline
\end{array}$$
表ではプレイヤーが広義の最適反応を選んだ場合に得られる利得に\(\ast \)を記してあります。表より、純粋戦略の組\begin{equation*}\left( U,C\right)
\end{equation*}は広義の純粋戦略ナッシュ均衡です。続いて、狭義支配される戦略の逐次消去を適用します。プレイヤー\(2\)にとって\(R\)は\(C\)に狭義支配されるため、\(R\)を消去することにより、
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & C \\ \hline
U & 1^{\ast },0 & 1^{\ast },2^{\ast } \\ \hline
D & 0,3^{\ast } & 0,1 \\ \hline
\end{array}$$
が得られます。プレイヤー\(1\)にとって\(D\)は\(U\)に狭義支配されるため、\(D\)を消去することにより、
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & C \\ \hline
U & 1^{\ast },0 & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$
が得られます。プレイヤー\(2\)にとって\(L\)は\(C\)に狭義支配されるため、\(L\)を消去することにより、
$$\begin{array}{|c|c|}
\hline
1\diagdown 2 & C \\ \hline
U & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$
を得ます。これは先に特定した広義の純粋戦略ナッシュ均衡と一致しますが、以上の結果は先の命題の主張と整合的です。
混合戦略ナッシュ均衡と支配される戦略の逐次消去
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)に広義の混合戦略ナッシュ均衡\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在するものとします。この場合、任意のプレイヤー\(i\in I\)の均衡戦略\(\sigma _{i}^{\ast }\)において正の確率を付与される任意の純粋戦略は、純粋戦略によって狭義支配される戦略の逐次消去によって消去されません。したがって、このゲームが\(G\)が逐次消去によって解けるかどうかとは関係なく、最終的な結果の中に\(\sigma _{I}^{\ast }\)のもとで正の確率が付与される純粋戦略が含まれることが保証されます。
演習問題
$$\begin{array}{|c|c|c|c|}
\hline
1\diagdown 2 & L & C & R \\ \hline
U & 1,4 & 2,5 & 5,3 \\ \hline
M & 7,2 & 1,0 & 4,0 \\ \hline
D & 5,10 & 0,2 & 5,3 \\ \hline
\end{array}$$
- 狭義支配される純粋戦略の逐次消去を適用してください。
- 純粋戦略ナッシュ均衡を求めてください。
- 混合戦略ナッシュ均衡を求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】