戦略型ゲームにおいてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに狭義の混合最適反応になっているならば、その組を狭義の混合ナッシュ均衡と呼びます。

2019年5月17日:公開

狭義の混合最適反応

狭義の純最適反応の概念は戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)に対しても容易に拡張可能です。具体的には、混合拡張\(G^{\ast }\)においてプレイヤー\(i\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に直面したときに、自分のある混合戦略\(\sigma _{i}^{\ast }\)が自分の期待利得を狭義に最大化するならば、すなわち、\begin{equation*}
\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \{\sigma _{i}^{\ast }\}:F_{i}(\sigma _{i}^{\ast },\sigma _{-i})>F_{i}(\sigma _{i},\sigma _{-i})
\end{equation*}が成り立つならば、\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する狭義の混合最適反応(strict mixed best response)であると言います。

定義より自明ですが、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)の他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する狭義の混合最適反応であるならば、それは\(\sigma _{-i}\)に対する混合最適反応でもあります。

命題(狭義の混合最適反応は混合最適反応)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においてプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right)\)に対する狭義の混合最適反応であるならば、\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する混合最適反応でもある。

逆は成り立つとは限りません。つまり、混合最適反応は狭義の混合最適反応であるとは限りません。

例(狭義の混合最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 5,5 & 0,8 \\ \hline
B & 8,0 & 2,2 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略を\(\sigma _{i}=\sigma _{i}\left( A\right) \)で表現します。このとき\(\sigma _{i}\left( B\right) =1-\sigma _{i}\)です。さて、プレイヤー\(2\)の混合戦略\(\sigma _{2}=\frac{1}{2}\)が与えられたとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)のもとで得る期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&5\cdot \frac{\sigma _{1}}{2}+0\cdot \frac{\sigma _{1}}{2}+8\cdot \frac{1-\sigma _{1}}{2}+2\cdot \frac{1-\sigma _{1}}{2} \\
&=&-\frac{5}{2}\sigma _{1}+5
\end{eqnarray*}であるため、この\(\sigma _{2}\)に対するプレイヤー\(1\)の狭義の混合最適反応は\(\sigma _{1}^{\ast }=0\)です。

以下の例が示すように、狭義の混合最適反応は存在するとは限りません。

例(狭義の混合最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略を\(\sigma _{i}=\sigma _{i}\left( A\right) \)で表現します。このとき\(\sigma _{i}\left( B\right) =1-\sigma _{i}\)です。さて、プレイヤー\(2\)の混合戦略\(\sigma _{2}=\frac{1}{2}\)が与えられたとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)のもとで得る期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\left( -1\right) \cdot \frac{\sigma _{1}}{2}+1\cdot \frac{\sigma _{1}}{2}+1\cdot \frac{1-\sigma _{1}}{2}+\left( -1\right) \cdot \frac{1-\sigma _{1}}{2} \\
&=&0
\end{eqnarray*}であるため、この\(\sigma _{2}\)に対するプレイヤー\(1\)の狭義の混合最適反応は存在しません。

 

狭義の混合ナッシュ均衡

狭義の純ナッシュ均衡の概念は戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)に対しても容易に拡張できます。繰り返しになりますが、混合拡張\(G^{\ast }\)においてプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する狭義の混合最適反応であるとは、\begin{equation*}
\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \{\sigma _{i}^{\ast }\}:F_{i}(\sigma _{i}^{\ast },\sigma _{-i})>F_{i}(\sigma _{i},\sigma _{-i})
\end{equation*}が成り立つことを意味します。さらに、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right) _{i\in I}\)において、任意のプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}^{\ast }\)に対する狭義の混合最適反応になっているならば、すなわち、\begin{equation*}
\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \{\sigma _{i}^{\ast }\}:F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })>F_{i}(\sigma _{i},\sigma _{-i}^{\ast })
\end{equation*}が成り立つならば、\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)の狭義の混合ナッシュ均衡(strict mixed Nash equilibrium)と呼びます。

混合戦略の組\(\sigma _{I}^{\ast }\)が狭義の混合ナッシュ均衡であるものとします。また、プレイヤー\(i\)を任意に選びます。他のプレイヤーたちが混合ナッシュ均衡にしたがい\(\sigma _{-i}^{\ast }\)をプレーすることを前提とするとき、プレイヤー\(i\)だけが狭義の混合ナッシュ均衡から逸脱して\(\sigma _{i}^{\ast }\)とは違う混合戦略\(\sigma _{i}\)を選ぶと、狭義の混合ナッシュ均衡の定義より、プレイヤー\(i\)の期待利得は下がってしまいます。

例(狭義の混合ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略を、\begin{equation*}
\sigma _{i}=(\sigma _{i},1-\sigma _{i})\quad (0\leq \sigma _{i}\leq 1)
\end{equation*}で表します。ただし、\(\sigma _{i}\)は混合戦略\(\sigma _{i}\)のもとでプレイヤー\(i\)が純戦略\(A\)を選ぶ確率\(\sigma _{i}(A)\)であり、純戦略\(B\)を選ぶ確率\(\sigma _{i}\left( B\right) \)は\(1-\sigma _{i}\)です。以前に示したように、このゲームの混合ナッシュ均衡は、\begin{equation*}
\left( \sigma _{1},\sigma _{2}\right) =\left( 0,1\right) ,\ \left( \frac{1}{2},\frac{1}{2}\right) ,\ \left( 1,0\right)
\end{equation*}の 3 つです。以下では狭義の混合ナッシュ均衡を求めます。プレイヤー\(1\)の期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&-\sigma _{1}\sigma _{2}+\sigma _{1}\left( 1-\sigma _{2}\right) +\left( 1-\sigma _{1}\right) \sigma _{2}-\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{2}-1\right) \left( 1-2\sigma _{1}\right)
\end{eqnarray*}であるため、\(\sigma _{2}\)に対するプレイヤー\(1\)の狭義の混合最適反応\(\sigma _{1}^{\ast }\)は、\(\sigma _{2}>\frac{1}{2}\)の場合には\(\sigma _{1}^{\ast }=0\)、\(\sigma _{2}<\frac{1}{2}\)の場合には\(\sigma _{1}^{\ast }=1\)、そして、\(\sigma _{2}=\frac{1}{2}\)の場合には\(\sigma _{1}^{\ast }\)は存在しません。他方で、プレイヤー\(2\)の期待利得は、\begin{eqnarray*} F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sigma _{1}\sigma _{2}-\sigma _{1}\left( 1-\sigma _{2}\right) -\left( 1-\sigma _{1}\right) \sigma _{2}+\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\ &=&\left( 2\sigma _{1}-1\right) \left( 1-2\sigma _{2}\right) \end{eqnarray*}であるため、\(\sigma _{1}\)に対するプレイヤー\(2\)の狭義の混合最適反応\(\sigma _{2}^{\ast }\)は、\(\sigma _{1}>\frac{1}{2}\)の場合には\(\sigma _{2}^{\ast }=0\)、\(\sigma _{1}<\frac{1}{2}\)の場合には\(\sigma _{2}^{\ast }=1\)、そして、\(\sigma _{1}=\frac{1}{2}\)の場合には\(\sigma _{2}^{\ast }\)は存在しません。

図:狭義の混合ナッシュ均衡

プレイヤー\(1\)の狭義の混合最適反応を上図の赤いグラフで、プレイヤー\(2\)の狭義の混合最適反応を上図の青いグラフでそれぞれ図示しました。狭義の混合ナッシュ均衡は狭義の混合最適反応の組であるため、2 つのグラフが交わる点が狭義の混合ナッシュ均衡です。したがって、狭義の混合ナッシュ均衡は、\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 0,1\right) ,\ \left( 1,0\right)
\end{equation*}の 2 つです。

 

混合ナッシュ均衡との関係

プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する狭義の混合最適反応であるならば、それは\(\sigma _{-i}\)に対する混合最適反応でもあります。したがって、狭義の混合ナッシュ均衡は同時に通常の混合ナッシュ均衡でもあります。

命題(狭義の混合ナッシュ均衡は混合ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においてプレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)が狭義の混合ナッシュ均衡であるならば、\(\sigma _{I}^{\ast }\)は混合ナッシュ均衡でもある。

逆は成り立つとは限りません。つまり、混合ナッシュ均衡は狭義の混合ナッシュ均衡であるとは限りません。

 

狭義の混合ナッシュ均衡は存在するとは限らない

狭義の混合ナッシュ均衡は同時に混合ナッシュ均衡でもあります。また、一般に無限ゲームの混合拡張に混合ナッシュ均衡は存在するとは限りません。したがって、無限ゲームの混合拡張に狭義の混合ナッシュ均衡は存在するとは限りません。

ナッシュの定理より、有限ゲームの混合拡張には必ず混合ナッシュ均衡が存在します。一方、たとえ有限ゲームの混合拡張であっても、狭義の混合ナッシュ均衡は存在するとは限りません。以下のゲームはそのような例になっています。

例(狭義の混合ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。明らかにこれは有限ゲームです。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 0,0 & 0,0 \\ \hline
B & 0,0 & 0,0 \\ \hline
\end{array}$$

表:利得行列

任意の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)に対して、\begin{equation*}
F_{1}\left( \sigma _{1},\sigma _{2}\right) =F_{2}\left( \sigma _{1},\sigma _{2}\right) =0
\end{equation*}となるため、任意の\(\sigma _{1}\)に対して任意の\(\sigma _{2}\)は混合最適反応であり、逆に任意の\(\sigma _{1}\)に対して任意の\(\sigma _{2}\)は混合最適であるため、任意の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)が混合ナッシュ均衡となります。一方、任意の\(\sigma _{1}\)に対してプレイヤー\(2\)は狭義の混合最適反応を持たず、同時に任意の\(\sigma _{2}\)に対してプレイヤー\(1\)は狭義の混合最適反応を持たないため、このゲームには狭義の混合ナッシュ均衡は存在しません。

 

狭義の混合ナッシュ均衡は一意的とは限らない

一般に狭義の純ナッシュ均衡は狭義の混合ナッシュ均衡でもあり、さらに狭義の純ナッシュ均衡は一意的であるとは限らないことを踏まえると、狭義の混合ナッシュ均衡もまた一意的であるとは限りません。

次回は混合ナッシュ均衡と純最適反応の関係を解説します。
次へ進む 演習問題(プレミアム会員限定)