混合ナッシュ均衡が与えられたとき、任意のプレイヤーにとって、自身の均衡戦略において正の確率を与えられている任意の純戦略は他のプレイヤーたちの均衡戦略の組に対する最適反応になります。また、この逆の関係も成立します。

混合ナッシュ均衡 最適反応

2019年5月18日:公開

混合最適反応から生成される純最適反応

戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においてプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する最適反応である場合には、\(\sigma _{i}^{\ast }\)において正の確率が与えられている任意の純戦略もまた\(\sigma _{-i}\)に対する最適反応になります。つまり、\(\sigma _{-i}\)に対する最適反応\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\)において正の確率が与えられている任意の純戦略はいずれも\(\sigma _{i}^{\ast }\)と等しい期待利得をプレイヤー\(i\)にもたらします。

命題(混合最適反応から生成される純最適反応)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する最適反応であるならば、\(\sigma _{i}^{\ast }\)において正の確率を与えられている任意の純戦略もまた\(\sigma _{-i}\)に対する最適反応となる。すなわち、\(\sigma _{i}^{\ast }\left( s_{i}^{\ast }\right) >0\)を満たす任意の\(s_{i}^{\ast }\in S_{i}\)に対して、\begin{equation*}
\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}(s_{i}^{\ast },\sigma _{-i})=F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つ。
証明を見る(プレミアム会員限定)
例(混合最適反応から生成される純最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,\ 1 & 1,\ -1 \\ \hline
B & 1,\ -1 & -1,\ 1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略を、\begin{equation*}
\sigma _{i}=(\sigma _{i},1-\sigma _{i})\quad (0\leq \sigma _{i}\leq 1)
\end{equation*}で表します。ただし、カッコ中の\(\sigma _{i}\)は混合戦略\(\sigma _{i}\)のもとでプレイヤー\(i\)が\(A\)を選ぶ確率\(\sigma _{i}(A)\)であり、\(B\)を選ぶ確率\(\sigma _{i}\left( B\right) \)は\(1-\sigma _{i}\)です。プレイヤー\(2\)の混合戦略\(\sigma _{2}^{\prime }=\frac{1}{2}\)に対して、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)を選ぶ場合の期待利得は、\begin{equation*}
F_{1}\left( \sigma _{1},\sigma _{2}^{\prime }\right) =\frac{-\sigma _{1}+\sigma _{1}+\left( 1-\sigma _{1}\right) -\left( 1-\sigma _{1}\right) }{2}=0
\end{equation*}となるため、\(\sigma _{2}^{\prime }\)に対するプレイヤー\(1\)の混合最適反応\(\sigma _{1}^{\ast }\)は任意の混合戦略です。したがって、例えば\(\sigma _{1}=\frac{1}{2}\)もまた\(\sigma _{1}^{\ast }\)の1つですから、先の命題より、純戦略\(A,B\)はともに\(\sigma _{2}^{\prime }\)に対する純最適反応です。実際に、\begin{eqnarray*}
F_{1}\left( A,\sigma _{2}^{\prime }\right) &=&\frac{-\sigma _{1}+\sigma _{1}}{2}=0 \\
F_{1}\left( B,\sigma _{2}^{\prime }\right) &=&\frac{\left( 1-\sigma _{1}\right) -\left( 1-\sigma _{1}\right) }{2}=0
\end{eqnarray*}が成り立つため、\(A,B\)はともに最大の期待利得をもたらします。

 

純最適反応から生成される混合最適反応

先の命題とは逆に、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の最適反応であるような純戦略が存在する場合には、そのような純戦略にのみ正の確率を付与する任意の混合戦略もまた\(\sigma _{-i}\)に対する最適反応になります。

命題(純最適反応から生成される混合最適反応)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)以外のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対するプレイヤー\(i\)の純最適反応が存在するとき、そのような純最適反応に非負の確率を割り当て、その他の純戦略には確率\(0\)を割り当てるプレイヤー\(i\)の任意の混合戦略は、\(\sigma _{-i} \)に対する混合最適反応になる。
証明を見る(プレミアム会員限定)
例(純最適反応から生成される混合最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,\ 1 & 1,\ -1 \\ \hline
B & 1,\ -1 & -1,\ 1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略を、\begin{equation*}
\sigma _{i}=(\sigma _{i},1-\sigma _{i})\quad (0\leq \sigma _{i}\leq 1)
\end{equation*}で表します。ただし、カッコ中の\(\sigma _{i}\)は混合戦略\(\sigma _{i}\)のもとでプレイヤー\(i\)が\(A\)を選ぶ確率\(\sigma _{i}(A)\)であり、\(B\)を選ぶ確率\(\sigma _{i}\left( B\right) \)は\(1-\sigma _{i}\)です。プレイヤー\(2\)の混合戦略\(\sigma _{2}\)に対して、プレイヤー\(1\)の純戦略\(A,B\)がもたらす期待利得はそれぞれ、\begin{eqnarray*}
F_{1}\left( A,\sigma _{2}\right) &=&-\sigma _{2}+\left( 1-\sigma _{2}\right) =1-2\sigma _{2} \\
F_{2}\left( B,\sigma _{2}\right) &=&\sigma _{2}-\left( 1-\sigma _{2}\right) =2\sigma _{2}-1
\end{eqnarray*}となります。したがって、\(F_{1}\left( A,\sigma _{2}\right) >F_{2}\left( B,\sigma _{2}\right) \)すなわち\(\sigma _{2}<\frac{1}{2}\)の場合には\(A\)が\(\sigma _{2}\)に対する純最適反応であり、\(F_{1}\left( A,\sigma _{2}\right) <F_{2}\left( B,\sigma _{2}\right) \)すなわち\(\sigma _{2}>\frac{1}{2}\)の場合には\(B\)が\(\sigma _{2}\)に対する純最適反応であり、\(F_{1}\left( A,\sigma _{2}\right) =F_{2}\left( B,\sigma _{2}\right) \)すなわち\(\sigma _{2}=\frac{1}{2}\)の場合には\(A,B\)がともに\(\sigma _{2}\)に対する純最適反応です。特に、\(\sigma _{2}=\frac{1}{2}\)の場合には、先の命題より、\(A\)と\(B\)に正の確率を付与する任意の混合戦略\(\sigma _{1}\)は\(\sigma _{2}\)に対する混合最適反応となります。

 

混合ナッシュ均衡の特徴づけ

以上の2つの命題を踏まえると、最適反応を以下のように特徴づけることができます。

命題(最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。このとき、\(\sigma _{i}\)において正の確率を与えられている任意の純戦略が\(\sigma _{-i}\)に対する最適反応であることは、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する最適反応であるための必要十分条件である。
証明を見る(プレミアム会員限定)

混合ナッシュ均衡は混合最適反応の組ですから、上の命題より以下が得られます。

系(混合ナッシュ均衡の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)を選ぶ。このとき、任意のプレイヤー\(i\in I\)について、\(\sigma _{i}^{\ast }\)において正の確率を与えられている任意の純戦略が\(\sigma _{-i}^{\ast }\)に対する最適反応であることは、\(\sigma _{I}^{\ast }\)が\(G^{\ast }\)における混合ナッシュ均衡であるための必要十分条件である。

混合ナッシュ均衡\(\sigma _{I}^{\ast }\)では任意のプレイヤー\(i\)にとって、他のプレイヤーたちの均衡戦略の組\(\sigma _{-i}^{\ast }\)が与えられたときに、自身の均衡戦略\(\sigma _{i}^{\ast }\)において正の確率で選ばれる任意の純戦略は等しい期待利得をもたらすとともに、それらの純戦略がもたらす期待利得は\(\sigma _{i}^{\ast }\)において選ばれない純戦略がもたらす期待利得以上になります。

例(混合ナッシュ均衡の特徴づけ)
以下の利得行列で表される戦略型ゲームについて考えます。

$$\begin{array}{cccc}
\hline
1\diagdown 2 & L & C & R \\ \hline
U & 1,-1 & -1,1 & -10,-10 \\ \hline
M & -1,1 & 1,-1 & -10,-10 \\ \hline
D & -10,-10 & -10,-10 & -20,-20 \\ \hline
\end{array}$$

表:利得行列

このゲームには純戦略ナッシュ均衡は存在しません。その一方で、プレイヤー\(1,2\)の混合戦略をそれぞれ、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( M\right) ,\sigma _{1}\left( D\right) \right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( C\right) ,\sigma _{2}\left( R\right) \right)
\end{eqnarray*}で表記するとき、導出のプロセスは省略しますが、このゲームの混合ナッシュ均衡は、\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \left( \frac{1}{2},\frac{1}{2},0\right) ,\left( \frac{1}{2},\frac{1}{2},0\right) \right)
\end{equation*}であり、そこでの期待利得は、\begin{equation*}
F_{1}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =F_{2}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =0
\end{equation*}となります。さて、プレイヤー\(2\)の均衡戦略\(\sigma _{2}^{\ast }\)を所与とするとき、プレイヤー\(1\)がそれぞれの純戦略から得る期待利得は、\begin{eqnarray*}
F_{1}\left( A,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\cdot \left( -1\right) +0\cdot \left( -10\right) =0 \\
F_{1}\left( B,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot \left( -1\right) +\frac{1}{2}\cdot 1+0\cdot \left( -10\right) =0 \\
F_{1}\left( C,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot \left( -10\right) +\frac{1}{2}\cdot \left( -10\right) +0\cdot \left( -20\right) =-10
\end{eqnarray*}となります。したがって、\(\sigma _{2}^{\ast }\)に対するプレイヤー\(1\)の純最適反応は\(A\)と\(B\)ですが、これらはいずれも自身の均衡戦略\(\sigma _{1}^{\ast }\)において正の確率を与えられた純戦略です。しかも、これらの純最適反応から得られる期待利得\(0\)は混合ナッシュ均衡\(\sigma _{I}^{\ast }\)においてプレイヤー\(1\)が得る期待利得\(0\)に等しく、なおかつ、混合ナッシュ均衡において確率\(0\)が付与された純戦略\(C\)から得られる期待利得\(-10\)は、純最適反応\(A,B\)から得られる期待利得より小さくなっています。プレイヤー\(2\)に関しても同様の議論が成立するため、この結果は先の命題と整合的です。

今回証明した命題は混合ナッシュ均衡を特定する際にも活用することができます。次回は混合ナッシュ均衡を特定する方法を解説します。
次へ進む 演習問題(プレミアム会員限定)