混合戦略ナッシュ均衡の導出方法

混合ナッシュ均衡を比較的簡単に導出するための具体的な方法を紹介します。
混合ナッシュ均衡

混合戦略最適反応の特徴づけ

復習になりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する最適反応であることは、\begin{equation}
\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right) \tag{1}
\end{equation}が成り立つことを意味します。つまり、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)が与えられたとき、プレイヤー\(i\)の期待利得は混合戦略\(\sigma _{i}^{\ast }\)のもとで最大化されるということです。ただ、たとえプレイヤー\(i\)が有限個の純粋戦略を持つ場合でも混合戦略の個数は無限であり、無限個の混合戦略を対象に\(\left( 1\right) \)が成り立つことを確認するのは実質的に不可能です。混合戦略の組\(\sigma _{-i}\)に対する最適反応であるような混合戦略\(\sigma _{i}^{\ast }\)を特定する場合、作業を効率的に行うための指針が必要です。

最も重要な指針は、まず、混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の最適反応を純粋戦略の範囲内で特定する、というものです。つまり、\begin{equation}
\forall s_{i}\in S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}\right) \geq
F_{i}\left( s_{i},\sigma _{-i}\right) \tag{2}
\end{equation}を満たすようなプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)をまずは特定します。このような純粋戦略は1つであるとは限らないため、\(\left( 2\right) \)を満たすプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)からなる集合を\(S_{i}^{\ast }\)で表します。\(S_{i}^{\ast }\subset S_{i}\)です。その上で、\(S_{i}^{\ast }\)に属する純粋戦略だけに非負の確率を付与するプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)を任意に選びます。つまり、\begin{eqnarray*}
&&\left( a\right) \ \forall s_{i}^{\ast }\in S_{i}^{\ast }:\sigma _{i}^{\ast
}\left( s_{i}^{\ast }\right) \geq 0 \\
&&\left( b\right) \ \forall s_{i}\in S_{i}\backslash S_{i}^{\ast }:\sigma
_{i}^{\ast }\left( s_{i}\right) =0 \\
&&\left( c\right) \ \sum_{s_{i}^{\ast }\in S_{i}^{\ast }}\sigma _{i}^{\ast
}\left( s_{i}^{\ast }\right) =1
\end{eqnarray*}を満たす混合戦略\(\sigma _{i}^{\ast }\)を任意に選ぶということです。このとき、この混合戦略\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する最適反応であることが保証されます(演習問題にします)。

命題(最適な純粋戦略が生成する混合戦略最適反応)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選んだ上で、\(\sigma _{-i}\)のもとでプレイヤー\(i\)の期待利得を最大化するようなプレイヤー\(i\)の純粋戦略からなる\(S_{i}\)の部分集合を\(S_{i}^{\ast }\)で表す。\(S_{i}^{\ast }\)の要素である純粋戦略にのみ非負の確率を割り当てる混合戦略を任意に選ぶと、その混合戦略は\(\sigma _{-i}\)に対する最適反応になる。
証明を見る(プレミアム会員限定)
例(最適な純粋戦略が生成する混合戦略最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(2\)の混合戦略\(\sigma _{2}\)を任意に選んだ上で、それに対してプレイヤー\(1\)の純粋戦略\(A,B\)がもたらす期待利得をそれぞれ求めると、\begin{eqnarray*}
F_{1}\left( A,\sigma _{2}\right) &=&-\sigma _{2}+\left( 1-\sigma
_{2}\right) =1-2\sigma _{2} \\
F_{2}\left( B,\sigma _{2}\right) &=&\sigma _{2}-\left( 1-\sigma _{2}\right)
=2\sigma _{2}-1
\end{eqnarray*}を得ます。両者を比較すると、まず、\begin{equation*}
F_{1}\left( A,\sigma _{2}\right) >F_{2}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}<\frac{1}{2}
\end{equation*}という関係が成り立つため、\(\sigma _{2}<\frac{1}{2}\)を満たすような任意の\(\sigma _{2}\)に対するプレイヤー\(1\)の最適反応は\(A\)すなわち\(\sigma _{1}=1\)です。また、\begin{equation*}
F_{1}\left( A,\sigma _{2}\right) <F_{2}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}>\frac{1}{2}
\end{equation*}という関係が成り立つため、\(\sigma _{2}>\frac{1}{2}\)を満たすような任意の\(\sigma _{2}\)に対するプレイヤー\(1\)の最適反応は\(B\)すなわち\(\sigma _{1}=0\)です。また、\begin{equation*}
F_{1}\left( A,\sigma _{2}\right) =F_{2}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}=\frac{1}{2}
\end{equation*}という関係が成り立つため、プレイヤー\(1\)の純粋戦略\(A,B\)はともに\(\sigma _{2}=\frac{1}{2}\)に対する最適反応です。したがって先の命題より、\(A\)と\(B\)に非負の確率を付与する混合戦略、すなわち任意の混合戦略が\(\sigma _{2}=\frac{1}{2}\)に対する最適反応になります。

他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の最適反応を純粋戦略の範囲で特定した上で、そのような純粋戦略にのみ非負の確率を付与する混合戦略を構成すれば、それは\(\sigma _{-i}\)に対する混合戦略最適反応になることが明らかになりました。実は、その逆もまた成立します。つまり、\(\sigma _{-i}\)に対する混合戦略最適反応\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略もまた\(\sigma _{-i}\)に対する最適反応になります。しかも、それは純粋戦略の中でも最大の期待効用をもたらす戦略という意味に限定されず、混合戦略を含めたすべての戦略の中で最大の期待効用をもたらす戦略です。つまり、\(\sigma _{-i}\)に対する混合戦略最適反応\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\left( s_{i}\right) >0\)を満たす任意の純粋戦略\(s_{i}\)は\(\sigma _{i}^{\ast }\)と等しい期待利得をもたらすということです(演習問題にします)。

命題(混合戦略最適反応が生成する最適な純粋戦略)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が\(\sigma _{-i}\)に対する最適反応であるならば、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略もまた\(\sigma _{-i}\)に対する混合戦略最適反応となる。すなわち、\(\sigma _{i}^{\ast }\left( s_{i}^{\ast }\right) >0\)を満たす任意の\(s_{i}^{\ast }\in S_{i}\)について、\begin{equation*}
F_{i}(s_{i}^{\ast },\sigma _{-i})=F_{i}\left( \sigma _{i}^{\ast },\sigma
_{-i}\right)
\end{equation*}が成り立つ。
証明を見る(プレミアム会員限定)
例(混合戦略最適反応が生成する最適な純粋戦略)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\frac{1}{2}\left( -\sigma
_{1}+\left( 1-\sigma _{1}\right) \right) +\frac{1}{2}\left( \sigma
_{1}-\left( 1-\sigma _{1}\right) \right) \\
&=&0
\end{eqnarray*}となり定数であるため、任意の\(\sigma _{1}\)が\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応となります。したがって、例えば、\(\sigma _{1}=\frac{1}{2}\)もまた\(\sigma _{2}=\frac{1}{2}\)に対する最適反応です。\(\sigma _{1}=\frac{1}{2}\)は純粋戦略\(A,B\)の双方に対して正の確率を付与しているため、先の命題より、\(A,B\)もまた\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応です。実際、\begin{eqnarray*}
F_{1}\left( \frac{1}{2},\frac{1}{2}\right) &=&\frac{1}{2}\left( -1\cdot
\frac{1}{2}+1\cdot \frac{1}{2}\right) +\frac{1}{2}\left( 1\cdot \frac{1}{2}-1\cdot \frac{1}{2}\right) =0 \\
F_{1}\left( A,\frac{1}{2}\right) &=&\frac{1}{2}\left( -1\right) +\frac{1}{2}\cdot 1=0 \\
F_{1}\left( B,\frac{1}{2}\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\left(
-1\right) =0
\end{eqnarray*}であるため、\(\sigma _{1}=\frac{1}{2}\)と\(A\)と\(B\)は等しい期待利得をもたらします。

プレイヤー\(i\)の混合戦略\(\sigma _{i}\)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)をそれぞれ任意に選びます。また、\(\sigma _{i}\)が正の確率を付与する純粋戦略からなる\(S_{i}\)の部分集合を\(S_{i}^{\ast }\)で表します。すなわち、\begin{equation*}
S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}\left( s_{i}\right)
>0\right\}
\end{equation*}です。\(\sigma _{-i}\)を前提としたとき、\(S_{i}^{\ast }\)の要素である任意の純粋戦略が、純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化するものとします。つまり、\begin{equation}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( s_{i},\sigma _{-i}\right)
\tag{1}
\end{equation}が成り立つということです。このとき、先に示した命題より、\(\sigma _{i}\)は\(\sigma _{-i}\)に対する混合戦略最適反応であることが保証されます。逆に、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する混合戦略最適反応であるとき、直前に示した命題より、\(S_{i}^{\ast }\)の要素である任意の純粋戦略もまた\(\sigma _{-i}\)に対する混合戦略最適反応になります。つまり、\begin{equation}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall \sigma _{i}\in \Delta
\left( S_{i}\right) :F_{i}\left( s_{i}^{\ast },\sigma _{-i}\right) \geq
F_{i}\left( \sigma _{i},\sigma _{-i}\right) \tag{2}
\end{equation}が成り立つということです。純粋戦略は特別な混合戦略であるため、\(\left( 2\right) \)は\(\left( 1\right) \)を含意します。したがって、\(\sigma _{i}\)が\(\sigma _{-i}\)の混合最適反応であることと\(\left( 2\right) \)が成り立つことは必要十分であることが示されました。

命題(混合戦略最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。\(\sigma _{-i}\)を前提としたとき、\(\sigma _{i}\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、\(\sigma _{i}\)から以下の集合\begin{equation*}
S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}\left( s_{i}\right)
>0\right\}
\end{equation*}を定義したときに、\begin{equation*}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( s_{i},\sigma _{-i}\right)
\end{equation*}が成り立つことは、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する混合戦略最適反応であるための必要十分である。
証明を見る(プレミアム会員限定)

繰り返しになりますが、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の最適反応を純粋戦略の範囲で特定した上で、そのような純粋戦略にのみ非負の確率を付与する混合戦略を構成すれば、それは\(\sigma _{-i}\)に対する混合戦略最適反応になります。しかも、上の命題より、そのようにして得られる混合戦略の他に、\(\sigma _{-i}\)に対する混合戦略最適反応は存在しないことが保証されます。

 

混合戦略ナッシュ均衡の特徴づけ

有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)が混合戦略ナッシュ均衡であるものとします。混合戦略ナッシュ均衡の定義より、このとき、任意のプレイヤー\(i\in I\)について、均衡戦略\(\sigma _{i}^{\ast }\)は他のプレイヤーたちの均衡戦略\(\sigma _{-i}^{\ast }\)に対する混合戦略最適反応です。混合戦略最適反応の特徴づけに関する命題より、プレイヤー\(i\)の均衡戦略\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}
S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left( s_{i},\sigma
_{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{i}^{\ast }\)が\(\sigma _{-i}^{\ast }\)に対する混合戦略最適反応であるための必要十分です。したがって、上の条件が任意のプレイヤー\(i\)について成り立つことは、\(\sigma _{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分条件です。

命題(混合戦略ナッシュ均衡)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)を任意に選ぶ。このとき、任意のプレイヤー\(i\in I\)について、\(\sigma _{-i}^{\ast }\)を前提としたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、それぞれのプレイヤー\(i\)について\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}
S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall i\in I,\ \forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in
S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left(
s_{i},\sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分である。
証明を見る(プレミアム会員限定)
例(混合戦略ナッシュ均衡の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{cccc}
\hline
1\diagdown 2 & L & C & R \\ \hline
U & 1,-1 & -1,1 & -10,-10 \\ \hline
M & -1,1 & 1,-1 & -10,-10 \\ \hline
D & -10,-10 & -10,-10 & -20,-20 \\ \hline
\end{array}$$
表:利得行列

このゲームには純粋戦略ナッシュ均衡は存在しません(確認してください)。その一方で、プレイヤー\(1,2\)の混合戦略をそれぞれ、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( M\right)
,\sigma _{1}\left( D\right) \right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( C\right)
,\sigma _{2}\left( R\right) \right)
\end{eqnarray*}で表記するとき、以下の混合戦略の組\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \left( \frac{1}{2},\frac{1}{2},0\right) ,\left( \frac{1}{2},\frac{1}{2},0\right) \right)
\end{equation*}がナッシュ均衡であることを確認します。\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)においてそれぞれのプレイヤーが直面する期待利得は、\begin{equation*}
F_{1}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =F_{2}\left(
\sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =0
\end{equation*}となります。\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)におけるプレイヤー\(2\)の戦略\(\sigma _{2}^{\ast }\)を前提としたとき、プレイヤー\(1\)がそれぞれの純粋戦略から得る期待利得は、\begin{eqnarray*}
F_{1}\left( A,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\cdot \left( -1\right) +0\cdot \left( -10\right) =0 \\
F_{1}\left( B,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot \left(
-1\right) +\frac{1}{2}\cdot 1+0\cdot \left( -10\right) =0 \\
F_{1}\left( C,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot \left(
-10\right) +\frac{1}{2}\cdot \left( -10\right) +0\cdot \left( -20\right) =-10
\end{eqnarray*}となります。つまり、\(\sigma _{1}^{\ast }\)が正の確率を付与する純粋戦略\(A,B\)はいずれも、純粋戦略の範囲内でプレイヤー\(1\)の期待利得を最大化しています。また、\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)におけるプレイヤー\(1\)の戦略\(\sigma _{1}^{\ast }\)を前提としたとき、プレイヤー\(2\)がそれぞれの純粋戦略から得る期待利得は、\begin{eqnarray*}
F_{2}\left( \sigma _{1}^{\ast },L\right) &=&\frac{1}{2}\cdot \left(
-1\right) +\frac{1}{2}\cdot 1+0\cdot \left( -10\right) =0 \\
F_{2}\left( \sigma _{1}^{\ast },C\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\cdot \left( -1\right) +0\cdot \left( -10\right) =0 \\
F_{2}\left( \sigma _{1}^{\ast },R\right) &=&\frac{1}{2}\cdot \left(
-10\right) +\frac{1}{2}\cdot \left( -10\right) +0\cdot \left( -20\right) =-10
\end{eqnarray*}となります。つまり、\(\sigma _{2}^{\ast }\)が正の確率を付与する純粋戦略\(L,C\)はいずれも、純粋戦略の範囲内でプレイヤー\(2\)の期待利得を最大化しています。したがって、先の命題より、\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)が混合戦略ナッシュ均衡であることが保証されます。

 

混合戦略ナッシュ均衡の導出方法

繰り返しになりますが、混合戦略ナッシュ均衡に関して以下の命題が成り立ちます。

命題(混合戦略ナッシュ均衡)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)を任意に選ぶ。このとき、任意のプレイヤー\(i\in I\)について、\(\sigma _{-i}^{\ast }\)を前提としたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、それぞれのプレイヤー\(i\)について\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}
S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall i\in I,\ \forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in
S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left(
s_{i},\sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分である。
証明を見る(プレミアム会員限定)

この命題を利用すると、混合戦略ナッシュ均衡を比較的容易に求めることができます。以下が具体例です。

例(混合戦略ナッシュ均衡の導出方法)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 2,\ 1 & 0,\ 0 \\ \hline
B & 0,\ 0 & 1,\ 2 \\ \hline
\end{array}$$
表:利得行列

このゲームには2つの純粋戦略ナッシュ均衡\(\left( A,A\right) \)と\(\left( B,B\right) \)が存在します。では、純粋戦略ナッシュ均衡とは異なる混合戦略ナッシュ均衡は存在するでしょうか。プレイヤー\(i\ \left( =1,2\right) \)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)が純粋戦略ナッシュ均衡でないこととは、\(0<\sigma _{1}^{\ast }<1\)と\(0<\sigma _{2}^{\ast }<1\)の少なくとも一方が成り立つことを意味します。そこで、\(0<\sigma _{1}^{\ast }<1\)を満たす混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)が存在するものと仮定します。つまり、\(\sigma _{1}^{\ast }\)は純粋戦略\(A,B\)の双方に正の確率を付与するため、先の命題より、\(\sigma _{1}^{\ast }\)が均衡戦略であることと、\(A,B\)がともに純粋戦略の範囲でプレイヤー\(1\)の期待利得を最大化すること、すなわち、\begin{equation}
F_{1}\left( A,\sigma _{2}^{\ast }\right) =F_{1}\left( B,\sigma _{2}^{\ast
}\right) \tag{1}
\end{equation}が成り立つことは必要十分です。\(\left( 1\right) \)を解くと\(\sigma _{2}^{\ast }=\frac{2}{3}\)を得ます(確認してください)。つまり、\(0<\sigma _{1}^{\ast }<1\)を満たす混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)において\(\sigma _{2}^{\ast }\ \left( =\frac{2}{3}\right) \)は純粋戦略\(A,B\)の双方に正の確率を付与するため、先の命題より、\(\sigma _{2}^{\ast }\ \left( =\frac{2}{3}\right) \)が均衡戦略であることと、\(A,B\)がともに純粋戦略の範囲でプレイヤー\(2\)の期待利得を最大化すること、すなわち、\begin{equation}
F_{2}\left( \sigma _{1}^{\ast },A\right) =F_{2}\left( \sigma _{1}^{\ast
},B\right) \tag{2}
\end{equation}が成り立つことは必要十分です。\(\left( 2\right) \)を解くと\(\sigma _{1}^{\ast }=\frac{1}{3}\)を得ます。したがって、このゲームには純粋戦略ナッシュ均衡とは異なる混合戦略ナッシュ均衡\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \frac{1}{3},\frac{2}{3}\right)
\end{equation*}が存在することが明らかになりました。

もう少し複雑な問題を考えます。

例(混合戦略ナッシュ均衡の導出方法)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{cccc}
\hline
1\diagdown 2 & R & S & P \\ \hline
R & 0,0 & 1,-1 & -1,1 \\ \hline
S & -1,1 & 0,0 & 1,-1 \\ \hline
P & 1,-1 & -1,1 & 0,0 \\ \hline
\end{array}$$
表:利得行列

このゲームはジャンケンを表しています。つまり、\(R\)はグー(Rock)、\(S\)はチョキ(Scissors)、\(P\)はパー(Paper)にそれぞれ対応しています。ジャンケンの勝者の利得を\(1\)、敗者の利得を\(-1\)、あいこの場合は両者の利得を\(0\)と定めています。このゲームには純粋戦略ナッシュ均衡が存在しません。では、混合戦略ナッシュ均衡は存在するでしょうか。プレイヤー\(i\ \left( =1,2\right) \)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\sigma _{i}=\left( \sigma _{i}\left( R\right) ,\sigma _{i}\left( S\right)
,\sigma _{i}\left( P\right) \right) =(r_{i},s_{i},1-r_{i}-s_{i})
\end{equation*}で表します。ただし、\(0\leq r_{i}\leq 1\)かつ\(0\leq s_{i}\leq 1\)です。混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)が存在するものと仮定し、プレイヤー\(i\)の均衡戦略\(\sigma _{i}^{\ast }\)を、\begin{equation*}
\sigma _{i}^{\ast }=\left( \sigma _{i}^{\ast }\left( R\right) ,\sigma
_{i}^{\ast }\left( S\right) ,\sigma _{i}^{\ast }\left( P\right) \right)
=(r_{i}^{\ast },s_{i}^{\ast },1-r_{i}^{\ast }-s_{i}^{\ast })
\end{equation*}で表します。

少なくとも1人のプレイヤーが3つの純粋戦略すべてに対して正の確率を付与するような混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)は存在するでしょうか。プレイヤー\(1\)の均衡戦略\(\sigma _{1}^{\ast }\)がすべての純粋戦略\(R,S,P\)に対して正の確率を付与する場合、先の命題より、\(\sigma _{1}^{\ast }\)が均衡戦略であることと、\(R,S,P\)がいずれも純粋戦略の範囲でプレイヤー\(1\)の期待利得を最大化すること、すなわち、\begin{equation*}
F_{1}\left( R,\sigma _{2}^{\ast }\right) =F_{1}\left( S,\sigma _{2}^{\ast
}\right) =F_{1}\left( P,\sigma _{2}^{\ast }\right)
\end{equation*}が成り立つことは必要十分です。これを解くと、\begin{equation*}
r_{2}^{\ast }=s_{2}^{\ast }=1-r_{2}^{\ast }-s_{2}^{\ast }=\frac{1}{3}
\end{equation*}を得ます(確認してください)。つまり、均衡戦略\(\sigma _{1}^{\ast }\)がすべての純粋戦略\(R,S,P\)に対して正の確率を付与するような混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)において、プレイヤー\(2\)の均衡戦略\(\sigma _{2}^{\ast }\)はすべての純粋戦略\(R,S,P\)に対して正の確率を付与するため、先の命題より、\(\sigma _{2}^{\ast }\)が均衡戦略であることと、\(R,S,P\)がいずれも純粋戦略の範囲でプレイヤー\(2\)の期待利得を最大化すること、すなわち、\begin{equation*}
F_{2}\left( \sigma _{1}^{\ast },R\right) =F_{2}\left( \sigma _{1}^{\ast
},S\right) =F_{2}\left( \sigma _{1}^{\ast },P\right)
\end{equation*}が成り立つことは必要十分です。これを解くと、\begin{equation*}
r_{1}^{\ast }=s_{1}^{\ast }=1-r_{1}^{\ast }-s_{1}^{\ast }=\frac{1}{3}
\end{equation*}を得ます(確認してください)。したがって、このゲームには混合戦略ナッシュ均衡\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \left( \frac{1}{3},\frac{1}{3},\frac{1}{3}\right) ,\left( \frac{1}{3},\frac{1}{3},\frac{1}{3}\right) \right)
\end{equation*}が存在することが明らかになりました。

少なくとも1人のプレイヤーが2つの純粋戦略にのみ正の確率を付与するような混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)は存在するでしょうか。プレイヤー\(2\)の均衡戦略\(\sigma _{2}^{\ast }\)が純粋戦略\(R,S\)に対してのみ正の確率を付与するものと仮定します。つまり、\(\sigma _{2}^{\ast }\)が\(r_{2}^{\ast }>0\)かつ\(s_{2}^{\ast }>0\)かつ\(r_{2}^{\ast }+s_{2}^{\ast }=1\)を満たすということです。この\(\sigma _{2}^{\ast }\)を前提とするとき、プレイヤー\(1\)について、\begin{equation*}
F_{1}\left( R,\sigma _{2}^{\ast }\right) >F_{1}\left( S,\sigma _{2}^{\ast
}\right)
\end{equation*}が成り立ちます(確認してください)。したがって、先の命題より、均衡戦略\(\sigma _{1}^{\ast }\)において\(s_{1}^{\ast }=0\)が成り立ちます。この\(\sigma _{1}^{\ast }\)を前提とするとき、プレイヤー\(2\)について、\begin{equation*}
F_{2}\left( \sigma _{1}^{\ast },R\right) <F_{2}\left( \sigma _{1}^{\ast
},S\right)
\end{equation*}が成り立ちます(確認してください)。したがって、先の命題より、均衡戦略\(\sigma _{2}^{\ast }\)において\(r_{2}^{\ast }=0\)が成り立ちますが、これは\(r_{2}^{\ast }>0\)と矛盾です。したがって、プレイヤー\(2\)の均衡戦略\(\sigma _{2}^{\ast }\)が純粋戦略\(R,S\)に対してのみ正の確率を付与するような混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)は存在しないことが明らかになりました。プレイヤー\(2\)の均衡戦略\(\sigma _{2}^{\ast }\)が正の確率を付与する2つの純粋戦略を変更しても同様の議論が成立します。また、プレイヤー\(1\)の均衡戦略\(\sigma _{1}^{\ast }\)についても同様の議論が成立します。したがって、少なくとも1人のプレイヤーが2つの純粋戦略にのみ正の確率を付与するような混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)は存在しません。

次回はナッシュの定理について解説します。
次へ進む 質問・コメントを投稿する 演習問題(プレミアム会員限定)

Share on facebook
Share on twitter
Share on email

プレミアム会員サービス

ユーザー名とメールアドレスを入力して有料(500円/月)のプレミアム会員へアップグレードすることにより、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題、解答など)へのアクセスが可能に。
会員サービス
ログイン

プレミアム会員だけが質問やコメントを投稿・閲覧できます。

完備情報の静学ゲーム
アカウント
ログイン