WIIS

完備情報の静学ゲーム

広義の混合戦略ナッシュ均衡

目次

Mailで保存
Xで共有

混合戦略の範囲での広義の最適反応

広義の最適反応の概念は戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においても容易に拡張されます。つまり、プレイヤー\(i\in I\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に直面したとき、自身の期待利得が混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)のもとで最大化される場合には、すなわち、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)を\(\sigma _{-i}\)に対する広義の最適反応(weak best response)と呼びます。

純粋戦略は特別な混合戦略であるため、あるプレイヤーの混合戦略が他のプレイヤーたちの混合戦略の組に対する広義の最適反応であることを規定する上の定義は、純粋戦略が純粋戦略の組に対する広義の最適反応であること、純粋戦略が混合戦略の組に対する広義の最適反応であること、混合戦略が純粋戦略の組に対する広義の最適反応であることの意味をすべて内包しています。

プレイヤー\(i\)による広義の最適反応は、他のプレイヤーたちの混合戦略の組に依存して変化します。つまり、ある\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応が\(\sigma _{i}^{\ast }\)であるとき、\(\sigma _{-i}\)とは別の\(\sigma _{-i}^{\prime }\)に対するプレイヤー\(i\)の広義の最適反応は\(\sigma _{i}^{\ast }\)であるとは限りません。以下の例より明らかです。

例(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2 \)が混合戦略\(\sigma _{2}=1\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},1\right) &=&\left( -1\right) \sigma _{1}+1\left(
1-\sigma _{1}\right) \\
&=&-2\sigma _{1}+1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する減少関数であるため、\(\sigma _{2}=1\)に対する広義の最適反応は\(\sigma _{1}=0\)です。一方、プレイヤー\(2\)が混合戦略\(\sigma _{2}=0\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},0\right) &=&1\sigma _{1}+\left( -1\right) \left(
1-\sigma _{1}\right) \\
&=&2\sigma _{1}-1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する増加関数であるため、\(\sigma _{2}=0\)に対する広義の最適反応は\(\sigma _{1}=1\)です。

以下の例が示すように、広義の最適反応は1つであるとは限りません。

例(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2 \)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\frac{1}{2}\left[ \left(
-1\right) \sigma _{1}+1\left( 1-\sigma _{1}\right) \right] +\frac{1}{2}\left[
1\sigma _{1}+\left( -1\right) \left( 1-\sigma _{1}\right) \right] \\
&=&\frac{1}{2}\left( -2\sigma _{1}+1\right) +\frac{1}{2}\left( 2\sigma
_{2}-1\right) \\
&=&0
\end{eqnarray*}ですが、これは定数であるため、\(\sigma _{2}=\frac{1}{2}\)に対する広義の最適反応は任意の\(\sigma _{1}\)です。

繰り返しになりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\)の広義の最適反応は他のプレイヤーたちの戦略の組\(\sigma _{-i}\)に依存して変化します。また、それぞれの\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応は1つであるとは限りません。以上を踏まえた上で、それぞれの\(\sigma _{-i}\in\Delta \left( S_{-i}\right) \)に対して、それに対するプレイヤー\(i\)の広義の最適反応からなる集合\begin{equation*}b_{i}(\sigma _{-i})=\{\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \ |\
F_{i}(\sigma _{i}^{\ast },\sigma _{-i})=\max_{\sigma _{i}\in \Delta \left(
S_{i}\right) }F_{i}(\sigma _{i},\sigma _{-i})\}
\end{equation*}を像として定める対応\begin{equation*}
b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left(
S_{i}\right)
\end{equation*}を定義し、これをプレイヤー\(i\)の広義の最適反応対応(weak best responsecorrespondence)と呼びます。

例(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&-\sigma _{1}\sigma
_{2}+\sigma _{1}\left( 1-\sigma _{2}\right) +\left( 1-\sigma _{1}\right)
\sigma _{2}-\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&-\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}であるため、プレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right) \twoheadrightarrow\Delta \left( S_{1}\right) \)はそれぞれの\(\sigma _{2}\in \Delta \left( S_{2}\right) \)に対して、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。プレイヤー\(1\)が混合戦略\(\sigma _{1}\)を選ぶとき、プレイヤー\(2\)が混合戦略\(\sigma _{2}\)から得る期待利得は、\begin{eqnarray*}F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sigma _{1}\sigma _{2}-\sigma
_{1}\left( 1-\sigma _{2}\right) -\left( 1-\sigma _{1}\right) \sigma
_{2}+\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}であるため、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow\Delta \left( S_{2}\right) \)はそれぞれの\(\sigma _{1}\in \Delta \left( S_{1}\right) \)に対して、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。

 

広義の最適反応の特徴づけ

繰り返しになりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)に対する広義の最適反応であることは、\begin{equation}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right) \quad \cdots (1)
\end{equation}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより自身の期待利得を最大化できることを意味します。ただ、たとえプレイヤー\(i\)が有限個の純粋戦略を持つ場合でも混合戦略の個数は無限であり、多くの場合、無限個の混合戦略を対象に\(\left( 1\right) \)が成り立つことを確認するのは実質的に不可能です。混合戦略の組\(\sigma _{-i}\)に対する広義の最適反応であるような混合戦略\(\sigma _{i}^{\ast }\)を特定する場合、作業を効率的に行うための指針が必要です。

最も重要な指針は、まず、混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応を純粋戦略の範囲内で特定する、というものです。つまり、\begin{equation}\forall s_{i}\in S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}\right) \geq
F_{i}\left( s_{i},\sigma _{-i}\right) \quad \cdots (2)
\end{equation}を満たすようなプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)を特定します。このような純粋戦略は1つだけであるとは限らないため、\(\left(2\right) \)を満たすプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)からなる集合を\(S_{i}^{\ast }\)で表します。\(S_{i}^{\ast }\subset S_{i}\)です。その上で、\(S_{i}^{\ast }\)に属する純粋戦略だけに非負の確率を付与するプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left(S_{i}\right) \)を任意に選びます。つまり、\begin{eqnarray*}&&\left( a\right) \ \forall s_{i}^{\ast }\in S_{i}^{\ast }:\sigma _{i}^{\ast
}\left( s_{i}^{\ast }\right) \geq 0 \\
&&\left( b\right) \ \forall s_{i}\in S_{i}\backslash S_{i}^{\ast }:\sigma
_{i}^{\ast }\left( s_{i}\right) =0 \\
&&\left( c\right) \ \sum_{s_{i}^{\ast }\in S_{i}^{\ast }}\sigma _{i}^{\ast
}\left( s_{i}^{\ast }\right) =1
\end{eqnarray*}を満たす混合戦略\(\sigma_{i}^{\ast }\)を任意に選ぶということです。このような混合戦略\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する広義の最適反応であることが保証されます。

命題(広義の最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)と、他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選んだ上で、\(\sigma _{-i}\)に対してプレイヤー\(i\)の期待利得を最大化するようなプレイヤー\(i\)の純粋戦略からなる集合を\(S_{i}^{\ast}\subset S_{i}\)で表す。\(S_{i}^{\ast }\)の要素である純粋戦略にのみ非負の確率を割り当てる混合戦略を任意に選ぶと、その混合戦略は\(\sigma _{-i}\)に対する最適反応になる。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(広義の最適反応の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)の混合戦略\(\sigma _{2}\)を任意に選んだ上で、それに対してプレイヤー\(1\)の純粋戦略\(A,B\)がもたらす期待利得をそれぞれ求めると、\begin{eqnarray*}F_{1}\left( A,\sigma _{2}\right) &=&-\sigma _{2}+\left( 1-\sigma
_{2}\right) =1-2\sigma _{2} \\
F_{1}\left( B,\sigma _{2}\right) &=&\sigma _{2}-\left( 1-\sigma _{2}\right)
=2\sigma _{2}-1
\end{eqnarray*}となります。両者を比較すると、まず、\begin{equation*}
F_{1}\left( A,\sigma _{2}\right) >F_{1}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}<\frac{1}{2}
\end{equation*}という関係が成り立つため、\(\sigma _{2}<\frac{1}{2}\)を満たす\(\sigma _{2}\)を任意に選んだとき、純粋戦略の範囲でのプレイヤー\(1\)の広義の最適反応は\(A\)です。すると先の命題より、混合戦略の範囲においても、\(A\)すなわち\(\sigma _{1}=1\)は\(\sigma _{2}\)に対する広義の最適反応です。また、\begin{equation*}F_{1}\left( A,\sigma _{2}\right) <F_{1}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}>\frac{1}{2}
\end{equation*}という関係が成り立つため、\(\sigma _{2}>\frac{1}{2}\)を満たす\(\sigma _{2}\)を任意に選んだとき、純粋戦略の範囲でのプレイヤー\(1\)の広義の最適反応は\(B\)です。すると先の命題より、混合戦略の範囲においても、\(B\)すなわち\(\sigma _{1}=0\)は\(\sigma _{2}\)に対する広義の最適反応です。また、\begin{equation*}F_{1}\left( A,\sigma _{2}\right) =F_{1}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}=\frac{1}{2}
\end{equation*}という関係が成り立つため、\(a_{2}=\frac{1}{2}\)に対して、純粋戦略の範囲でのプレイヤー\(1\)の広義の最適反応は\(A\)と\(B\)です。すると先の命題より、\(A\)と\(B\)に非負の確率を付与する混合戦略、すなわちプレイヤー\(1\)の任意の混合戦略が\(a_{2}=\frac{1}{2}\)に対する広義の最適反応です。

他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応を純粋戦略の範囲で特定した上で、そのような純粋戦略にのみ非負の確率を付与する混合戦略を構成すれば、それは\(\sigma _{-i}\)に対する広義の最適反応になることが明らかになりました。実は、その逆もまた成立します。つまり、\(\sigma _{-i}\)に対する広義の最適反応であるような混合戦略\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略もまた\(\sigma _{-i}\)に対する広義の最適反応であることが保証されます。しかも、それは純粋戦略の範囲において最大の期待効用をもたらす戦略という意味に限定されず、混合戦略を含めたすべての戦略の中で最大の期待効用をもたらす戦略です。つまり、\(\sigma _{-i}\)に対する広義の最適反応\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\left( s_{i}\right) >0\)を満たす任意の純粋戦略\(s_{i}\)もまた\(\sigma _{i}^{\ast }\)と等しい期待利得をもたらすということです。

命題(広義の最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)と、他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。プレイヤー\(i\)の混合戦略\(\sigma_{i}^{\ast }\in \Delta \left( S_{i}\right) \)が\(\sigma _{-i}\)に対する最適反応であるならば、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略もまた\(\sigma _{-i}\)に対する広義の最適反応となる。すなわち、\(\sigma _{i}^{\ast }\left( s_{i}^{\ast }\right) >0\)を満たす任意の\(s_{i}^{\ast }\in S_{i}\)について、\begin{equation*}F_{i}(s_{i}^{\ast },\sigma _{-i})=F_{i}\left( \sigma _{i}^{\ast },\sigma
_{-i}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(広義の最適反応の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\frac{1}{2}\left( -\sigma
_{1}+\left( 1-\sigma _{1}\right) \right) +\frac{1}{2}\left( \sigma
_{1}-\left( 1-\sigma _{1}\right) \right) \\
&=&0
\end{eqnarray*}となり定数であるため、任意の\(\sigma _{1}\)が\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応となります。したがって、例えば、\(\sigma _{1}=\frac{1}{2}\)もまた\(\sigma_{2}=\frac{1}{2}\)に対する最適反応です。\(\sigma _{1}=\frac{1}{2}\)は純粋戦略\(A,B\)の双方に対して正の確率を付与しているため、先の命題より、\(A,B\)もまた\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応であるはずです。実際、\begin{eqnarray*}F_{1}\left( \frac{1}{2},\frac{1}{2}\right) &=&\frac{1}{2}\left( -1\cdot
\frac{1}{2}+1\cdot \frac{1}{2}\right) +\frac{1}{2}\left( 1\cdot \frac{1}{2}-1\cdot \frac{1}{2}\right) =0 \\
F_{1}\left( A,\frac{1}{2}\right) &=&\frac{1}{2}\left( -1\right) +\frac{1}{2}\cdot 1=0 \\
F_{1}\left( B,\frac{1}{2}\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\left(
-1\right) =0
\end{eqnarray*}となるため、\(\sigma _{1}=\frac{1}{2}\)がもたらす期待利得は\(A\)や\(B\)がもたらす期待利得と一致します。

プレイヤー\(i\)の混合戦略\(\sigma _{i}\)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)をそれぞれ任意に選びます。また、\(\sigma _{i}\)が正の確率を付与する純粋戦略からなる\(S_{i}\)の部分集合を\(S_{i}^{\ast }\)で表します。すなわち、\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}\left( s_{i}\right)
>0\right\}
\end{equation*}です。\(\sigma _{-i}\)を前提としたとき、\(S_{i}^{\ast }\)の要素である任意の純粋戦略が、純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化するものとします。つまり、\begin{equation}\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( s_{i},\sigma _{-i}\right)
\quad \cdots (1)
\end{equation}が成り立つということです。このとき、最初に示した命題より、\(\sigma _{i}\)は\(\sigma _{-i}\)に対する広義の最適反応であることが保証されます。逆に、\(\sigma _{i}\)が\(\sigma_{-i}\)に対する広義の最適反応であるとき、直前に示した命題より、\(S_{i}^{\ast }\)の要素である任意の純粋戦略もまた\(\sigma _{-i}\)に対する広義の最適反応になります。つまり、\begin{equation}\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall \sigma _{i}\in \Delta
\left( S_{i}\right) :F_{i}\left( s_{i}^{\ast },\sigma _{-i}\right) \geq
F_{i}\left( \sigma _{i},\sigma _{-i}\right) \quad \cdots (2)
\end{equation}が成り立つということです。純粋戦略は特別な混合戦略であるため、\(\left( 2\right) \)は\(\left( 1\right) \)を含意します。したがって、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する広義の最適反応であることと\(\left( 2\right) \)が成り立つことが必要十分であることが示されました。

命題(広義の最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。\(\sigma _{-i}\)を前提としたとき、\(\sigma _{i}\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、\(\sigma _{i}\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}\left( s_{i}\right)
>0\right\}
\end{equation*}を定義したときに、\begin{equation*}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( s_{i},\sigma _{-i}\right)
\end{equation*}が成り立つことは、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する広義の最適反応であるための必要十分である。

繰り返しになりますが、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応を純粋戦略の範囲で特定した上で、そのような純粋戦略にのみ非負の確率を付与する混合戦略を構成すれば、それは\(\sigma _{-i}\)に対する広義の最適反応になります。しかも、上の命題より、そのようにして得られる混合戦略の他に、\(\sigma _{-i}\)に対する広義の最適反応は存在しないことが保証されます。

 

広義の混合戦略ナッシュ均衡

繰り返しになりますが、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left(S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する広義の最適反応であることとは、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}(\sigma _{i}^{\ast
},\sigma _{-i})\geq F_{i}(\sigma _{i},\sigma _{-i})
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより自身の期待利得を最大化できることを意味します。さて、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma_{i}^{\ast }\right) _{i\in I}\)において、それぞれの任意のプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}^{\ast }\)に対する広義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
:F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma
_{i},\sigma _{-i}^{\ast })
\end{equation*}が成り立つならば、\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)における広義のナッシュ均衡(weak Nash equilibrium)や広義の混合戦略ナッシュ均衡(weak mixed strategy Nash equilibrium)などと呼びます。

混合戦略の組\(\sigma _{I}^{\ast }\)が広義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のすべてのプレイヤーが均衡戦略に\(\sigma _{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(\sigma_{i}^{\ast }\)から逸脱して他の混合戦略\(\sigma _{i}\)を選ぶと、広義のナッシュ均衡の定義より、\begin{equation*}F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma _{i},\sigma
_{-i}^{\ast })
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちが広義のナッシュ均衡\(\sigma _{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(\sigma _{i}^{\ast }\)から逸脱しても得できません。広義のナッシュ均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが広義のナッシュ均衡\(\sigma _{I}^{\ast }\)を実際にプレーすることを保証するために、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

プレイヤー\(i\)による広義の最適反応対応\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left(S_{i}\right) \)を用いると、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する広義の最適反応であることは、\begin{equation*}\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right)_{i\in I}\)が広義の混合戦略ナッシュ均衡であることとは、\begin{equation*}\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことを意味します。

命題(広義の最適反応対応と広義の混合戦略ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、それぞれのプレイヤー\(i\in I\)の広義の最適反応対応を\(b_{i}:\Delta \left( S_{-i}\right)\twoheadrightarrow \Delta \left( S_{i}\right) \)で表す。このとき、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)について、\begin{equation*}\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であるための必要十分条件である。
例(広義の混合戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。先に例を通じて明らかにしたように、プレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right) \twoheadrightarrow \Delta \left(S_{1}\right) \)はそれぞれの\(\sigma_{2}\in \Delta \left( S_{2}\right) \)に対して、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定め、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow \Delta \left(S_{1}\right) \)はそれぞれの\(\sigma_{1}\in \Delta \left( S_{1}\right) \)に対して、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。

図:混合戦略ナッシュ均衡
図:混合戦略ナッシュ均衡

プレイヤー\(1\)の広義の最適反応対応\(b_{1}\)を上図の青いグラフで、プレイヤー\(2\)の広義の最適反応対応\(b_{2}\)を上図の赤いグラフでそれぞれ図示しました。広義の混合戦略ナッシュ均衡は広義の最適反応の組\(\left( \sigma _{1}^{\ast},\sigma _{2}^{\ast }\right) \)として定義されるため、2つのグラフが交わる点が広義の混合戦略ナッシュ均衡です。したがって、広義の混合戦略ナッシュ均衡は、\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \frac{1}{2},\frac{1}{2}\right)
\end{equation*}の3つです。先の命題を用いて確認しましょう。実際、\begin{eqnarray*}
\frac{1}{2} &\in &b_{1}\left( \frac{1}{2}\right) \\
\frac{1}{2} &\in &b_{2}\left( \frac{1}{2}\right)
\end{eqnarray*}が成り立つため、\(\left(\sigma _{1},\sigma _{2}\right) =\left( \frac{1}{2},\frac{1}{2}\right) \)は広義の混合戦略ナッシュ均衡です。

広義の混合戦略ナッシュ均衡は存在するとは限りません。

例(広義の混合戦略ナッシュ均衡)
プレイヤー集合が\(I=\{1,2\}\)、それぞれのプレイヤー\(i\in I\)の純粋戦略集合が\(S_{i}=\mathbb{R} ^{++}\)、利得関数が\(u_{i}\left(s_{1},s_{2}\right) =s_{1}\cdot s_{2}\)であるような戦略型ゲーム\(G\)について考えます。つまり、2人のプレイヤーはともに任意の正の実数を純粋戦略として選ぶことができ、2人が選んだ数の積を利得として得るということです。このゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。プレイヤー\(2\)の混合戦略\(\sigma _{2}\in \Delta \left( S_{2}\right) \)を任意に選びます。プレイヤー\(1\)の混合戦略\(\sigma _{1}\in\Delta \left( S_{1}\right) \)を任意に選ぶと、ゲームの定義より、\begin{equation*}F_{1}\left( \sigma _{1}^{\prime },\sigma _{2}\right) >F_{1}\left( \sigma
_{1},\sigma _{2}\right)
\end{equation*}を満たすような\(\sigma _{1}\)とは異なる混合戦略\(\sigma_{1}^{\prime }\)が必ず存在するため(確認してください)、\(\sigma _{2}\)に対するプレイヤー\(1\)の広義の最適反応は存在しません。任意の\(\sigma _{2}\)に対して同様の議論が成り立ちますが、これは\(G^{\ast }\)に広義の最適反応の組が存在しないことを意味します。したがってこのゲームには広義の混合戦略ナッシュ均衡は存在しません。

戦略型ゲーム\(G\)の要素の中に無限集合であるようなものが存在する場合、\(G\)を無限ゲームと呼びます。上の例で扱ったゲーム\(G\)では、それぞれのプレイヤー\(i\)の純粋戦略集合\(\mathbb{R} ^{++}\)は無限集合であるため、このゲーム\(G\)は無限ゲームです。上の例が示唆するように、無限ゲーム\(G\)の混合拡張\(G^{\ast \ast }\)には広義の混合戦略ナッシュ均衡は存在するとは限りません。一方、戦略型ゲーム\(G\)の要素がいずれも有限集合である場合、\(G\)を有限ゲームと呼びます。具体的には、戦略型ゲーム\(G\)が有限ゲームであるとは、プレイヤー集合\(I\)および任意のプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)が有限集合であることを意味します。有限ゲーム\(G\)の混合拡張\(G^{\ast }\)には必ず混合戦略ナッシュ均衡が存在することが知られています。これをナッシュの定理(Nash’s theorem)と呼びます。詳細は場を改めて解説します。

 

広義の混合戦略ナッシュ均衡の特徴づけ

有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が広義の混合戦略ナッシュ均衡であるものとします。広義の混合戦略ナッシュ均衡の定義より、このとき、任意のプレイヤー\(i\in I\)について、均衡戦略\(\sigma_{i}^{\ast }\)は他のプレイヤーたちの均衡戦略\(\sigma _{-i}^{\ast} \)に対する広義の最適反応です。広義の最適反応の特徴づけに関する命題より、プレイヤー\(i\)の均衡戦略\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left( s_{i},\sigma
_{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{i}^{\ast }\)が\(\sigma _{-i}^{\ast }\)に対する混合戦略最適反応であるための必要十分です。したがって、上の条件が任意のプレイヤー\(i\)について成り立つことは、\(\sigma_{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分条件です。

命題(広義の混合戦略ナッシュ均衡の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)を任意に選ぶ。このとき、任意のプレイヤー\(i\in I\)について、\(\sigma _{-i}^{\ast }\)を前提としたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、それぞれのプレイヤー\(i\)について\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall i\in I,\ \forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in
S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left(
s_{i},\sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であるための必要十分である。
例(混合戦略ナッシュ均衡の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{cccc}\hline
1\diagdown 2 & L & C & R \\ \hline
U & 1,-1 & -1,1 & -10,-10 \\ \hline
M & -1,1 & 1,-1 & -10,-10 \\ \hline
D & -10,-10 & -10,-10 & -20,-20 \\ \hline
\end{array}$$

表:利得行列

このゲームには広義の純粋戦略ナッシュ均衡は存在しません(確認してください)。その一方で、プレイヤー\(1,2\)の混合戦略をそれぞれ、\begin{eqnarray*}\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( M\right)
,\sigma _{1}\left( D\right) \right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( C\right)
,\sigma _{2}\left( R\right) \right)
\end{eqnarray*}で表記するとき、以下の混合戦略の組\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \left( \frac{1}{2},\frac{1}{2},0\right) ,\left( \frac{1}{2},\frac{1}{2},0\right) \right)
\end{equation*}が広義の混合戦略ナッシュ均衡であることを確認します。\(\left(\sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)においてそれぞれのプレイヤーが直面する期待利得は、\begin{equation*}F_{1}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =F_{2}\left(
\sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =0
\end{equation*}となります。\(\left( \sigma _{1}^{\ast},\sigma _{2}^{\ast }\right) \)におけるプレイヤー\(2\)の戦略\(\sigma_{2}^{\ast }\)を前提としたとき、プレイヤー\(1\)がそれぞれの純粋戦略\(A,B,C\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( A,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\cdot \left( -1\right) +0\cdot \left( -10\right) =0 \\
F_{1}\left( B,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot \left(
-1\right) +\frac{1}{2}\cdot 1+0\cdot \left( -10\right) =0 \\
F_{1}\left( C,\sigma _{2}^{\ast }\right) &=&\frac{1}{2}\cdot \left(
-10\right) +\frac{1}{2}\cdot \left( -10\right) +0\cdot \left( -20\right) =-10
\end{eqnarray*}となります。つまり、\(\sigma _{1}^{\ast }\)が正の確率を付与する純粋戦略\(A,B\)はいずれも、純粋戦略の範囲内でプレイヤー\(1\)の期待利得を最大化しています。また、\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)におけるプレイヤー\(1\)の戦略\(\sigma _{1}^{\ast }\)を前提としたとき、プレイヤー\(2\)がそれぞれの純粋戦略\(L,C,R\)から得る期待利得は、\begin{eqnarray*}F_{2}\left( \sigma _{1}^{\ast },L\right) &=&\frac{1}{2}\cdot \left(
-1\right) +\frac{1}{2}\cdot 1+0\cdot \left( -10\right) =0 \\
F_{2}\left( \sigma _{1}^{\ast },C\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\cdot \left( -1\right) +0\cdot \left( -10\right) =0 \\
F_{2}\left( \sigma _{1}^{\ast },R\right) &=&\frac{1}{2}\cdot \left(
-10\right) +\frac{1}{2}\cdot \left( -10\right) +0\cdot \left( -20\right) =-10
\end{eqnarray*}となります。つまり、\(\sigma _{2}^{\ast }\)が正の確率を付与する純粋戦略\(L,C\)はいずれも、純粋戦略の範囲内でプレイヤー\(2\)の期待利得を最大化しています。したがって、先の命題より、\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)が広義の混合戦略ナッシュ均衡であることが保証されます。

 

広義の純粋戦略ナッシュ均衡と混合戦略ナッシュ均衡の関係

戦略型ゲーム\(G\)に広義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在するものとします。プレイヤー\(i\in I\)を任意に選んだとき、純粋戦略は特別な混合戦略であることと、広義の純粋戦略ナッシュ均衡の定義を踏まえると、このとき、純粋戦略\(s_{i}^{\ast }\)は混合戦略\(s_{-i}^{\ast }\)に対する広義の最適反応です。混合戦略\(s_{i}^{\ast }\)は純粋戦略\(s_{i}^{\ast }\)にのみ正の確率を付与することを踏まえると、混合戦略\(s_{i}^{\ast }\)は混合戦略\(s_{-i}^{\ast }\)に対する広義の最適反応です。任意のプレイヤー\(i\)について同様の議論が成立するため、\(s_{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であることが明らかになりました。

命題(広義の純粋戦略ナッシュ均衡と混合戦略ナッシュ均衡の関係)
戦略型ゲーム\(G\)に広義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在する場合、\(s_{I}^{\ast }\)は\(G\)の混合拡張\(G^{\ast }\)における広義の混合戦略ナッシュ均衡である。

上の命題の逆は成り立つとは限りません。つまり、広義の混合戦略ナッシュ均衡は広義の純粋戦略ナッシュ均衡であるとは限りません。先の例より明らかです。

 

広義の混合戦略ナッシュ均衡の導出方法

繰り返しになりますが、広義の混合戦略ナッシュ均衡に関して以下の命題が成り立ちます。

命題(広義の混合戦略ナッシュ均衡の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)を任意に選ぶ。このとき、任意のプレイヤー\(i\in I\)について、\(\sigma _{-i}^{\ast }\)を前提としたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、それぞれのプレイヤー\(i\)について\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall i\in I,\ \forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in
S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left(
s_{i},\sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であるための必要十分である。

この命題を利用することにより、広義の混合戦略ナッシュ均衡を比較的容易に求めることができます。以下が具体例です。

例(広義の混合戦略ナッシュ均衡の導出方法)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & 2,1 & 0,0 \\ \hline
B & 0,0 & 1,2 \\ \hline
\end{array}$$

表:利得行列

このゲームには2つの広義の純粋戦略ナッシュ均衡\(\left( A,A\right) ,\left( B,B\right) \)が存在しますが、これは広義の混合戦略ナッシュ均衡でもあります。では、これらとは異なる広義の混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)は存在するでしょうか。プレイヤー\(i\ \left( =1,2\right) \)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表記します。\(0\leq \sigma_{i}\leq 1\)です。広義の混合戦略ナッシュ均衡\(\left(\sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)が\(\left( A,A\right) \)や\(\left( B,B\right) \)とは異なることとは、\(0<\sigma _{1}^{\ast }<1\)と\(0<\sigma_{2}^{\ast }<1\)の少なくとも一方が成り立つことを意味します。そこで、\(0<\sigma _{1}^{\ast }<1\)を満たす広義の混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast}\right) \)が存在するものと仮定します。つまり、\(\sigma _{1}^{\ast }\)は\(A\)と\(B\)の双方に正の確率を付与するため、先の命題より、\(\sigma _{1}^{\ast }\)が均衡戦略であることと、\(A\)と\(B\)がともに純粋戦略の範囲でプレイヤー\(1\)の期待利得を最大化すること、すなわち、\begin{equation}F_{1}\left( A,\sigma _{2}^{\ast }\right) =F_{1}\left( B,\sigma _{2}^{\ast
}\right) \quad \cdots (1)
\end{equation}が成り立つことは必要十分です。\(\left( 1\right) \)を解くと\(\sigma _{2}^{\ast }=\frac{2}{3}\)を得ます(確認してください)。つまり、\(0<\sigma_{1}^{\ast }<1\)を満たす広義の混合戦略ナッシュ均衡\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)において\(\sigma _{2}^{\ast }\ \left( =\frac{2}{3}\right) \)は純粋戦略\(A,B\)の双方に正の確率を付与するため、先の命題より、\(\sigma _{2}^{\ast }\ \left( =\frac{2}{3}\right) \)が均衡戦略であることと、\(A\)と\(B\)がともに純粋戦略の範囲でプレイヤー\(2\)の期待利得を最大化すること、すなわち、\begin{equation}F_{2}\left( \sigma _{1}^{\ast },A\right) =F_{2}\left( \sigma _{1}^{\ast
},B\right) \quad \cdots (2)
\end{equation}が成り立つことは必要十分です。\(\left( 2\right) \)を解くと\(\sigma _{1}^{\ast }=\frac{1}{3}\)を得ます。したがって、このゲームには\(\left( A,A\right) \)や\(\left( B,B\right) \)とは異なる広義の混合戦略ナッシュ均衡\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \frac{1}{3},\frac{2}{3}\right)
\end{equation*}が存在することが明らかになりました。

 

演習問題

問題(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & 2,1 & 0,0 \\ \hline
B & 0,0 & 1,2 \\ \hline
\end{array}$$

表:利得行列

純粋戦略の範囲におけるプレイヤー\(1\)の広義の最適反応対応\(b_{1}:S_{2}\twoheadrightarrow S_{1}\)と、混合戦略の範囲におけるプレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right)\twoheadrightarrow \Delta \left( S_{1}\right) \)をそれぞれ求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 0,3 & 3,0 \\ \hline
D & 3,0 & 2,4 \\ \hline
\end{array}$$

表:利得行列

純粋戦略の範囲におけるプレイヤー\(1\)の広義の最適反応対応\(b_{1}:S_{2}\twoheadrightarrow S_{1}\)と、混合戦略の範囲におけるプレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right)\twoheadrightarrow \Delta \left( S_{1}\right) \)をそれぞれ求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(広義の混合戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{cccc}\hline
1\diagdown 2 & R & S & P \\ \hline
R & 0,0 & 1,-1 & -1,1 \\ \hline
S & -1,1 & 0,0 & 1,-1 \\ \hline
P & 1,-1 & -1,1 & 0,0 \\ \hline
\end{array}$$

表:利得行列

このゲームはジャンケンを表しています。つまり、\(R\)はグー(Rock)、\(S\)はチョキ(Scissors)、\(P\)はパー(Paper)にそれぞれ対応しています。ジャンケンの勝者の利得を\(1\)、敗者の利得を\(-1\)、あいこの場合は両者の利得を\(0\)と定めています。このゲームには広義の純粋戦略ナッシュ均衡や、広義の混合戦略ナッシュ均衡は存在するでしょうか。議論してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録