教材一覧
教材一覧
教材検索

完備情報の静学ゲーム

広義の混合戦略ナッシュ均衡

目次

Twitter
Mailで保存

混合戦略の範囲での広義の最適反応

広義の最適反応の概念は戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においても容易に拡張されます。つまり、プレイヤー\(i\in I\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に直面したとき、自身の期待利得が混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)のもとで最大化される場合には、すなわち、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)を\(\sigma _{-i}\)に対する広義の最適反応(weak best response)と呼びます。

純粋戦略は特別な混合戦略であるため、あるプレイヤーの混合戦略が他のプレイヤーたちの混合戦略の組に対する広義の最適反応であることを規定する上の定義は、純粋戦略が純粋戦略の組に対する広義の最適反応であること、純粋戦略が混合戦略の組に対する広義の最適反応であること、混合戦略が純粋戦略の組に対する広義の最適反応であることの意味をすべて内包しています。

プレイヤー\(i\)による広義の最適反応は、他のプレイヤーたちの混合戦略の組に依存して変化します。つまり、ある\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応が\(\sigma _{i}^{\ast }\)であるとき、\(\sigma _{-i}\)とは別の\(\sigma _{-i}^{\prime }\)に対するプレイヤー\(i\)の広義の最適反応は\(\sigma _{i}^{\ast }\)であるとは限りません。以下の例より明らかです。

例(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2 \)が混合戦略\(\sigma _{2}=1\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},1\right) &=&\left( -1\right) \sigma _{1}+1\left(
1-\sigma _{1}\right) \\
&=&-2\sigma _{1}+1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する減少関数であるため、\(\sigma _{2}=1\)に対する広義の最適反応は\(\sigma _{1}=0\)です。一方、プレイヤー\(2\)が混合戦略\(\sigma _{2}=0\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},0\right) &=&1\sigma _{1}+\left( -1\right) \left(
1-\sigma _{1}\right) \\
&=&2\sigma _{1}-1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する増加関数であるため、\(\sigma _{2}=0\)に対する広義の最適反応は\(\sigma _{1}=1\)です。

以下の例が示すように、広義の最適反応は1つであるとは限りません。

例(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2 \)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\frac{1}{2}\left[ \left(
-1\right) \sigma _{1}+1\left( 1-\sigma _{1}\right) \right] +\frac{1}{2}\left[
1\sigma _{1}+\left( -1\right) \left( 1-\sigma _{1}\right) \right] \\
&=&\frac{1}{2}\left( -2\sigma _{1}+1\right) +\frac{1}{2}\left( 2\sigma
_{2}-1\right) \\
&=&0
\end{eqnarray*}ですが、これは定数であるため、\(\sigma _{2}=\frac{1}{2}\)に対する広義の最適反応は任意の\(\sigma _{1}\)です。

繰り返しになりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\)の広義の最適反応は他のプレイヤーたちの戦略の組\(\sigma _{-i}\)に依存して変化します。また、それぞれの\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応は1つであるとは限りません。以上を踏まえた上で、それぞれの\(\sigma _{-i}\in\Delta \left( S_{-i}\right) \)に対して、それに対するプレイヤー\(i\)の広義の最適反応からなる集合\begin{equation*}b_{i}(\sigma _{-i})=\{\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \ |\
F_{i}(\sigma _{i}^{\ast },\sigma _{-i})=\max_{\sigma _{i}\in \Delta \left(
S_{i}\right) }F_{i}(\sigma _{i},\sigma _{-i})\}
\end{equation*}を像として定める対応\begin{equation*}
b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left(
S_{i}\right)
\end{equation*}を定義し、これをプレイヤー\(i\)の広義の最適反応対応(weak best responsecorrespondence)と呼びます。

例(広義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&-\sigma _{1}\sigma
_{2}+\sigma _{1}\left( 1-\sigma _{2}\right) +\left( 1-\sigma _{1}\right)
\sigma _{2}-\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&-\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}であるため、プレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right) \twoheadrightarrow\Delta \left( S_{1}\right) \)はそれぞれの\(\sigma _{2}\in \Delta \left( S_{2}\right) \)に対して、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。プレイヤー\(1\)が混合戦略\(\sigma _{1}\)を選ぶとき、プレイヤー\(2\)が混合戦略\(\sigma _{2}\)から得る期待利得は、\begin{eqnarray*}F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sigma _{1}\sigma _{2}-\sigma
_{1}\left( 1-\sigma _{2}\right) -\left( 1-\sigma _{1}\right) \sigma
_{2}+\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}であるため、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow\Delta \left( S_{2}\right) \)はそれぞれの\(\sigma _{1}\in \Delta \left( S_{1}\right) \)に対して、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。

 

広義の最適反応の特徴づけ

繰り返しになりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)に対する広義の最適反応であることは、\begin{equation}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right) \quad \cdots (1)
\end{equation}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより自身の期待利得を最大化できることを意味します。ただ、たとえプレイヤー\(i\)が有限個の純粋戦略を持つ場合でも混合戦略の個数は無限であり、多くの場合、無限個の混合戦略を対象に\(\left( 1\right) \)が成り立つことを確認するのは実質的に不可能です。混合戦略の組\(\sigma _{-i}\)に対する広義の最適反応であるような混合戦略\(\sigma _{i}^{\ast }\)を特定する場合、作業を効率的に行うための指針が必要です。

最も重要な指針は、まず、混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応を純粋戦略の範囲内で特定する、というものです。つまり、\begin{equation}\forall s_{i}\in S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}\right) \geq
F_{i}\left( s_{i},\sigma _{-i}\right) \quad \cdots (2)
\end{equation}を満たすようなプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)を特定します。このような純粋戦略は1つだけであるとは限らないため、\(\left(2\right) \)を満たすプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)からなる集合を\(S_{i}^{\ast }\)で表します。\(S_{i}^{\ast }\subset S_{i}\)です。その上で、\(S_{i}^{\ast }\)に属する純粋戦略だけに非負の確率を付与するプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left(S_{i}\right) \)を任意に選びます。つまり、\begin{eqnarray*}&&\left( a\right) \ \forall s_{i}^{\ast }\in S_{i}^{\ast }:\sigma _{i}^{\ast
}\left( s_{i}^{\ast }\right) \geq 0 \\
&&\left( b\right) \ \forall s_{i}\in S_{i}\backslash S_{i}^{\ast }:\sigma
_{i}^{\ast }\left( s_{i}\right) =0 \\
&&\left( c\right) \ \sum_{s_{i}^{\ast }\in S_{i}^{\ast }}\sigma _{i}^{\ast
}\left( s_{i}^{\ast }\right) =1
\end{eqnarray*}を満たす混合戦略\(\sigma_{i}^{\ast }\)を任意に選ぶということです。このような混合戦略\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する広義の最適反応であることが保証されます。

命題(広義の最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)と、他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選んだ上で、\(\sigma _{-i}\)に対してプレイヤー\(i\)の期待利得を最大化するようなプレイヤー\(i\)の純粋戦略からなる集合を\(S_{i}^{\ast}\subset S_{i}\)で表す。\(S_{i}^{\ast }\)の要素である純粋戦略にのみ非負の確率を割り当てる混合戦略を任意に選ぶと、その混合戦略は\(\sigma _{-i}\)に対する最適反応になる。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(広義の最適反応の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:広義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)の混合戦略\(\sigma _{2}\)を任意に選んだ上で、それに対してプレイヤー\(1\)の純粋戦略\(A,B\)がもたらす期待利得をそれぞれ求めると、\begin{eqnarray*}F_{1}\left( A,\sigma _{2}\right) &=&-\sigma _{2}+\left( 1-\sigma
_{2}\right) =1-2\sigma _{2} \\
F_{1}\left( B,\sigma _{2}\right) &=&\sigma _{2}-\left( 1-\sigma _{2}\right)
=2\sigma _{2}-1
\end{eqnarray*}となります。両者を比較すると、まず、\begin{equation*}
F_{1}\left( A,\sigma _{2}\right) >F_{1}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}<\frac{1}{2}
\end{equation*}という関係が成り立つため、\(\sigma _{2}<\frac{1}{2}\)を満たす\(\sigma _{2}\)を任意に選んだとき、純粋戦略の範囲でのプレイヤー\(1\)の広義の最適反応は\(A\)です。すると先の命題より、混合戦略の範囲においても、\(A\)すなわち\(\sigma _{1}=1\)は\(\sigma _{2}\)に対する広義の最適反応です。また、\begin{equation*}F_{1}\left( A,\sigma _{2}\right) <F_{1}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}>\frac{1}{2}
\end{equation*}という関係が成り立つため、\(\sigma _{2}>\frac{1}{2}\)を満たす\(\sigma _{2}\)を任意に選んだとき、純粋戦略の範囲でのプレイヤー\(1\)の広義の最適反応は\(B\)です。すると先の命題より、混合戦略の範囲においても、\(B\)すなわち\(\sigma _{1}=0\)は\(\sigma _{2}\)に対する広義の最適反応です。また、\begin{equation*}F_{1}\left( A,\sigma _{2}\right) =F_{1}\left( B,\sigma _{2}\right)
\Leftrightarrow \sigma _{2}=\frac{1}{2}
\end{equation*}という関係が成り立つため、\(a_{2}=\frac{1}{2}\)に対して、純粋戦略の範囲でのプレイヤー\(1\)の広義の最適反応は\(A\)と\(B\)です。すると先の命題より、\(A\)と\(B\)に非負の確率を付与する混合戦略、すなわちプレイヤー\(1\)の任意の混合戦略が\(a_{2}=\frac{1}{2}\)に対する広義の最適反応です。

他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応を純粋戦略の範囲で特定した上で、そのような純粋戦略にのみ非負の確率を付与する混合戦略を構成すれば、それは\(\sigma _{-i}\)に対する広義の最適反応になることが明らかになりました。実は、その逆もまた成立します。つまり、\(\sigma _{-i}\)に対する広義の最適反応であるような混合戦略\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略もまた\(\sigma _{-i}\)に対する広義の最適反応であることが保証されます。しかも、それは純粋戦略の範囲において最大の期待効用をもたらす戦略という意味に限定されず、混合戦略を含めたすべての戦略の中で最大の期待効用をもたらす戦略です。つまり、\(\sigma _{-i}\)に対する広義の最適反応\(\sigma _{i}^{\ast }\)が与えられたとき、\(\sigma _{i}^{\ast }\left( s_{i}\right) >0\)を満たす任意の純粋戦略\(s_{i}\)もまた\(\sigma _{i}^{\ast }\)と等しい期待利得をもたらすということです。

命題(広義の最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)と、他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。プレイヤー\(i\)の混合戦略\(\sigma_{i}^{\ast }\in \Delta \left( S_{i}\right) \)が\(\sigma _{-i}\)に対する最適反応であるならば、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略もまた\(\sigma _{-i}\)に対する広義の最適反応となる。すなわち、\(\sigma _{i}^{\ast }\left( s_{i}^{\ast }\right) >0\)を満たす任意の\(s_{i}^{\ast }\in S_{i}\)について、\begin{equation*}F_{i}(s_{i}^{\ast },\sigma _{-i})=F_{i}\left( \sigma _{i}^{\ast },\sigma
_{-i}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(広義の最適反応の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\frac{1}{2}\left( -\sigma
_{1}+\left( 1-\sigma _{1}\right) \right) +\frac{1}{2}\left( \sigma
_{1}-\left( 1-\sigma _{1}\right) \right) \\
&=&0
\end{eqnarray*}となり定数であるため、任意の\(\sigma _{1}\)が\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応となります。したがって、例えば、\(\sigma _{1}=\frac{1}{2}\)もまた\(\sigma_{2}=\frac{1}{2}\)に対する最適反応です。\(\sigma _{1}=\frac{1}{2}\)は純粋戦略\(A,B\)の双方に対して正の確率を付与しているため、先の命題より、\(A,B\)もまた\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応であるはずです。実際、\begin{eqnarray*}F_{1}\left( \frac{1}{2},\frac{1}{2}\right) &=&\frac{1}{2}\left( -1\cdot
\frac{1}{2}+1\cdot \frac{1}{2}\right) +\frac{1}{2}\left( 1\cdot \frac{1}{2}-1\cdot \frac{1}{2}\right) =0 \\
F_{1}\left( A,\frac{1}{2}\right) &=&\frac{1}{2}\left( -1\right) +\frac{1}{2}\cdot 1=0 \\
F_{1}\left( B,\frac{1}{2}\right) &=&\frac{1}{2}\cdot 1+\frac{1}{2}\left(
-1\right) =0
\end{eqnarray*}となるため、\(\sigma _{1}=\frac{1}{2}\)がもたらす期待利得は\(A\)や\(B\)がもたらす期待利得と一致します。

プレイヤー\(i\)の混合戦略\(\sigma _{i}\)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)をそれぞれ任意に選びます。また、\(\sigma _{i}\)が正の確率を付与する純粋戦略からなる\(S_{i}\)の部分集合を\(S_{i}^{\ast }\)で表します。すなわち、\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}\left( s_{i}\right)
>0\right\}
\end{equation*}です。\(\sigma _{-i}\)を前提としたとき、\(S_{i}^{\ast }\)の要素である任意の純粋戦略が、純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化するものとします。つまり、\begin{equation}\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( s_{i},\sigma _{-i}\right)
\quad \cdots (1)
\end{equation}が成り立つということです。このとき、最初に示した命題より、\(\sigma _{i}\)は\(\sigma _{-i}\)に対する広義の最適反応であることが保証されます。逆に、\(\sigma _{i}\)が\(\sigma_{-i}\)に対する広義の最適反応であるとき、直前に示した命題より、\(S_{i}^{\ast }\)の要素である任意の純粋戦略もまた\(\sigma _{-i}\)に対する広義の最適反応になります。つまり、\begin{equation}\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall \sigma _{i}\in \Delta
\left( S_{i}\right) :F_{i}\left( s_{i}^{\ast },\sigma _{-i}\right) \geq
F_{i}\left( \sigma _{i},\sigma _{-i}\right) \quad \cdots (2)
\end{equation}が成り立つということです。純粋戦略は特別な混合戦略であるため、\(\left( 2\right) \)は\(\left( 1\right) \)を含意します。したがって、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する広義の最適反応であることと\(\left( 2\right) \)が成り立つことが必要十分であることが示されました。

命題(広義の最適反応の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)をそれぞれ任意に選ぶ。\(\sigma _{-i}\)を前提としたとき、\(\sigma _{i}\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、\(\sigma _{i}\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}\left( s_{i}\right)
>0\right\}
\end{equation*}を定義したときに、\begin{equation*}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( s_{i},\sigma _{-i}\right)
\end{equation*}が成り立つことは、\(\sigma _{i}\)が\(\sigma _{-i}\)に対する広義の最適反応であるための必要十分である。

繰り返しになりますが、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応を純粋戦略の範囲で特定した上で、そのような純粋戦略にのみ非負の確率を付与する混合戦略を構成すれば、それは\(\sigma _{-i}\)に対する広義の最適反応になります。しかも、上の命題より、そのようにして得られる混合戦略の他に、\(\sigma _{-i}\)に対する広義の最適反応は存在しないことが保証されます。

 

広義の混合戦略ナッシュ均衡

繰り返しになりますが、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left(S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する広義の最適反応であることとは、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}(\sigma _{i}^{\ast
},\sigma _{-i})\geq F_{i}(\sigma _{i},\sigma _{-i})
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより自身の期待利得を最大化できることを意味します。さて、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma_{i}^{\ast }\right) _{i\in I}\)において、それぞれの任意のプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}^{\ast }\)に対する広義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
:F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma
_{i},\sigma _{-i}^{\ast })
\end{equation*}が成り立つならば、\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)における広義のナッシュ均衡(weak Nash equilibrium)や広義の混合戦略ナッシュ均衡(weak mixed strategy Nash equilibrium)などと呼びます。

混合戦略の組\(\sigma _{I}^{\ast }\)が広義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のすべてのプレイヤーが均衡戦略に\(\sigma _{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(\sigma_{i}^{\ast }\)から逸脱して他の混合戦略\(\sigma _{i}\)を選ぶと、広義のナッシュ均衡の定義より、\begin{equation*}F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma _{i},\sigma
_{-i}^{\ast })
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちが広義のナッシュ均衡\(\sigma _{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(\sigma _{i}^{\ast }\)から逸脱しても得できません。広義のナッシュ均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが広義のナッシュ均衡\(\sigma _{I}^{\ast }\)を実際にプレーすることを保証するために、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

プレイヤー\(i\)による広義の最適反応対応\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left(S_{i}\right) \)を用いると、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する広義の最適反応であることは、\begin{equation*}\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right)_{i\in I}\)が広義の混合戦略ナッシュ均衡であることとは、\begin{equation*}\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことを意味します。

命題(広義の最適反応対応と広義の混合戦略ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、それぞれのプレイヤー\(i\in I\)の広義の最適反応対応を\(b_{i}:\Delta \left( S_{-i}\right)\twoheadrightarrow \Delta \left( S_{i}\right) \)で表す。このとき、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)について、\begin{equation*}\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であるための必要十分条件である。
例(広義の混合戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。先に例を通じて明らかにしたように、プレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right) \twoheadrightarrow \Delta \left(S_{1}\right) \)はそれぞれの\(\sigma_{2}\in \Delta \left( S_{2}\right) \)に対して、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定め、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow \Delta \left(S_{1}\right) \)はそれぞれの\(\sigma_{1}\in \Delta \left( S_{1}\right) \)に対して、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。

図:混合戦略ナッシュ均衡
図:混合戦略ナッシュ均衡

プレイヤー\(1\)の広義の最適反応対応\(b_{1}\)を上図の青いグラフで、プレイヤー\(2\)の広義の最適反応対応\(b_{2}\)を上図の赤いグラフでそれぞれ図示しました。広義の混合戦略ナッシュ均衡は広義の最適反応の組\(\left( \sigma _{1}^{\ast},\sigma _{2}^{\ast }\right) \)として定義されるため、2つのグラフが交わる点が広義の混合戦略ナッシュ均衡です。したがって、広義の混合戦略ナッシュ均衡は、\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \frac{1}{2},\frac{1}{2}\right)
\end{equation*}の3つです。先の命題を用いて確認しましょう。実際、\begin{eqnarray*}
\frac{1}{2} &\in &b_{1}\left( \frac{1}{2}\right) \\
\frac{1}{2} &\in &b_{2}\left( \frac{1}{2}\right)
\end{eqnarray*}が成り立つため、\(\left(\sigma _{1},\sigma _{2}\right) =\left( \frac{1}{2},\frac{1}{2}\right) \)は広義の混合戦略ナッシュ均衡です。

広義の混合戦略ナッシュ均衡は存在するとは限りません。

例(広義の混合戦略ナッシュ均衡)
プレイヤー集合が\(I=\{1,2\}\)、それぞれのプレイヤー\(i\in I\)の純粋戦略集合が\(S_{i}=\mathbb{R} ^{++}\)、利得関数が\(u_{i}\left(s_{1},s_{2}\right) =s_{1}\cdot s_{2}\)であるような戦略型ゲーム\(G\)について考えます。つまり、2人のプレイヤーはともに任意の正の実数を純粋戦略として選ぶことができ、2人が選んだ数の積を利得として得るということです。このゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。プレイヤー\(2\)の混合戦略\(\sigma _{2}\in \Delta \left( S_{2}\right) \)を任意に選びます。プレイヤー\(1\)の混合戦略\(\sigma _{1}\in\Delta \left( S_{1}\right) \)を任意に選ぶと、ゲームの定義より、\begin{equation*}F_{1}\left( \sigma _{1}^{\prime },\sigma _{2}\right) >F_{1}\left( \sigma
_{1},\sigma _{2}\right)
\end{equation*}を満たすような\(\sigma _{1}\)とは異なる混合戦略\(\sigma_{1}^{\prime }\)が必ず存在するため(確認してください)、\(\sigma _{2}\)に対するプレイヤー\(1\)の広義の最適反応は存在しません。任意の\(\sigma _{2}\)に対して同様の議論が成り立ちますが、これは\(G^{\ast }\)に広義の最適反応の組が存在しないことを意味します。したがってこのゲームには広義の混合戦略ナッシュ均衡は存在しません。

戦略型ゲーム\(G\)の要素の中に無限集合であるようなものが存在する場合、\(G\)を無限ゲームと呼びます。上の例で扱ったゲーム\(G\)では、それぞれのプレイヤー\(i\)の純粋戦略集合\(\mathbb{R} ^{++}\)は無限集合であるため、このゲーム\(G\)は無限ゲームです。上の例が示唆するように、無限ゲーム\(G\)の混合拡張\(G^{\ast \ast }\)には広義の混合戦略ナッシュ均衡は存在するとは限りません。一方、戦略型ゲーム\(G\)の要素がいずれも有限集合である場合、\(G\)を有限ゲームと呼びます。具体的には、戦略型ゲーム\(G\)が有限ゲームであるとは、プレイヤー集合\(I\)および任意のプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)が有限集合であることを意味します。有限ゲーム\(G\)の混合拡張\(G^{\ast }\)には必ず混合戦略ナッシュ均衡が存在することが知られています。これをナッシュの定理(Nash’s theorem)と呼びます。詳細は場を改めて解説します。

 

広義の混合戦略ナッシュ均衡の特徴づけ

有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が広義の混合戦略ナッシュ均衡であるものとします。広義の混合戦略ナッシュ均衡の定義より、このとき、任意のプレイヤー\(i\in I\)について、均衡戦略\(\sigma_{i}^{\ast }\)は他のプレイヤーたちの均衡戦略\(\sigma _{-i}^{\ast} \)に対する広義の最適反応です。広義の最適反応の特徴づけに関する命題より、プレイヤー\(i\)の均衡戦略\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in S_{i}:F_{i}\left(
s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left( s_{i},\sigma
_{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{i}^{\ast }\)が\(\sigma _{-i}^{\ast }\)に対する混合戦略最適反応であるための必要十分です。したがって、上の条件が任意のプレイヤー\(i\)について成り立つことは、\(\sigma_{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分条件です。

命題(広義の混合戦略ナッシュ均衡の特徴づけ)
有限な戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、混合戦略の組\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)を任意に選ぶ。このとき、任意のプレイヤー\(i\in I\)について、\(\sigma _{-i}^{\ast }\)を前提としたとき、\(\sigma _{i}^{\ast }\)において正の確率を付与されている任意の純粋戦略が純粋戦略の範囲内でプレイヤー\(i\)の期待利得を最大化することは、すなわち、それぞれのプレイヤー\(i\)について\(\sigma _{i}^{\ast }\)から以下の集合\begin{equation*}S_{i}^{\ast }=\left\{ s_{i}\in S_{i}\ |\ \sigma _{i}^{\ast }\left(
s_{i}\right) >0\right\}
\end{equation*}を定義したとき、\begin{equation*}
\forall i\in I,\ \forall s_{i}^{\ast }\in S_{i}^{\ast },\ \forall s_{i}\in
S_{i}:F_{i}\left( s_{i}^{\ast },\sigma _{-i}^{\ast }\right) \geq F_{i}\left(
s_{i},\sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であるための必要十分である。
例(混合戦略ナッシュ均衡の特徴づけ)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{cccc}\hline
1\diagdown 2 & L & C & R \\ \hline
U & 1,-1 & -1,1 & -10,-10 \\ \hline
M & -1,1 & 1,-1 & -10,-10 \\ \hline
D & -10,-10 & -10,-10 & -20,-20 \\ \hline
\end{array}$$

表:利得行列

このゲームには広義の純粋戦略ナッシュ均衡は存在しません(確認してください)。その一方で、プレイヤー\(1,2\)の混合戦略をそれぞれ、\begin{eqnarray*}\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( M\right)
,