戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに最適反応になっているならば、その組を混合戦略ナッシュ均衡と呼びます。

混合戦略最適反応

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I}\right) \)として表現されているものとします。復習になりますが、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{-i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{i}\)に対する最適反応であることとは、\begin{equation*}
\forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq
u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。つまり、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで最大化されるということです。

最適反応の概念は、戦略型ゲームの混合拡張\(G^{\ast }=\left\{ I,\left\{ \Delta \left( S_{i}\right) \right\} _{i\in I},\left\{ F_{i}\right\} _{i\in I}\right\} \)においても容易に拡張されます。つまり、プレイヤー\(i\in I\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right)\)に直面したとき、自身の期待利得は混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)のもとで最大化される場合には、すなわち、\begin{equation*}
\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)を\(\sigma _{-i}\)に対する混合戦略最適反応(mixed best response)や最適反応(best response)などと呼びます。

純粋戦略は特別な混合戦略であるため、あるプレイヤーの混合戦略が他のプレイヤーたちの混合戦略の組に対する最適反応であることの意味を規定する上の定義は、純粋戦略が純粋戦略の組に対する最適反応であること、純粋戦略が混合戦略の組に対する最適反応であること、混合戦略が純粋戦略の組に対する最低反応であることの定義などを内包しています。

プレイヤー\(i\)の混合戦略最適反応は、他のプレイヤーたちの混合戦略の組に依存して変化します。つまり、ある\(\sigma _{-i}\)に対するプレイヤー\(i\)の最適反応が\(\sigma _{i}^{\ast }\)であるとき、\(\sigma _{-i}\)とは別の\(\sigma _{-i}^{\prime }\)に対するプレイヤー\(i\)の最適反応は\(\sigma _{i}^{\ast }\)であるとは限りません。これは以下の例からも明らかです。

例(混合戦略最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=1\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},1\right) &=&\left( -1\right) \sigma _{1}+1\left(
1-\sigma _{1}\right) \\
&=&-2\sigma _{1}+1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する減少関数であるため、\(\sigma _{2}=1\)に対するプレイヤー\(1\)の混合戦略最適反応は\(\sigma _{1}=0\)です。一方、プレイヤー\(2\)が混合戦略\(\sigma _{2}=0\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},0\right) &=&1\sigma _{1}+\left( -1\right) \left(
1-\sigma _{1}\right) \\
&=&2\sigma _{2}-1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する増加関数であるため、\(\sigma _{2}=0\)に対するプレイヤー\(1\)の混合戦略最適反応は\(\sigma _{1}=1\)です。

以下の例が示すように、混合戦略最適反応は1つであるとは限りません。

例(混合戦略最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\frac{1}{2}\left[ \left(
-1\right) \sigma _{1}+1\left( 1-\sigma _{1}\right) \right] +\frac{1}{2}\left[
1\sigma _{1}+\left( -1\right) \left( 1-\sigma _{1}\right) \right] \\
&=&\frac{1}{2}\left( -2\sigma _{1}+1\right) +\frac{1}{2}\left( 2\sigma
_{2}-1\right) \\
&=&0
\end{eqnarray*}ですが、これは定数であるため、任意の\(\sigma _{1}\)が\(\sigma _{2}=\frac{1}{2}\)に対する混合戦略最適反応になります。

 

混合戦略ナッシュ均衡

繰り返しになりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する混合最適反応であるとは、\begin{equation*}
\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}(\sigma _{i}^{\ast
},\sigma _{-i})\geq F_{i}(\sigma _{i},\sigma _{-i})
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right) _{i\in I}\)において、任意のプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}^{\ast }\)に対する最適反応になっているならば、すなわち、\begin{equation*}
\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
:F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma
_{i},\sigma _{-i}^{\ast })
\end{equation*}が成り立つならば、\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)の混合戦略ナッシュ均衡(mixed strategy Nash equilibrium)やナッシュ均衡(Nash equilibrium)などと呼びます。

混合戦略の組\(\sigma _{I}^{\ast }\)がナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のすべてのプレイヤーがナッシュ均衡にしたがい\(\sigma _{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけがナッシュ均衡\(\sigma _{I}^{\ast }\)における均衡戦略\(\sigma _{i}^{\ast }\)から逸脱して他の混合戦略\(\sigma _{i}\)を選ぶと、ナッシュ均衡の定義より、\begin{equation*}
F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma _{i},\sigma
_{-i}^{\ast })
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちがナッシュ均衡\(\sigma _{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(\sigma _{i}^{\ast }\)から逸脱しても得できません。ナッシュ均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちがナッシュ均衡\(\sigma _{I}^{\ast }\)を実際にプレーすることを保証するために、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

戦略型ゲーム\(G\)に純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)が存在するものとします。純粋戦略は特別な混合戦略であるため、\(s_{I}^{\ast }\)は混合戦略ナッシュ均衡でもあります。

命題(純粋戦略ナッシュ均衡との関係)
戦略型ゲーム\(G\)に純粋戦略ナッシュ均衡\(s_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在する場合、\(s_{I}^{\ast }\)は\(G\)の混合拡張\(G^{\ast }\)の混合戦略ナッシュ均衡でもある。
証明を見る(プレミアム会員限定)

上の命題の逆は成り立つとは限りません。つまり、混合戦略ナッシュ均衡は純粋戦略ナッシュ均衡であるとは限りません。実際、以下のゲームには、純粋戦略ナッシュ均衡ではない混合戦略ナッシュ均衡が存在します。

例(混合戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&-\sigma _{1}\sigma
_{2}+\sigma _{1}\left( 1-\sigma _{2}\right) +\left( 1-\sigma _{1}\right)
\sigma _{2}-\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{2}-1\right) \left( 1-2\sigma _{1}\right)
\end{eqnarray*}です。したがって、プレイヤー\(2\)の混合戦略\(\sigma _{2}\)に対するプレイヤー\(1\)の混合戦略最適反応を\(\sigma _{1}^{\ast }\)で表すとき、\(\sigma _{2}>\frac{1}{2}\)の場合には\(\sigma _{1}^{\ast }=0\)であり、\(\sigma _{2}=\frac{1}{2}\)の場合には\(\sigma _{1}^{\ast }\)は\(0\)以上\(1\)以下の任意の実数であり、\(\sigma _{2}<\frac{1}{2}\)の場合には\(\sigma _{1}^{\ast }=1\)となります。同様に、\(\left( \sigma _{1},\sigma _{2}\right) \)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}
F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sigma _{1}\sigma _{2}-\sigma
_{1}\left( 1-\sigma _{2}\right) -\left( 1-\sigma _{1}\right) \sigma
_{2}+\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{1}-1\right) \left( 1-2\sigma _{2}\right)
\end{eqnarray*}です。したがって、プレイヤー\(1\)の混合戦略\(\sigma _{1}\)に対するプレイヤー\(2\)の混合戦略最適反応を\(\sigma _{2}^{\ast }\)で表すとき、\(\sigma _{1}>\frac{1}{2}\)の場合には\(\sigma _{2}^{\ast }=0\)であり、\(\sigma _{1}=\frac{1}{2}\)の場合には\(\sigma _{2}^{\ast }\)は\(0\)以上\(1\)以下の任意の実数であり、\(\sigma _{1}<\frac{1}{2}\)の場合には\(\sigma _{2}^{\ast }=1\)となります。

図:混合戦略ナッシュ均衡
図:混合戦略ナッシュ均衡

プレイヤー\(1\)の混合戦略最適反応\(\sigma _{1}^{\ast }\)を上図の赤いグラフで、プレイヤー\(2\)の混合戦略最適反応\(\sigma _{2}^{\ast }\)を上図の青いグラフでそれぞれ図示しました。混合戦略ナッシュ均衡は混合戦略最適反応の組\(\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) \)として定義されるため、2つのグラフが交わる点が混合戦略ナッシュ均衡です。したがって、混合戦略ナッシュ均衡は、\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 0,1\right) ,\
\left( \frac{1}{2},\frac{1}{2}\right) ,\ \left( 1,0\right)
\end{equation*}の3つです。\(\left( 0,1\right) \)と\(\left( 1,0\right) \)は純粋戦略ナッシュ均衡である一方で、\(\left( \frac{1}{2},\frac{1}{2}\right) \)は純粋戦略ナッシュ均衡ではない混合戦略ナッシュ均衡です。

上の例が示唆するように、混合戦略ナッシュ均衡が存在する場合、それは1つであるとは限りません。また、以下の例が示唆するように、混合戦略ナッシュ均衡は存在するとは限りません。

例(混合戦略ナッシュ均衡)
プレイヤー集合が\(I=\{1,2\}\)、それぞれのプレイヤー\(i\in I\)の純粋戦略集合が\(S_{i}= \mathbb{R} ^{++}\)、利得関数が\(u_{i}\left( s_{1},s_{2}\right) =s_{1}\cdot s_{2}\)であるような戦略型ゲーム\(G\)について考えます。つまり、混合拡張\(G^{\ast }\)について考えます。つまり、2人のプレイヤーはともに任意の正の実数を純粋戦略として選ぶことができ、2人が選んだ数の積を利得として得るということです。このゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。プレイヤー\(2\)の混合戦略\(\sigma _{2}\in \Delta \left( S_{2}\right) \)を任意に選びます。プレイヤー\(1\)の混合戦略\(\sigma _{1}\in \Delta \left( S_{2}\right) \)を任意に選ぶと、ゲームの定義より、\begin{equation*}
F_{1}\left( \sigma _{1}^{\prime },\sigma _{2}\right) >F_{1}\left( \sigma
_{1},\sigma _{2}\right)
\end{equation*}を満たすような\(\sigma _{1}\)とは異なる混合戦略\(\sigma _{1}^{\prime }\)が必ず存在するため(確認してください)、\(\sigma _{2}\)に対するプレイヤー\(1\)の混合戦略最適反応は存在しません。任意の\(\sigma _{2}\)に対して同様の議論が成り立ちますが、これは\(G^{\ast }\)に混合戦略最適反応の組が存在しないことを意味します。したがってこのゲームには混合戦略ナッシュ均衡は存在しません。

復習になりますが、戦略型ゲーム\(G\)の要素の中に無限集合であるようなものが存在する場合、\(G\)を無限ゲームと呼びます。上の例で扱ったゲーム\(G\)では、それぞれのプレイヤー\(i\)の純粋戦略集合\(\mathbb{R} ^{++}\)は無限集合であるため、このゲーム\(G\)は無限ゲームです。上の例が示唆するように、無限ゲーム\(G\)の混合拡張\(G^{\ast \ast }\)には混合戦略ナッシュ均衡は存在するとは限りません。一方、戦略型ゲーム\(G\)の要素がいずれも有限集合である場合、\(G\)を有限ゲームと呼びます。具体的には、戦略型ゲーム\(G\)が有限ゲームであるとは、プレイヤー集合\(I\)、任意のプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)が有限集合であることを意味します。実は、有限ゲーム\(G\)の混合拡張\(G^{\ast }\)には必ず混合戦略ナッシュ均衡が存在することが知られています。これをナッシュの定理(Nash’s theorem)と呼びます。ナッシュの定理については場を改めて解説します。

 

混合戦略最適反応対応と混合戦略ナッシュ均衡

繰り返しになりますが、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\)の最適反応は他のプレイヤーたちの戦略の組\(\sigma _{-i}\)に依存して変化します。また、それぞれの\(\sigma _{-i}\)に対するプレイヤー\(i\)の最適反応は1つであるとは限りません。以上を踏まえた上で、それぞれの\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対して、それに対するプレイヤー\(i\)の最適反応からなる\(\Delta \left( S_{i}\right) \)の部分集合\begin{equation*}
b_{i}(\sigma _{-i})=\{\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \ |\
F_{i}(\sigma _{i}^{\ast },\sigma _{-i})=\max_{\sigma _{i}\in \Delta \left(
S_{i}\right) }F_{i}(\sigma _{i},\sigma _{-i})\}
\end{equation*}を像として定める対応\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left( S_{i}\right) \)を定義し、これをプレイヤー\(i\)の混合最適反応対応(mixed best response correspondence)や最適反応対応(best response correspondence)などと呼びます。

プレイヤー\(i\)の最適反応対応\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left( S_{i}\right) \)を用いると、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する最適反応であることは、\begin{equation*}
\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right) _{i\in I}\)が混合戦略ナッシュ均衡であることとは、\begin{equation*}
\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast
}\right)
\end{equation*}が成り立つこととして表現可能です。

命題(混合戦略最適反応対応と混合戦略ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、それぞれのプレイヤー\(i\in I\)の混合戦略最適反応対応を\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left( S_{i}\right) \)で表す。このとき、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)について、\begin{equation*}
\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast
}\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分条件である。
証明を見る(プレミアム会員限定)
例(混合戦略最適反応対応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}
\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}で表します。\(0\leq \sigma _{i}\leq 1\)です。プレイヤー\(1\)の最適反応対応\(b_{1}:\Delta \left( S_{2}\right) \twoheadrightarrow \Delta \left( S_{1}\right) \)は、\begin{equation*}
b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right) \\
\Delta \left( S_{1}\right) & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を満たし、プレイヤー\(2\)の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow \Delta \left( S_{2}\right) \)は、\begin{equation*}
b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right) \\
\Delta \left( S_{2}\right) & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を満たします。このとき、\begin{eqnarray*}
1 &\in &b_{1}\left( 0\right) \\
0 &\in &b_{2}\left( 1\right)
\end{eqnarray*}が成り立つため、\(\left( \sigma _{1},\sigma _{2}\right) =\left( 1,0\right) \)は混合戦略ナッシュ均衡です。また、\begin{eqnarray*}
\frac{1}{2} &\in &b_{1}\left( \frac{1}{2}\right) \\
\frac{1}{2} &\in &b_{2}\left( \frac{1}{2}\right)
\end{eqnarray*}が成り立つため、\(\left( \sigma _{1},\sigma _{2}\right) =\left( \frac{1}{2},\frac{1}{2}\right) \)もまた混合戦略ナッシュ均衡です。さらに、\begin{eqnarray*}
0 &\in &b_{1}\left( 1\right) \\
1 &\in &b_{2}\left( 0\right)
\end{eqnarray*}が成り立つため、\(\left( \sigma _{1},\sigma _{2}\right) =\left( 0,1\right) \)もまた混合戦略ナッシュ均衡です。

戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\)の最適反応対応\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left( S_{i}\right) \)がそれぞれの\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対して定める\(\Delta \left( S_{i}\right) \)の部分集合\(b_{i}\left( \sigma _{-i}\right) \)が1点集合である場合、すなわち、\begin{equation*}
\forall \sigma _{-i}\in \Delta \left( S_{-i}\right) :\left\vert b_{i}\left(
\sigma _{-i}\right) \right\vert =1
\end{equation*}が成り立つ場合には、集合\(b_{i}\left( \sigma _{-i}\right) \)とその唯一の要素を同一視することにより、最適反応対応\(b_{i}\)を\(\Delta \left( S_{-i}\right) \)から\(\Delta \left( S_{i}\right) \)への写像とみなすことができます。このような写像\(b_{i}:\Delta \left( S_{-i}\right) \rightarrow \Delta \left( S_{i}\right) \)を混合最適反応関数(mixed best response function)や最適反応関数(best response function)などと呼びます。

プレイヤー\(i\)の最適反応関数\(b_{i}:\Delta \left( S_{-i}\right) \rightarrow \Delta \left( S_{i}\right) \)が存在するとき、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する最適反応であることは、\begin{equation*}
\sigma _{i}^{\ast }=b_{i}\left( \sigma _{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、すべてのプレイヤーが最適反応関数を持つ場合、混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right) _{i\in I}\)が混合戦略ナッシュ均衡であることとは、\begin{equation*}
\forall i\in I:\sigma _{i}^{\ast }=b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つこととして表現可能です。

命題(混合戦略最適反応関数と混合戦略ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、任意のプレイヤー\(i\in I\)が混合戦略最適反応関数\(b_{i}:\Delta \left( S_{-i}\right) \rightarrow \Delta \left( S_{i}\right) \)を持つ場合、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)について、\begin{equation*}
\forall i\in I:\sigma _{i}^{\ast }=b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が混合戦略ナッシュ均衡であるための必要十分条件である。
証明を見る(プレミアム会員限定)

次回は狭義の混合戦略ナッシュ均衡について解説します。

次へ進む 質問・コメントを投稿する 演習問題(プレミアム会員限定)
Share on facebook
Share on twitter
Share on email
Share on print

ワイズをさらに活用するための会員サービス

ユーザー名とメールアドレスを入力して一般会員に無料登録すれば、質問やコメントを投稿できるようになります。さらに、有料(500円/月)のプレミアム会員へアップグレードすることにより、プレミアムコンテンツ(命題の証明や演習問題、解答など)にアクセスできます。
会員サービス

ディスカッションに参加しますか?

質問やコメントを投稿するためにはログインが必要です
ログイン

完備情報の静学ゲーム
アカウント
ログイン