純粋戦略の範囲での広義の最適反応
問題としている戦略的状況が完備情報の動学ゲームであるとともに、それが展開型ゲーム\begin{equation*}
\Gamma =\left( I\cup \left\{ 0\right\} ,A,X,>,a,\mathcal{H},i,p,\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\cup \left\{ 0\right\} \)は自然に相当するプレイヤー\(0\)を含めたプレイヤー集合、\(A\)は行動集合、\(\left( X,>\right) \)はゲームの木、\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)はそれぞれの手番へ到達する直前に選択される行動を特定する写像、\(\mathcal{H}\)は情報分割、\(i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\} \)はそれぞれの情報集合において意思決定を行うプレイヤーを特定する写像、\(p:\mathcal{H}_{0}\times A\rightarrow \left[0,1\right] \)は自然による意思決定を記述する確率分布、\(u_{i}:Z\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。
展開型ゲーム\(\Gamma \)におけるプレイヤー\(i\)の純粋戦略とは、ゲームにおいて彼が直面し得るそれぞれの情報集合\(H\in \mathcal{H}_{i}\)に対して、そこで彼が選択する行動\(s_{i}\left( H\right) \in A_{i}\)を1つずつ指定する写像\begin{equation*}s_{i}:\mathcal{H}_{i}\rightarrow A_{i}
\end{equation*}として定式化されます。展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を採用する状況を想定し、その戦略的状況を\(\Gamma \)の戦略型\begin{equation*}G\left( \Gamma \right) =\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{
U_{i}\right\} _{i\in I}\right)
\end{equation*}として記述します。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\)の純粋戦略集合、\(U_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の期待利得関数です。
本来、展開型ゲーム\(\Gamma \)はプレイヤーたちが順番に意思決定を行う動学ゲームを記述するモデルです。ただ、プレイヤーたちが展開型ゲーム\(\Gamma \)において純粋戦略を選択することは、自身が直面し得るそれぞれの情報集合においてどの行動を選択するか、その包括的な行動計画をあらかじめ立てた上でゲームに臨むことを意味します。展開型ゲーム\(\Gamma \)の開始時点においてプレイヤーたちはそのような行動計画を表明します。ゲームの開始後には先の行動計画を変更できず、自身が先に表明した行動計画にもとづいて意思決定を行います。つまり、展開型ゲームにおいてプレイヤーたちが純粋戦略を採用する状況は、プレイヤーたちが純粋戦略を同時に表明する静学ゲームと解釈できるため、そこでの戦略的状況を戦略型ゲーム\(G\left( \Gamma \right) \)として表現できるということです。
戦略型ゲーム\(G\left( \Gamma \right) \)の静学性より、プレイヤー\(i\in I\)は意思決定を行う時点において他のプレイヤーたちが実際に選ぶ純粋戦略からなる組\(s_{-i}\in S_{-i}\)を事前に観察することはできません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る純粋戦略の組からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して自身の期待利得\(U_{i}\left(s_{i},s_{-i}\right) \)を最大化するような自身の純粋戦略\(s_{i}^{\ast }\)を事前に特定することはできます。そのような純粋戦略\(s_{i}^{\ast }\)を\(s_{-i}\)に対する広義の最適反応(weak best response)と呼びます。
より正確には、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する広義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}:U_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq
U_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つこととして定義されます。つまり、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が直面する期待利得は\(s_{i}^{\ast }\)のもとで最大化されるということです。
プレイヤー\(i\)による広義の最適反応は、他のプレイヤーたちの純粋戦略の組に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の広義の最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の広義の最適反応は\(s_{i}^{\ast }\)であるとは限りません。また、広義の最適反応は1つだけであるとは限りません。以下の例より明らかです。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。プレイヤーたちが選択する純粋戦略からなる組が\(\left( \left(a_{11}\right) ,\left( a_{21},a_{21}\right) \right) \)である場合、ゲームは確率\(1\)で頂点\(z_{1}\)へ到達するため、その場合にプレイヤーたちが直面する期待利得は、\begin{eqnarray*}U_{1}\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right) &=&2
\\
U_{2}\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right) &=&1
\end{eqnarray*}となります。他の純粋戦略の組についても期待利得を計算することにより、この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)が以下の利得行列として得られます。
$$\begin{array}{ccccc}
\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},a_{22}\right) \\ \hline
\left( a_{11}\right) & 2^{\ast },1^{\ast } & 2,1^{\ast } & 0^{\ast },0 & 0,0 \\ \hline
\left( a_{12}\right) & -1,1 & 3^{\ast },2^{\ast } & -1,1 & 3^{\ast },2^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけてあります。プレイヤー\(1\)の純粋戦略\(a_{11}\)に対するプレイヤー\(2\)の広義の最適反応は\(\left( a_{21},a_{21}\right) \)と\(\left(a_{21},a_{22}\right) \)の2つです。また、プレイヤー\(1\)の純粋戦略\(a_{12}\)に対するプレイヤー\(2\)の広義の最適反応は\(\left( a_{21},a_{22}\right) \)と\(\left( a_{22},a_{22}\right) \)の2つです。プレイヤー\(1\)の最適反応についても同様に考えます。
上の例が示唆するように、展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)において、プレイヤー\(i\)の広義の最適反応は他のプレイヤーたちの戦略の組\(s_{-i}\)に依存して変化します。また、それぞれの\(s_{-i}\)に対するプレイヤー\(i\)の広義の最適反応は1つであるとは限りません。以上を踏まえた上で、それぞれの\(s_{-i}\in S_{-i}\)に対して、それに対するプレイヤー\(i\)の広義の最適反応からなる\(S_{i}\)の部分集合\begin{equation*}b_{i}(s_{-i})=\{s_{i}^{\ast }\in S_{i}\ |\ u_{i}(s_{i}^{\ast
},s_{-i})=\max_{s_{i}\in S_{i}}u_{i}(s_{i},s_{-i})\}
\end{equation*}を像として定める対応\begin{equation*}
b_{i}:S_{-i}\twoheadrightarrow S_{i}
\end{equation*}を定義し、これをプレイヤー\(i\)の広義の最適反応対応(weak best response correspondence)と呼びます。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)は以下の通りです。
$$\begin{array}{ccccc}
\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},a_{22}\right) \\ \hline
\left( a_{11}\right) & 2^{\ast },1^{\ast } & 2,1^{\ast } & 0^{\ast },0 & 0,0 \\ \hline
\left( a_{12}\right) & -1,1 & 3^{\ast },2^{\ast } & -1,1 & 3^{\ast },2^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけています。プレイヤー\(1\)の広義の最適反応対応\(b_{1}:S_{2}\twoheadrightarrow S_{1}\)は、\begin{eqnarray*}b_{1}\left( \left( a_{21},a_{21}\right) \right) &=&\left\{ \left(
a_{11}\right) \right\} \\
b_{1}\left( \left( a_{21},a_{22}\right) \right) &=&\left\{ \left(
a_{12}\right) \right\} \\
b_{1}\left( \left( a_{22},a_{21}\right) \right) &=&\left\{ \left(
a_{12}\right) \right\} \\
b_{1}\left( \left( a_{22},a_{22}\right) \right) &=&\left\{ \left(
a_{12}\right) \right\}
\end{eqnarray*}を満たし、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:S_{1}\twoheadrightarrow S_{2}\)は、\begin{eqnarray*}b_{2}\left( \left( a_{11}\right) \right) &=&\left\{ \left(
a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) \right\} \\
b_{2}\left( \left( a_{12}\right) \right) &=&\left\{ \left(
a_{21},a_{22}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}を満たします。
プレイヤー\(i\)の広義の最適反応対応\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)がそれぞれの\(s_{-i}\in S_{-i}\)に対して定める\(b_{i}\left( s_{-i}\right) \)が1点集合である場合には、すなわち、\begin{equation*}\forall s_{-i}\in S_{-i}:\left\vert b_{i}\left( s_{-i}\right) \right\vert =1
\end{equation*}が成り立つ場合には、集合\(b_{i}\left( s_{-i}\right) \)とその唯一の要素を同一視することにより、\(b_{i}\)を\(S_{-i}\)から\(S_{i}\)への写像とみなすことができます。このような写像\begin{equation*}b_{i}:S_{-i}\rightarrow S_{i}
\end{equation*}を広義の最適反応関数(weak best response function)と呼びます。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21}\right) ,\left( a_{22}\right) \right\}
\end{eqnarray*}です。この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)は以下の通りです。
$$\begin{array}{ccc}
\hline
1\backslash 2 & \left( a_{21}\right) & \left( a_{22}\right) \\ \hline
\left( a_{11}\right) & 2^{\ast },2^{\ast } & 0,1 \\ \hline
\left( a_{12}\right) & -1,1 & 3^{\ast },2^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけています。プレイヤー\(1\)の広義の最適反応関数\(b_{1}:S_{2}\rightarrow S_{1}\)は、\begin{eqnarray*}b_{1}\left( \left( a_{21}\right) \right) &=&\left( a_{11}\right) \\
b_{1}\left( \left( a_{22}\right) \right) &=&\left( a_{12}\right)
\end{eqnarray*}を満たし、プレイヤー\(2\)の広義の最適反応関数\(b_{2}:S_{1}\rightarrow S_{2}\)は、\begin{eqnarray*}b_{2}\left( \left( a_{11}\right) \right) &=&\left( a_{21}\right) \\
b_{2}\left( \left( a_{12}\right) \right) &=&\left( a_{22}\right)
\end{eqnarray*}を満たします。
広義の純粋戦略ナッシュ均衡
繰り返しになりますが、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する広義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}:U_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq
U_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(s_{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(s_{i}^{\ast }\)を選ぶことにより自身の期待利得を最大化できることを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i}:U_{i}\left( s_{i}^{\ast
},s_{-i}^{\ast }\right) \geq U_{i}\left( s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\( \Gamma \)における広義のナッシュ均衡(weak Nash equilibrium)や広義の純粋戦略ナッシュ均衡(weak pure strategy Nash equilibrium)などと呼びます。
純粋戦略の組\(s_{I}^{\ast }\)が広義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のすべてのプレイヤーが均衡戦略にしたがい\(s_{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、広義のナッシュ均衡の定義より、\begin{equation*}U_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) \geq U_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーについて成り立ちます。
つまり、プレイヤーたちが広義のナッシュ均衡\(s_{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱しても得できません。広義のナッシュ均衡ではプレイヤーたちの戦略がお互いに最適反応になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが広義のナッシュ均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するために、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)は以下の通りです。
$$\begin{array}{ccccc}
\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},a_{22}\right) \\ \hline
\left( a_{11}\right) & 2^{\ast },1^{\ast } & 2,1^{\ast } & 0^{\ast },0 & 0,0 \\ \hline
\left( a_{12}\right) & -1,1 & 3^{\ast },2^{\ast } & -1,1 & 3^{\ast },2^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけています。表から明らかであるように、\begin{eqnarray*}&&\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right) \\
&&\left( \left( a_{12}\right) ,\left( a_{21},a_{22}\right) \right) \\
&&\left( \left( a_{12}\right) ,\left( a_{22},a_{22}\right) \right)
\end{eqnarray*}はいずれも広義の最適反応からなる組であるため、これらは広義の純粋戦略ナッシュ均衡です。
広義の純粋戦略ナッシュ均衡は存在するとは限らない
上の例から明らかであるように、広義の純粋戦略ナッシュ均衡は一意的であるとは限りません。逆に、広義の純粋戦略ナッシュ均衡は存在するとは限りません。以下の例より明らかです。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21}\right) ,\left( a_{22}\right) \right\}
\end{eqnarray*}です。この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)は以下の通りです。
$$\begin{array}{ccc}
\hline
1\backslash 2 & \left( a_{21}\right) & \left( a_{22}\right) \\ \hline
\left( a_{11}\right) & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
\left( a_{12}\right) & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけています。表から明らかであるように広義の最適反応からなる組は存在しないため、このゲームには広義の純粋戦略ナッシュ均衡が存在しません。
プレイヤー\(i\)による広義の最適反応対応\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)を用いると、プレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する広義の最適反応であることは、\begin{equation*}s_{i}^{\ast }\in b_{i}\left( s_{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)が広義の純粋戦略ナッシュ均衡であることとは、\begin{equation*}\forall i\in I:s_{i}^{\ast }\in b_{i}\left( s_{-i}^{\ast }\right)
\end{equation*}が成り立つことを意味します。
\end{equation*}が成り立つことは、\(s_{I}^{\ast }\)が広義の純粋戦略ナッシュ均衡であるための必要十分条件である。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)は以下の通りです。
$$\begin{array}{ccccc}
\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},a_{22}\right) \\ \hline
\left( a_{11}\right) & 2^{\ast },1^{\ast } & 2,1^{\ast } & 0^{\ast },0 & 0,0 \\ \hline
\left( a_{12}\right) & -1,1 & 3^{\ast },2^{\ast } & -1,1 & 3^{\ast },2^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけています。プレイヤー\(1\)の広義の最適反応対応\(b_{1}:S_{2}\twoheadrightarrow S_{1}\)は、\begin{eqnarray*}b_{1}\left( \left( a_{21},a_{21}\right) \right) &=&\left\{ \left(
a_{11}\right) \right\} \\
b_{1}\left( \left( a_{21},a_{22}\right) \right) &=&\left\{ \left(
a_{12}\right) \right\} \\
b_{1}\left( \left( a_{22},a_{21}\right) \right) &=&\left\{ \left(
a_{12}\right) \right\} \\
b_{1}\left( \left( a_{22},a_{22}\right) \right) &=&\left\{ \left(
a_{12}\right) \right\}
\end{eqnarray*}を満たし、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:S_{1}\twoheadrightarrow S_{2}\)は、\begin{eqnarray*}b_{2}\left( \left( a_{11}\right) \right) &=&\left\{ \left(
a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) \right\} \\
b_{2}\left( \left( a_{12}\right) \right) &=&\left\{ \left(
a_{21},a_{22}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}を満たします。このとき、\begin{eqnarray*}
\left( a_{11}\right) &\in &b_{1}\left( \left( a_{21},a_{21}\right) \right)
\\
\left( a_{21},a_{21}\right) &\in &b_{2}\left( \left( a_{11}\right) \right)
\end{eqnarray*}がともに成り立つため、先の命題より\(\left(\left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right) \)は広義の純粋戦略ナッシュ均衡です。また、\begin{eqnarray*}\left( a_{12}\right) &\in &b_{1}\left( \left( a_{21},a_{22}\right) \right)
\\
\left( a_{21},a_{22}\right) &\in &b_{2}\left( \left( a_{12}\right) \right)
\end{eqnarray*}がともに成り立つため、先の命題より\(\left(\left( a_{12}\right) ,\left( a_{21},a_{22}\right) \right) \)は広義の純粋戦略ナッシュ均衡です。また、\begin{eqnarray*}\left( a_{12}\right) &\in &b_{1}\left( \left( a_{22},a_{22}\right) \right)
\\
\left( a_{22},a_{22}\right) &\in &b_{2}\left( \left( a_{12}\right) \right)
\end{eqnarray*}がともに成り立つため、先の命題より\(\left(\left( a_{12}\right) ,\left( a_{22},a_{22}\right) \right) \)は広義の純粋戦略ナッシュ均衡です。
プレイヤー\(i\)による広義の最適反応対応\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)が、\begin{equation*}\forall s_{-i}\in S_{-i}:\left\vert b_{i}\left( s_{-i}\right) \right\vert =1
\end{equation*}を満たす場合には、集合\(b_{i}\left( s_{-i}\right) \)とその唯一の要素を同一視することにより、最適反応対応を写像\(b_{i}:S_{-i}\rightarrow S_{i}\)とみなすことができます。これを広義の最適反応関数と呼びました。プレイヤー\(i\)の最適反応関数\(b_{i}:S_{-i}\rightarrow S_{i}\)が存在するとき、プレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する最適反応であることは、\begin{equation*}s_{i}^{\ast }=b_{i}\left( s_{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、すべてのプレイヤーが最適反応関数を持つ場合、純粋戦略の組\(s_{I}^{\ast }=\left(s_{i}^{\ast }\right) _{i\in I}\)が純粋戦略ナッシュ均衡であることとは、\begin{equation*}\forall i\in I:s_{i}^{\ast }=b_{i}\left( s_{-i}^{\ast }\right)
\end{equation*}が成り立つこととして表現可能です。
\end{equation*}が成り立つことは、\(s_{I}^{\ast }\)が広義の純粋戦略ナッシュ均衡であるための必要十分条件である。
プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21}\right) ,\left( a_{22}\right) \right\}
\end{eqnarray*}です。この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)は以下の通りです。
$$\begin{array}{ccc}
\hline
1\backslash 2 & \left( a_{21}\right) & \left( a_{22}\right) \\ \hline
\left( a_{11}\right) & 2^{\ast },2^{\ast } & 0,1 \\ \hline
\left( a_{12}\right) & -1,1 & 3^{\ast },2^{\ast } \\ \hline
\end{array}$$
上の表ではプレイヤーが広義の最適反応を選択した場合に直面する期待利得に印\(\ast \)をつけています。プレイヤー\(1\)の広義の最適反応関数\(b_{1}:S_{2}\rightarrow S_{1}\)は、\begin{eqnarray*}b_{1}\left( \left( a_{21}\right) \right) &=&\left( a_{11}\right) \\
b_{1}\left( \left( a_{22}\right) \right) &=&\left( a_{12}\right)
\end{eqnarray*}を満たし、プレイヤー\(2\)の広義の最適反応関数\(b_{2}:S_{1}\rightarrow S_{2}\)は、\begin{eqnarray*}b_{2}\left( \left( a_{11}\right) \right) &=&\left( a_{21}\right) \\
b_{2}\left( \left( a_{12}\right) \right) &=&\left( a_{22}\right)
\end{eqnarray*}を満たします。このとき、\begin{eqnarray*}
\left( a_{11}\right) &=&b_{1}\left( \left( a_{21}\right) \right) \\
\left( a_{21}\right) &=&b_{2}\left( \left( a_{11}\right) \right)
\end{eqnarray*}がともに成り立つため、先の命題より\(\left(\left( a_{11}\right) ,\left( a_{21}\right) \right) \)は広義の純粋戦略ナッシュ均衡です。また、\begin{eqnarray*}\left( a_{12}\right) &=&b_{1}\left( \left( a_{22}\right) \right) \\
\left( a_{22}\right) &=&b_{2}\left( \left( a_{12}\right) \right)
\end{eqnarray*}がともに成り立つため、先の命題より\(\left(\left( a_{12}\right) ,\left( a_{22}\right) \right) \)は広義の純粋戦略ナッシュ均衡です。
演習問題
,a_{02}\right) =\frac{1}{2}
\end{equation*}を満たすものとします。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】