戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限りませんし、存在する場合にも一意的であるとは限りません。

純粋戦略最適反応

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I}\right) \)として表現されているものとします。ゲームの静学性より、プレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ純粋戦略の組\(s_{-i}\in S_{-i}\)を事前に観察することはできません。ただ、ゲームの完備性より、プレイヤー\(i\)は、他のプレイヤーたちが選択し得る純粋戦略の組からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して、自身の利得\(u_{i}\left( s_{i},s_{-i}\right) \)を最大化するような自身の純粋戦略\(s_{i}^{\ast }\)を事前に特定することはできます。そのような純粋戦略\(s_{i}^{\ast }\)を\(s_{-i}\)に対する純粋戦略最適反応(pure best response)や最適反応(best response)などと呼びます。

より正確には、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する最適反応であることとは、\begin{equation*}
\forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq
u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}すなわち、\begin{equation*}
u_{i}(s_{i}^{\ast },s_{-i})=\max_{s_{i}\in S_{i}}u_{i}(s_{i},s_{-i})
\end{equation*}が成り立つこととして定義されます。つまり、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで最大化されるということです。

プレイヤー\(i\)の純粋戦略最適反応は、他のプレイヤーたちの純粋戦略の組に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の最適反応は\(s_{i}^{\ast }\)であるとは限りません。これは以下の例からも明らかです。

例(純粋戦略最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 2,8 \\ \hline
D & 8,2 & 0,0 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(1\)の純粋戦略最適反応について考えます。プレイヤー\(2\)の戦略\(L\)に対しては、\begin{equation*}
u_{1}\left( U,L\right) =5<8=u_{1}\left( D,L\right)
\end{equation*}が成り立つため、\(L\)に対するプレイヤー\(1\)の最適反応は\(D\)です。また、プレイヤー\(2\)の戦略\(R\)に対しては、\begin{equation*}
u_{1}\left( U,R\right) =2>0=u_{1}\left( D,R\right)
\end{equation*}が成り立つため、\(R\)に対するプレイヤー\(1\)の最適反応は\(U\)です。同様に考えると、プレイヤー\(1\)の\(U\)に対するプレイヤー\(2\)の最適反応は\(R\)であり、プレイヤー\(1\)の\(D\)に対するプレイヤー\(2\)の最適反応は\(L\)です。

以下の例が示すように、純粋戦略最適反応は1つであるとは限りません。

例(純粋戦略最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(1\)にとって、プレイヤー\(2\)の戦略\(L\)に対する最適反応は\(U,D\)の2つであり、戦略\(R\)に対する最適反応は\(D\)です。一方、プレイヤー\(2\)にとって、プレイヤー\(1\)の戦略\(U\)に対する最適反応は\(L,R\)の2つであり、戦略\(D\)に対する最適反応は\(R\)です。

 

純粋戦略ナッシュ均衡

繰り返しになりますが、戦略型ゲーム\(G\)においてプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する最適反応であることとは、\begin{equation*}
\forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq
u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する最適反応になっているならば、すなわち、\begin{equation*}
\forall i\in I,\ \forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast
},s_{-i}^{\ast }\right) \geq u_{i}\left( s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の純粋戦略ナッシュ均衡(pure Nash equilibrium)やナッシュ均衡(Nash equilibrium)などと呼びます。

純粋戦略の組\(s_{I}^{\ast }\)がナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のすべてのプレイヤーがナッシュ均衡にしたがい\(s_{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけがナッシュ均衡\(s_{I}^{\ast }\)における均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、ナッシュ均衡の定義より、\begin{equation*}
u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) \geq u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちがナッシュ均衡\(s_{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱しても得できません。ナッシュ均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちがナッシュ均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するために、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

例(純粋戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,\underline{8} \\ \hline
D & \underline{8},0 & \underline{2},\underline{2} \\ \hline
\end{array}$$
表:利得行列

表にはそれぞれのプレイヤーが最適反応を選んだときに自身が得る利得に下線を引いてあります。表から明らかであるように純粋戦略の組\(\left( D,R\right) \)は最適反応の組であるため、これはナッシュ均衡です。

以下の例が示すように、純粋戦略ナッシュ均衡は存在するとは限りません。

例(純粋戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & -1,\underline{1} & \underline{1},-1 \\ \hline
D & \underline{1},-1 & -1,\underline{1} \\ \hline
\end{array}$$
表:利得行列

表にはそれぞれのプレイヤーが最適反応を選んだときに自身が得る利得に下線を引いてあります。表から明らかであるように最適反応の組は存在しないため、このゲームにはナッシュ均衡が存在しません。

以下の例が示すように、純粋戦略ナッシュ均衡が存在する場合、それは1つであるとは限りません。

例(純粋戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \underline{5},\underline{5} & 0,\underline{5} \\ \hline
D & \underline{5},0 & \underline{2},\underline{2} \\ \hline
\end{array}$$
表:利得行列

表にはそれぞれのプレイヤーが最適反応を選んだときに自身が得る利得に下線を引いてあります。表から明らかであるように、純粋戦略の組\(\left( U,L\right) ,\left( D,R\right) \)はともに最適反応の組であるため、これらはともにナッシュ均衡です。

 

純粋戦略最適反応対応と純粋戦略ナッシュ均衡

繰り返しになりますが、戦略型ゲーム\(G\)において、プレイヤー\(i\)の最適反応は他のプレイヤーたちの戦略の組\(s_{-i}\)に依存して変化します。また、それぞれの\(s_{-i}\)に対するプレイヤー\(i\)の最適反応は1つであるとは限りません。以上を踏まえた上で、それぞれの\(s_{-i}\in S_{-i}\)に対して、それに対するプレイヤー\(i\)の最適反応からなる\(S_{i}\)の部分集合\begin{equation*}
b_{i}(s_{-i})=\{s_{i}^{\ast }\in S_{i}\ |\ u_{i}(s_{i}^{\ast
},s_{-i})=\max_{s_{i}\in S_{i}}u_{i}(s_{i},s_{-i})\}
\end{equation*}を像として定める対応\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)を定義し、これをプレイヤー\(i\)の純粋最適反応対応(pure best response correspondence)や最適反応対応(best response correspondence)などと呼びます。

例(純粋戦略最適反応対応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(1\)の最適反応対応\(b_{1}:S_{2}\twoheadrightarrow S_{1}\)は、\begin{eqnarray*}
b_{1}\left( L\right) &=&\left\{ U,D\right\} \\
b_{1}\left( R\right) &=&\left\{ D\right\}
\end{eqnarray*}を満たし、プレイヤー\(2\)の最適反応対応\(b_{2}:S_{1}\twoheadrightarrow S_{2}\)は、\begin{eqnarray*}
b_{2}\left( U\right) &=&\left\{ L,R\right\} \\
b_{2}\left( D\right) &=&\left\{ R\right\}
\end{eqnarray*}を満たします。

プレイヤー\(i\)の最適反応対応\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)を用いると、プレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する最適反応であることは、\begin{equation*}
s_{i}^{\ast }\in b_{i}\left( s_{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)が純粋戦略ナッシュ均衡であることとは、\begin{equation*}
\forall i\in I:s_{i}^{\ast }\in b_{i}\left( s_{-i}^{\ast }\right)
\end{equation*}が成り立つこととして表現可能です。

命題(純粋戦略最適反応対応と純粋戦略ナッシュ均衡)
戦略型ゲーム\(G\)において、それぞれのプレイヤー\(i\in I\)の純粋戦略最適反応対応を\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)で表す。このとき、純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)について、\begin{equation*}
\forall i\in I:s_{i}^{\ast }\in b_{i}\left( s_{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(s_{I}^{\ast }\)が純粋戦略ナッシュ均衡であるための必要十分条件である。
証明を見る(プレミアム会員限定)
例(純粋戦略最適反応対応と純粋戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(1\)の最適反応対応\(b_{1}:S_{2}\twoheadrightarrow S_{1}\)は、\begin{eqnarray*}
b_{1}\left( L\right) &=&\left\{ U,D\right\} \\
b_{1}\left( R\right) &=&\left\{ D\right\}
\end{eqnarray*}を満たし、プレイヤー\(2\)の最適反応対応\(b_{2}:S_{1}\twoheadrightarrow S_{2}\)は、\begin{eqnarray*}
b_{2}\left( U\right) &=&\left\{ L,R\right\} \\
b_{2}\left( D\right) &=&\left\{ R\right\}
\end{eqnarray*}を満たします。このとき、\begin{eqnarray*}
U &\in &b_{1}\left( L\right) \\
L &\in &b_{2}\left( U\right)
\end{eqnarray*}がともに成り立つため、\(\left( U,L\right) \)は純粋戦略ナッシュ均衡です。また、\begin{eqnarray*}
D &\in &b_{1}\left( R\right) \\
R &\in &b_{2}\left( D\right)
\end{eqnarray*}がともに成り立つため、\(\left( D,R\right) \)もまた純粋戦略ナッシュ均衡です。

戦略型ゲーム\(G\)において、プレイヤー\(i\)の最適反応対応\(b_{i}:S_{-i}\twoheadrightarrow S_{i}\)がそれぞれの\(s_{-i}\in S_{-i}\)に対して定める\(S_{i}\)の部分集合\(b_{i}\left( s_{-i}\right) \)が1点集合である場合、すなわち、\begin{equation*}
\forall s_{-i}\in S_{-i}:\left\vert b_{i}\left( s_{-i}\right) \right\vert =1
\end{equation*}が成り立つ場合には、集合\(b_{i}\left( s_{-i}\right) \)とその唯一の要素を同一視することにより、最適反応対応\(b_{i}\)を\(S_{-i}\)から\(S_{i}\)への写像とみなすことができます。このような写像\(b_{i}:S_{-i}\rightarrow S_{i}\)を純粋最適反応関数(pure best response function)や最適反応関数(best response function)などと呼びます。

例(純粋戦略最適反応関数)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 2,8 \\ \hline
D & 8,2 & 0,0 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(1\)の最適反応関数\(b_{1}:S_{2}\rightarrow S_{1}\)は、\begin{eqnarray*}
b_{1}\left( L\right) &=&D \\
b_{1}\left( R\right) &=&U
\end{eqnarray*}を満たし、プレイヤー\(2\)の最適反応関数\(b_{2}:S_{1}\rightarrow S_{2}\)は、\begin{eqnarray*}
b_{2}\left( U\right) &=&R \\
b_{2}\left( D\right) &=&L
\end{eqnarray*}を満たします。

プレイヤー\(i\)の最適反応関数\(b_{i}:S_{-i}\rightarrow S_{i}\)が存在するとき、プレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する最適反応であることは、\begin{equation*}
s_{i}^{\ast }=b_{i}\left( s_{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、すべてのプレイヤーが最適反応関数を持つ場合、純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)が純粋戦略ナッシュ均衡であることとは、\begin{equation*}
\forall i\in I:s_{i}^{\ast }=b_{i}\left( s_{-i}^{\ast }\right)
\end{equation*}が成り立つこととして表現可能です。

命題(純粋戦略最適反応関数と純粋戦略ナッシュ均衡)
戦略型ゲーム\(G\)において、任意のプレイヤー\(i\in I\)が純粋戦略最適反応関数\(b_{i}:S_{-i}\rightarrow S_{i}\)を持つ場合、純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)について、\begin{equation*}
\forall i\in I:s_{i}^{\ast }=b_{i}\left( s_{-i}^{\ast }\right)
\end{equation*}が成り立つことは、\(s_{I}^{\ast }\)が純粋戦略ナッシュ均衡であるための必要十分条件である。
証明を見る(プレミアム会員限定)
例(純粋戦略最適反応関数と純粋戦略ナッシュ均衡)
プレイヤー集合が\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合が\(S_{i}=\left[ 0,1\right] \)であるものとします。また、利得関数は、\begin{eqnarray*}
u_{1}\left( s_{1},s_{2}\right) &=&\left[ 1-\left( s_{1}+s_{2}\right) \right] s_{1} \\
u_{2}\left( s_{1},s_{2}\right) &=&\left[ 1-\left( s_{1}+s_{2}\right) \right] s_{2}
\end{eqnarray*}であるものとします。プレイヤー\(2\)の戦略\(s_{2}\)に対するプレイヤー\(1\)の最適反応は、\begin{equation*}
\frac{\partial u_{1}\left( s_{1},s_{2}\right) }{\partial s_{1}}=0
\end{equation*}すなわち、\begin{equation*}
1-2s_{1}-s_{2}=0
\end{equation*}を満たす戦略\(s_{1}\)です。したがって、プレイヤー\(1\)の最適反応関数\(b_{1}:\left[ 0,1\right] \rightarrow \left[ 0,1\right] \)が存在し、これはそれぞれの\(s_{2}\in \left[ 0,1\right] \)に対して、\begin{equation}
b_{1}\left( s_{2}\right) =\frac{1-s_{2}}{2} \tag{1}
\end{equation}を像として定めます。同様に、プレイヤー\(2\)の最適反応関数\(b_{2}:\left[ 0,1\right] \rightarrow \left[ 0,1\right] \)が存在し、これはそれぞれの\(s_{1}\in \left[ 0,1\right] \)に対して、\begin{equation}
b_{2}\left( s_{1}\right) =\frac{1-s_{1}}{2} \tag{2}
\end{equation}を像として定めます。純粋戦略ナッシュ均衡\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)が存在する場合には、先の命題より、\begin{eqnarray*}
s_{1}^{\ast } &=&b_{1}\left( s_{2}^{\ast }\right) \\
s_{2}^{\ast } &=&b_{2}\left( s_{1}^{\ast }\right)
\end{eqnarray*}がともに成り立ちます。\(\left( 1\right) ,\left( 2\right) \)を用いると、これは、\begin{eqnarray*}
s_{1}^{\ast } &=&\frac{1-s_{2}^{\ast }}{2} \\
s_{2}^{\ast } &=&\frac{1-s_{1}^{\ast }}{2}
\end{eqnarray*}と言い換え可能です。これを解くと、\begin{equation*}
\left( s_{1}^{\ast },s_{2}^{\ast }\right) =\left( \frac{1}{3},\frac{1}{3}\right)
\end{equation*}を得ます。

次回は狭義の純粋戦略ナッシュ均衡について解説します。
次へ進む 質問・コメントを投稿する 演習問題(プレミアム会員限定)

Share on facebook
Share on twitter
Share on email
Share on print

ワイズをさらに活用するための会員サービス

ユーザー名とメールアドレスを入力して一般会員に無料登録すれば、質問やコメントを投稿できるようになります。さらに、有料(500円/月)のプレミアム会員へアップグレードすることにより、プレミアムコンテンツ(命題の証明や演習問題、解答など)にアクセスできます。
会員サービス

ディスカッションに参加しますか?

質問やコメントを投稿するためにはログインが必要です
ログイン

完備情報の静学ゲーム
アカウント
ログイン