戦略型ゲームにおいてプレイヤーたちの純戦略の組に注目したときに、その組を構成する純戦略がお互いに純最適反応になっているならば、その組を純ナッシュ均衡と呼びます。一般に、純ナッシュ均衡は存在するとは限りませんし、存在する場合にも一意的であるとは限りません。

2019年3月1日:公開

純最適反応

戦略型ゲーム\(G\)においてプレイヤー\(i\)が他のプレイヤーたちの純戦略の組\(s_{-i}\)に直面したときに、自分のある純戦略\(s_{i}^{\ast }\)が自分の利得を最大化するならば、すなわち、\begin{equation*}
\forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つならば、\(s_{i}^{\ast }\)は\(s_{-i}\)に対する純最適反応(pure best response)や弱最適反応(weakly best response)などと言います。

プレイヤー\(i\)の純戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純戦略の組\(s_{-i}\)に対する純最適反応であることは、\(s_{i}^{\ast }\)が以下の最大化問題\begin{equation*}
\max_{s_{i}\in S_{i}}u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}の解であることを意味します。言い換えると、プレイヤー\(i\)について、\begin{equation*}
s_{i}^{\ast }\in \mathrm{argmax}_{s_{i}\in S_{i}}u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つということです。

ここで定義されたプレイヤー\(i\)の最適反応は、他のプレイヤーたちの特定の純戦略の組\(s_{-i}\)に対して定義される概念である点に注意する必要があります。したがって、\(s_{-i}\)に対する純最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の組\(s_{-i}^{\prime }\)に対する純最適反応は\(s_{i}^{\ast }\)と一致するとは限りません。

例(純最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(1\)にとって、プレイヤー\(2\)の純戦略\(L\)に対する最適反応は純戦略\(D\)であり、純戦略\(R\)に対する最適反応もまた\(D\)です。一方、プレイヤー\(2\)にとって、プレイヤー\(1\)の純戦略\(U\)に対する最適反応は純戦略\(R\)であり、純戦略\(D\)に対する最適反応もまた\(R\)です。

以下の例が示すように、純最適反応は一意的に定まるとは限りません。

例(純最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(1\)にとって、プレイヤー\(2\)の純戦略\(L\)に対する最適反応は\(U,D\)の 2 つです。また、\(R\)に対する最適反応は\(D\)です。一方、プレイヤー\(2\)にとって、プレイヤー\(1\)の純戦略\(U\)に対する最適反応は\(L,R\)の 2 つです。また、\(D\)に対する最適反応は\(R\)です。

 

純ナッシュ均衡

繰り返しになりますが、戦略型ゲーム\(G\)においてプレイヤー\(i\)の純戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純戦略の組\(s_{-i}\)に対する純最適反応であるとは、\begin{equation*}
\forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの純戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)において、任意のプレイヤー\(i\)の純戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純戦略の組\(s_{-i}^{\ast }\)に対する純最適反応になっているならば、すなわち、\begin{equation*}
\forall i\in I,\ \forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) \geq u_{i}\left( s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の純ナッシュ均衡(pure Nash equilibrium)と呼びます。

純戦略の組\(s_{I}^{\ast }\)が純ナッシュ均衡であるものとします。また、プレイヤー\(i\)を任意に選びます。他のプレイヤーたちが純ナッシュ均衡にしたがい\(s_{-i}^{\ast }\)をプレーすることを前提とするとき、プレイヤー\(i\)だけが純ナッシュ均衡から逸脱して\(s_{i}^{\ast }\)とは違う純戦略\(s_{i}\)を選んでも、純ナッシュ均衡の定義より、プレイヤー\(i\)は得できる可能性はありません。

例(純ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,\ 5 & 0,\ \underline{8} \\ \hline
D & \underline{8},\ 0 & \underline{2},\ \underline{2} \\ \hline
\end{array}$$

表:利得行列

表にはそれぞれのプレイヤーが純最適反応を選んだときに自身が得る利得に下線を引いてあります。表から明らかであるように純戦略の組\(\left( D,R\right) \)は純最適反応の組であるため、これは純ナッシュ均衡です。

 

純ナッシュ均衡は存在するとは限らない

以下の例が示すように、純ナッシュ均衡は存在するとは限りません。

例(純ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & -1,\underline{1} & \underline{1},-1 \\ \hline
D & \underline{1},-1 & -1,\underline{1} \\ \hline
\end{array}$$

表:利得行列

表にはそれぞれのプレイヤーが純最適反応を選んだときに自身が得る利得に下線を引いてあります。表から明らかであるように純最適反応の組は存在しないため、このゲームには純ナッシュ均衡が存在しません。

 

純ナッシュ均衡は一意的とは限らない

以下の例が示すように、純ナッシュ均衡が存在する場合にそれは一意的であるとは限りません。

例(純ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \underline{5},\underline{5} & 0,\underline{5} \\ \hline
D & \underline{5},0 & \underline{2},\underline{2} \\ \hline
\end{array}$$

表:利得行列

表にはそれぞれのプレイヤーが純最適反応を選んだときに自身が得る利得に下線を引いてあります。表から明らかであるように純戦略の組\(\left( U,L\right) ,\left( D,R\right) \)はともに純最適反応の組であるため、これらは純ナッシュ均衡です。

次回は狭義の純ナッシュ均衡について解説します。
次へ進む 演習問題(プレミアム会員限定)