WIIS

完備情報の静学ゲーム

狭義のナッシュ均衡

目次

Mailで保存
Xで共有

純粋戦略の範囲での狭義の最適反応

問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

ゲームの静学性より、それぞれのプレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ純粋戦略\(s_{-i}\in S_{-i}\)を事前に観察できません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る純粋戦略からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して、自分が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得られる利得\(u_{i}\left( s_{i},s_{-i}\right) \)を把握しています。

以上を踏まえた上で、他のプレイヤーたちがある純粋戦略\(s_{-i}\in S_{-i}\)を選ぶ状況を想定したとき、自身が純粋戦略\(s_{i}^{\ast }\in S_{i}\)を選んだときに得る利得\(u_{i}\left(s_{i}^{\ast },s_{-i}\right) \)が他の任意の純粋戦略\(s_{i}\in S_{i}\backslash \left\{s_{i}^{\ast }\right\} \)を選んだときに得られる利得よりも大きい場合には、すなわち、\begin{equation*}\forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast }\right\} :u_{i}\left(
s_{i}^{\ast },s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つのであれば、\(s_{i}^{\ast }\)は\(s_{-i}\)に対する狭義の最適反応(strict best response)であると言います。これは、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで狭義に最大化されることを意味します。

プレイヤー\(i\)の狭義の最適反応は、他のプレイヤーたちの純粋戦略に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の狭義の最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の狭義の最適反応は\(s_{i}^{\ast}\)と一致するとは限りません。以下の例より明らかです。

例(狭義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 2,8 \\ \hline
D & 8,2 & 0,0 \\ \hline
\end{array}$$

プレイヤー\(1\)については、\begin{eqnarray*}u_{1}\left( D,L\right) &=&8>5=u_{1}\left( U,L\right) \\
u_{1}\left( U,R\right) &=&2>0=u_{1}\left( D,R\right)
\end{eqnarray*}が成り立つため、相手の\(L\)に対する狭義の最適反応は\(D\)である一方、相手の\(R\)に対する狭義の最適反応は\(U\)です。プレイヤー\(2\)については、\begin{eqnarray*}u_{2}\left( U,R\right) &=&8>5=u_{2}\left( U,L\right) \\
u_{2}\left( D,L\right) &=&2>0=u_{2}\left( D,R\right)
\end{eqnarray*}が成り立つため、相手の\(U\)に対する狭義の最適反応は\(R\)である一方、相手の\(D\)に対する狭義の最適反応は\(L\)です。

 

狭義の最適反応は存在するとは限らない

以下の例が示唆するように、それぞれのプレイヤーは、他のプレイヤーたちの戦略に対する狭義の最適反応を持つとは限りません。

例(狭義の最適反応が存在しない場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 5,5 \\ \hline
D & 5,5 & 5,5 \\ \hline
\end{array}$$

プレイヤー\(1\)について、\begin{eqnarray*}u_{1}\left( U,L\right) &=&5=u_{1}\left( D,L\right) \\
u_{1}\left( U,R\right) &=&5=u_{1}\left( D,R\right)
\end{eqnarray*}が成り立ちますが、以上の事実は、相手の\(L\)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応がいずれも存在しないことを意味します。プレイヤー\(2\)についても同様です。

 

狭義の最適反応は一意的

他のプレイヤーたちのある純粋戦略\(s_{-i}\)に注目したとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限らないことが明らかになりました。一方、\(s_{-i}\)に対する狭義の最適反応が存在する場合、それは一意的です。

命題(狭義の最適反応の一意性)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{i}\)に対する狭義の最適反応を持つ場合、それは一意的である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

混合戦略の範囲での狭義の最適反応

戦略型ゲーム\(G\)においてプレイヤーたちが混合戦略を選択する状況を想定する場合、その戦略的状況は\(G\)の混合拡張\begin{equation*}G^{\ast }=(I,\{\Delta \left( S_{i}\right) \}_{i\in I},\{F_{i}\}_{i\in I})
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(\Delta \left( S_{i}\right) \)はプレイヤー\(i\in I\)の混合戦略集合、\(F_{i}:\Delta \left( S_{I}\right)\rightarrow \mathbb{R} \)はプレイヤー\(i\)の期待利得関数です。

狭義の最適反応の概念は混合戦略を対象とした場合にも容易に拡張できます。具体的には以下の通りです。

ゲームの静学性より、それぞれのプレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ混合戦略\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)を事前に観察できません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る混合戦略からなる集合\(\Delta \left( S_{-i}\right) \)を把握しているため、その要素であるそれぞれの組\(\sigma _{-i}\)に対して、自分が混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)を選んだときに直面する期待利得\(F_{i}\left( \sigma _{i},\sigma_{-i}\right) \)を把握しています。

以上を踏まえた上で、他のプレイヤーたちがある混合戦略\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)を選ぶ状況を想定したとき、自身が混合戦略\(\sigma _{i}^{\ast}\in \Delta \left( S_{i}\right) \)を選んだときに直面する期待利得\(F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right) \)が他の任意の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma_{i}^{\ast }\right\} \)を選んだときに直面する期待利得よりも大きい場合には、すなわち、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する狭義の最適反応(strict best response)であると言います。これは、\(\sigma _{-i}\)を所与としたとき、プレイヤー\(i\)が直面する期待利得は\(\sigma _{i}^{\ast }\)のもとで狭義に最大化されることを意味します。

純粋戦略は特別な混合戦略であるため、混合戦略が混合戦略の組に対する狭義の最適反応であることの意味を規定する上の定義は、純粋戦略が純粋戦略の組に対する狭義の最適反応であること、混合戦略が純粋戦略の組に対する狭義の最適反応であること、純粋戦略が混合戦略の組に対する狭義の最適反応であることの定義などを内包しています。

繰り返しになりますが、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略\(\sigma _{-i}\)に対する狭義の最適反応であることは、\begin{equation}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right) \quad \cdots (1)
\end{equation}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより期待利得を狭義で最大化できることを意味します。ただ、たとえプレイヤー\(i\)が有限個の純粋戦略を持つ場合でも混合戦略の個数は無限であり、多くの場合、無限個の混合戦略を対象に\(\left( 1\right) \)が成り立つことを検証するのは実質的に不可能です。ただ、このような問題は解決可能です。

実は、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略\(\sigma _{i}\)に対する狭義の最適反応である場合、\(\sigma _{i}^{\ast }\)は純粋戦略であることが保証されます。

命題(狭義の最適反応は純粋戦略)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略からなる組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する狭義の最適反応である場合、\(\sigma _{i}^{\ast }\)は純粋戦略になる。つまり、\(\sigma _{i}^{\ast }\in S_{i}\)が成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題より、すべてのプレイヤーが混合戦略を採用することを認める場合においても、狭義の最適反応の候補を純粋戦略に限定しても一般性は失われないことが明らかになりました。

 

狭義の純粋戦略ナッシュ均衡

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。先に定義したように、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する狭義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}\backslash \{s_{i}^{\ast }\}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(s_{-i}\)が選択することを想定した場合、プレイヤー\(i\)は\(s_{i}^{\ast }\)を選ぶことにより自身の利得を狭義に最大化できることを意味します。

プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast}\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} :u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)を\(G\)における狭義の純粋戦略ナッシュ均衡(strict pure Nash equilibrium)や狭義のナッシュ均衡(strict Nash equilibrium)などと呼びます。

純粋戦略の組\(s_{I}^{\ast }\)が狭義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のプレイヤーたちが均衡戦略にしたがい\(s_{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、狭義のナッシュ均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱によって損をしてしまいます。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱すると損をしてしまいます。狭義の純粋戦略ナッシュ均衡ではプレイヤーたちの戦略がお互いに狭義の最適反応になっているため、全員がそこに留まる動機を持つということです。ただし、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast}\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

例(狭義の純粋戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8^{\ast } \\ \hline
D & 8^{\ast },0 & 2^{\ast },2^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これは狭義の純粋戦略ナッシュ均衡です。

 

狭義の純粋戦略ナッシュ均衡は存在するとは限らない

ゲームには狭義の純粋戦略ナッシュ均衡は存在するとは限りません。まずは、プレイヤーたちがそもそも狭義の最適反応を持たない例を挙げます。

例(狭義の純粋戦略ナッシュ均衡が存在しない場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 5,5 \\ \hline
D & 5,5 & 5,5 \\ \hline
\end{array}$$

プレイヤー\(1\)は相手の\(L\)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応を持ちません。プレイヤー\(2\)もまた相手の\(L\)に対する狭義の最適反応や、相手の\(R\)に対する狭義の最適反応を持ちません。したがって、このゲームには狭義の最適反応からなる組、すなわち狭義の純粋戦略ナッシュ均衡は存在しません。

続いて、プレイヤーたちが狭義の最適反応を持つにもかかわらず、狭義の純粋戦略ナッシュ均衡は存在しない例を挙げます。

例(狭義の純粋戦略ナッシュ均衡が存在しない場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
D & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、このゲームには狭義の最適反応からなる組、すなわち狭義の純粋戦略ナッシュ均衡は存在しません。

 

狭義の純粋戦略ナッシュ均衡は一意的であるとは限らない

ゲームには狭義の純粋戦略ナッシュ均衡は存在するとは限らないことが明らかになりました。加えて、狭義の純粋戦略ナッシュ均衡が存在する場合、それは1つだけであるとは限りません。以下の例より明らかです。

例(複数の狭義の純粋戦略ナッシュ均衡が存在する場合)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 2^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーが狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( U,L\right) ,\ \left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これらはともに狭義の純粋戦略ナッシュ均衡です。

 

狭義の混合戦略ナッシュ均衡

狭義のナッシュ均衡の概念は戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においても容易に拡張されます。先に定義したように、プレイヤー\(i\in I\)の混合戦略\(\sigma_{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する狭義の最適反応であることとは、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)が選択することを想定した場合、プレイヤー\(i\)は\(\sigma _{i}^{\ast }\)を選ぶことにより自身が直面する期待利得を狭義に最大化できることを意味します。

プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma_{i}^{\ast }\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma_{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
\backslash \left\{ \sigma _{i}^{\ast }\right\} :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) >F_{i}\left( \sigma _{i},\sigma
_{-i}\right)
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)を狭義の混合戦略ナッシュ均衡(strict mixed Nash equilibrium)や狭義のナッシュ均衡(strict Nash equilibrium)などと呼びます。

ただし、先に明らかにしたように、プレイヤー\(i\)の混合戦略\(\sigma_{i}^{\ast }\)が他のプレイヤーたちの混合戦略\(\sigma _{i}\)に対する狭義の最適反応である場合、\(\sigma _{i}^{\ast }\)は純粋戦略であることが保証されるため以下の命題が成り立ちます。

命題(狭義の混合戦略ナッシュ均衡は狭義の純粋戦略ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)に狭義の混合戦略ナッシュ均衡\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在する場合、\(\sigma _{I}^{\ast }\)は狭義の純粋戦略ナッシュ均衡になる。つまり、\(\sigma _{I}^{\ast }\in S_{I}\)が成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題より、すべてのプレイヤーが混合戦略を採用することを認める場合においても、狭義のナッシュ均衡の候補を狭義の純粋戦略ナッシュ均衡に限定しても一般性は失われないことが明らかになりました。

 

演習問題

問題(狭義の純粋戦略ナッシュ均衡)
自治体の首長選挙へ出馬するにあたり、ある政党から公認を得ようとしている2人がゲームのプレイヤーです。公認枠は1人だけです。2人はそれぞれ「公認をめぐって争う」か「公認をめぐって争わない」かのどちらか一方を選択します。2人がともに公認をめぐって争う場合、どちらか一方が政党から公認を得て首長選へ出馬することになります。ただ、公認をめぐる激しい争いは資金面での枯渇や人間関係のトラブルをもたらすため、仮に公認を得て首長選へ出馬できた場合でにも落選が確実です。これは双方にとって最悪の結果です。また、1人が公認を求め、もう1人が身を引く場合、公認を求めた方が実際に公認を得て、その後の首長選でも確実に勝利できます。身を引いた方は首長選に立候補できませんが、公認をめぐる激しい争いは回避できます。また、双方が公認から身を引く場合、双方ともに首長選へ出馬できませんが、公認をめぐる激しい争いは回避できます。以上の状況を戦略型ゲーム\(G\)として定式化した上で、広義の純粋戦略ナッシュ均衡が存在するかどうか議論してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録