教材一覧
教材一覧
教材検索
STATIC GAME OF COMPLETE INFORMATION

狭義の純粋戦略ナッシュ均衡

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

純粋戦略の範囲での狭義の最適反応

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。復習になりますが、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する広義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) \geq
u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つこととして定義されます。つまり、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで最大化されるということです。特に、上の式が狭義の不等号で成立する場合には、すなわち、\begin{equation*}\forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast }\right\} :u_{i}\left(
s_{i}^{\ast },s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つ場合には、\(s_{i}^{\ast }\)は\(s_{-i}\)に対する狭義の最適反応(strict best response)であると言います。これは、\(s_{-i}\)を所与としたとき、プレイヤー\(i\)が得る利得は\(s_{i}^{\ast }\)のもとで狭義に最大化されるということです。

プレイヤー\(i\)による狭義の最適反応は、他のプレイヤーたちの純粋戦略の組に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の狭義の最適反応が\(s_{i}^{\ast }\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の狭義の最適反応は\(s_{i}^{\ast }\)であるとは限りません。以下の例より明らかです。

例(狭義の最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 2,8 \\ \hline
D & 8,2 & 0,0 \\ \hline
\end{array}$$

表:狭義の最適反応

プレイヤー\(1\)の狭義の最適反応について考えます。プレイヤー\(2\)の戦略\(L\)に対しては、\begin{equation*}u_{1}\left( U,L\right) =5<8=u_{1}\left( D,L\right)
\end{equation*}が成り立つため、\(L\)に対するプレイヤー\(1\)の狭義の最適反応は\(D\)です。また、プレイヤー\(2\)の戦略\(R\)に対しては、\begin{equation*}u_{1}\left( U,R\right) =2>0=u_{1}\left( D,R\right)
\end{equation*}が成り立つため、\(R\)に対するプレイヤー\(1\)の狭義の最適反応は\(U\)です。一方、プレイヤー\(1\)の戦略\(U\)に対するプレイヤー\(2\)の狭義の最適反応は\(R\)であり、プレイヤー\(1\)の戦略\(D\)に対するプレイヤー\(2\)の狭義の最適反応は\(L\)です。

他のプレイヤーたちの純粋戦略の組\(s_{-i}\)が与えられたとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限りません。以下の例より明らかです。

例(狭義の最適反応)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$

表:狭義の最適反応

プレイヤー\(1\)にとって、プレイヤー\(2\)の戦略\(L\)に対する狭義の最適反応は存在しません。なぜなら、\begin{equation*}u_{1}\left( U,L\right) =u_{1}\left( D,L\right) =5
\end{equation*}が成り立つからです。

他のプレイヤーたちの純粋戦略の組\(s_{-i}\)が与えられたとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限りませんが、存在する場合には一意的です。実際、プレイヤー\(i\)が\(s_{-i}\)に対して異なる2つの狭義の最適反応\(s_{i},s_{i}^{\prime }\)を持つものと仮定すると、狭義の最適反応の定義より、\begin{eqnarray*}u_{i}\left( s_{i},s_{-i}\right) &>&u_{i}\left( s_{i}^{\prime
},s_{-i}\right) \\
u_{i}\left( s_{i}^{\prime },s_{-i}\right) &>&u_{i}\left(
s_{i},s_{-i}\right)
\end{eqnarray*}がともに成り立ちますが、これは矛盾です。

命題(狭義の最適反応の一意性)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{i}\)に対する狭義の最適反応を持つ場合、それは一意的である。

他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対して、プレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が狭義の最適反応であるならば、これは広義の最適反応でもあります。しかも、これは\(s_{-i}\)に対する唯一の広義の最適反応です。

命題(狭義の最適反応と広義の最適反応の関係)
戦略型ゲーム\(G\)においてプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する狭義の最適反応であるならば、\(s_{i}^{\ast }\)は\(s_{-i}\)に対する唯一の広義の最適反応である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題の逆は成り立つとは限りません。つまり、\(s_{-i}\)に対する広義の最適反応は狭義の最適反応であるとは限らないということです。以下の例より明らかです。

例(狭義の最適反応と広義の最適反応の関係)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(1\)にとって、プレイヤー\(2\)の純粋戦略\(L\)に対する狭義の最適反応は存在しない一方で、\(L\)に対する広義の最適反応は\(U\)と\(D\)です。

 

狭義の純粋戦略ナッシュ均衡

繰り返しになりますが、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する狭義の最適反応であることとは、\begin{equation*}\forall s_{i}\in S_{i}\backslash \{s_{i}^{\ast }\}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(s_{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(s_{i}^{\ast }\)を選ぶことにより自身の利得を狭義に最大化できることを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right)_{i\in I}\)において、それぞれのプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i}\backslash \{s_{i}^{\ast
}\}:u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)における狭義のナッシュ均衡(strict Nash equilibrium)や狭義の純粋戦略ナッシュ均衡(strict pure Nash equilibrium)などと呼びます。

純粋戦略の組\(s_{I}^{\ast }\)が狭義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のプレイヤーたちが均衡戦略にしたがい\(s_{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、狭義のナッシュ均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast },s_{-i}^{\ast }\right) >u_{i}\left(
s_{i},s_{-i}^{\ast }\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱によって損をしてしまいます。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱すると損をしてしまいます。狭義の純粋戦略ナッシュ均衡ではプレイヤーたちの戦略がお互いに狭義の最適反応になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが狭義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

例(狭義の純粋戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8^{\ast } \\ \hline
D & 8^{\ast },0 & 2^{\ast },2^{\ast } \\ \hline
\end{array}$$

表:狭義のナッシュ均衡

表にはそれぞれのプレイヤーが狭義の最適反応を選んだときに得る利得に\(\ast \)を記してあります。表から明らかであるように\(\left( D,R\right) \)は狭義の最適反応の組であるため、これは狭義の純粋戦略ナッシュ均衡です。

プレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する狭義の最適反応であるならば、それは\(s_{-i}\)に対する広義の最適反応でもあります。したがって、狭義の純粋戦略ナッシュ均衡は広義の純粋戦略ナッシュ均衡でもあります。

命題(狭義の純粋戦略ナッシュ均衡と広義の純粋戦略ナッシュ均衡の関係)
戦略型ゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が狭義の純粋戦略ナッシュ均衡であるならば、\(s_{I}^{\ast }\)は広義の純粋戦略ナッシュ均衡である。

逆は成り立つとは限りません。つまり、広義の純粋戦略ナッシュ均衡は狭義の純粋戦略ナッシュ均衡であるとは限りません。以下の例より明らかです。

例(狭義の純粋戦略ナッシュ均衡と広義の純粋戦略ナッシュ均衡の関係)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,5 \\ \hline
D & 5,0 & 2,2 \\ \hline
\end{array}$$

表:利得行列

純粋戦略の組\(\left( U,L\right) \)は広義の純粋戦略ナッシュ均衡ですが狭義の純粋戦略ナッシュ均衡ではありません。

上の例から明らかであるように、狭義の純粋戦略ナッシュ均衡は存在するとは限りません。以下は、狭義の純粋戦略ナッシュ均衡と広義の純粋戦略ナッシュ均衡の双方が存在しない例です。

例(狭義の純粋戦略ナッシュ均衡と広義の純粋戦略ナッシュ均衡の関係)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
D & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

表:利得行列

表にはそれぞれのプレイヤーが広義の最適反応を選んだときに利得に\(\ast \)を記してあります。表から明らかであるように、このゲームには広義の純粋戦略ナッシュ均衡は存在せず、したがって狭義の純粋戦略ナッシュ均衡も存在しません。

狭義の純粋戦略ナッシュ均衡は存在するとは限らないことが明らかになりました。その一方で、狭義の純粋戦略ナッシュ均衡が存在する場合、それは1つだけであるとは限りません。以下の例より明らかです。

例(狭義の純粋戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & L & R \\ \hline
U & 2^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },2^{\ast } \\ \hline
\end{array}$$

表:利得行列

表にはそれぞれのプレイヤーが狭義の最適反応を選んだときに利得に\(\ast \)を記してあります。表から明らかであるように\(\left(U,L\right) \)と\(\left( D,R\right) \)はともに狭義の最適反応の組であるため、これらはともに狭義の純粋戦略ナッシュ均衡です。

 

演習問題

問題(狭義の純粋戦略ナッシュ均衡)
自治体の首長選挙へ出馬するにあたり、ある政党から公認を得ようとしている2人がゲームのプレイヤーです。公認枠は1人だけです。2人はそれぞれ「公認をめぐって争う」か「公認をめぐって争わない」かのどちらか一方を選択します。2人がともに公認をめぐって争う場合、どちらか一方が政党から公認を得て首長選へ出馬することになります。ただ、公認をめぐる激しい争いは資金面での枯渇や人間関係のトラブルをもたらすため、仮に公認を得て首長選へ出馬できた場合でにも落選が確実です。これは双方にとって最悪の結果です。また、1人が公認を求め、もう1人が身を引く場合、公認を求めた方が実際に公認を得て、その後の首長選でも確実に勝利できます。身を引いた方は首長選に立候補できませんが、公認をめぐる激しい争いは回避できます。また、双方が公認から身を引く場合、双方ともに首長選へ出馬できませんが、公認をめぐる激しい争いは回避できます。以上の状況を戦略型ゲーム\(G\)として定式化した上で、広義の純粋戦略ナッシュ均衡が存在するかどうか議論してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は広義の混合戦略ナッシュ均衡について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

ボランティアのジレンマ
ボランティアのジレンマ

自身がわずかなコストを負担して全員に利益をもたらすか、もしくは他の人が行動するのかを待つか、以上の選択肢に直面したプレイヤーたちの間に成立する戦略的状況を描写するゲームをボランティアのジレンマと呼びます。

ナッシュ均衡
広義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限らず、存在する場合にも一意的であるとは限りません。

ナッシュ均衡
広義の混合戦略ナッシュ均衡

戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに広義の最適反応になっているならば、その組を広義の混合戦略ナッシュ均衡と呼びます。

ナッシュ均衡
狭義の混合戦略ナッシュ均衡

戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに狭義の最適反応になっているならば、その組を狭義の混合戦略ナッシュ均衡と呼びます。

ナッシュ均衡
ナッシュ均衡と支配される戦略の逐次消去の関係

戦略型ゲームにナッシュ均衡が存在する場合、そのゲームに支配される戦略の逐次消去を適用すると、そのナッシュ均衡は最後まで残ります。特に、ゲームが逐次消去によって解ける場合、その解はゲームの一意的なナッシュ均衡であることが保証されます。

ナッシュ均衡
ナッシュ均衡と支配戦略均衡の関係

戦略型ゲームに支配戦略均衡が存在する場合、それはナッシュ均衡であることが保証されます。逆は成立するとは限りません。つまり、ナッシュ均衡は支配戦略均衡であるとは限りません。

ナッシュ均衡
ナッシュ均衡の正当性

合理性の仮定や期待効用仮説を採用する限りにおいて、完備情報の静学ゲームにおける均衡概念はナッシュ均衡しか存在しません。しかし、これはあくまでもゲームの分析者の立場から見たときの考え方であり、プレイヤーの視点から考えてみると話が少し複雑になります。

ナッシュ均衡
ナッシュ均衡と自己拘束的な合意

プレイヤーたちが事前交渉を行い何らかの合意に至った場合、それを強制する仕組みが存在しないにも関わらず合意が守られるのであれば、そのような合意は自己拘束的であると言われます。自己拘束的な合意は必ずナッシュ均衡である一方、その逆は成立するとは限りません。

完備情報の静学ゲーム