純粋戦略どうしの狭義の支配関係
問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。
ゲームの静学性より、それぞれのプレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ純粋戦略\(s_{-i}\in S_{-i}\)を事前に観察できません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る純粋戦略からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して、自分が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得られる利得\(u_{i}\left( s_{i},s_{-i}\right) \)を把握しています。
以上を踏まえた上で、プレイヤー\(i\in I\)が選択可能な2つの異なる純粋戦略\(s_{i},s_{i}^{\prime }\in S_{i}\)に注目したとき、他のプレイヤーたちがどのような純粋戦略\(s_{-i}\in S_{-i}\)を選ぶ場合においても、自身が\(s_{i}\)を選んだときに得る利得\(u_{i}\left( s_{i},s_{-i}\right) \)が\(s_{i}^{\prime }\)を選んだときに得る利得\(u_{i}\left( s_{i}^{\prime },s_{-i}\right) \)よりも大きい場合には、すなわち、\begin{equation*}\forall s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left(
s_{i}^{\prime },s_{-i}\right)
\end{equation*}が成り立つのであれば、\(s_{i}\)は\(s_{i}^{\prime }\)を狭義に支配する(strictly dominate)と言います。同じことを、\(s_{i}^{\prime }\)は\(s_{i}\)によって狭義に支配される(strictly dominated)と言うこともできます。
s_{1}^{\prime },s_{2}\right)
\end{equation*}が成り立つことを意味します。また、プレイヤー\(2\)の2つの異なる純粋戦略\(s_{2},s_{2}^{\prime }\in S_{2}\)について、\(s_{2}\)が\(s_{2}^{\prime }\)を狭義支配することとは、\begin{equation*}\forall s_{1}\in S_{1}:u_{2}\left( s_{1},s_{2}\right) >u_{2}\left(
s_{1},s_{2}^{\prime }\right)
\end{equation*}が成り立つことを意味します。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$
プレイヤー\(1\)については、\begin{eqnarray*}u_{1}\left( D,L\right) &=&8>5=u_{1}\left( U,L\right) \\
u_{1}\left( D,R\right) &=&2>0=u_{1}\left( U,R\right)
\end{eqnarray*}が成り立つため、\(D\)は\(U\)を狭義支配します。プレイヤー\(2\)については、\begin{eqnarray*}u_{2}\left( U,R\right) &=&8>5=u_{2}\left( U,L\right) \\
u_{2}\left( D,R\right) &=&2>0=u_{2}\left( D,L\right)
\end{eqnarray*}が成り立つため、\(R\)は\(L\)を狭義支配します。
狭義支配する純粋戦略は存在するとは限らない
プレイヤーは自身の他の純粋戦略を狭義支配する純粋戦略を持つとは限りません。言い換えると、自身の他の純粋戦略によって狭義支配される純粋戦略を持つとは限りません。以下の例より明らかです。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 1,-1 & -1,1 \\ \hline
D & -1,1 & 1,-1 \\ \hline
\end{array}$$
プレイヤー\(1\)については、\begin{eqnarray*}u_{1}\left( U,L\right) &=&1>-1=u_{1}\left( D,L\right) \\
u_{1}\left( D,R\right) &=&1>-1=u_{1}\left( U,R\right)
\end{eqnarray*}が成り立ちます。つまり、相手が\(L\)を選ぶ場合には自分は\(U\)を選んだ方が良く、相手が\(R\)を選ぶ場合には自分が\(D\)を選んだ方が良いため、\(U\)は\(D\)を狭義支配せず、\(D\)は\(U\)を狭義支配しません。プレイヤー\(2\)についても同様です。\(L\)は\(R\)を狭義支配せず、\(R\)は\(L\)を狭義支配しません。
狭義支配される純粋戦略が選ばれない理由
プレイヤー\(i\)の純粋戦略\(s_{i}\)が自身の他の純粋戦略\(s_{i}^{\prime }\)によって狭義支配されるものとします。つまり、\begin{equation*}\exists s_{i}^{\prime }\in S_{i}\backslash \left\{ s_{i}\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i}^{\prime },s_{-i}\right) >u_{i}\left(
s_{i},s_{-i}\right)
\end{equation*}が成り立つ状況を想定します。このとき、プレイヤー\(i\)は\(s_{i}^{\prime }\)によって狭義支配される\(s_{i}\)を選ぶ代わりに\(s_{i}^{\prime }\)を選べば、他のプレイヤーたちが選ぶ戦略\(s_{-i}\)がどれであっても、自分は常により大きい利得を得られます。したがって、プレイヤー\(i\)が合理的であり、合理的なプレイヤーの目的が自己の利得の最大化である限りにおいて、プレイヤー\(i\)は狭義支配される戦略\(s_{i}\)を選びません。プレイヤー\(i\)が自身の何らかの純粋戦略によって狭義支配される純粋戦略\(s_{i}\)を選ぶのであれば、それは合理性の仮定と矛盾します。
以下の利得行列によって表される戦略型ゲーム\(G\)について考えます。
$$\begin{array}{|c|c|c|}
\hline
1/2 & \alpha & \beta \\ \hline
\alpha & 0,0 & 3,-1 \\ \hline
\beta & -1,3 & 1,1 \\ \hline
\end{array}$$
プレイヤー\(1\)にとって\(\beta \)は\(\alpha \)によって狭義支配され、プレイヤー\(2\)にとっても\(\beta \)は\(\alpha \)によって狭義支配されます。したがって、合理性の仮定のもとでは両者はともに\(\beta \)を選ばずに\(\alpha \)を選ぶため、純粋戦略の組\(\left( \alpha ,\alpha \right) \)が実現し、両者はともに利得\(0\)を得ます。
仮に、2人が狭義支配される戦略\(\beta \)を選んだ場合、純粋戦略の組\(\left( \beta ,\beta \right) \)が実現し、両者はともに利得\(1\)を獲得できますが、これは2人が狭義支配する戦略\(\alpha \)を選んだ場合に得る利得\(0\)よりも大きくなっています。したがって、2人はともに狭義支配される戦略\(\beta \)を選ぶべきであると言えるかもしれません。しかし、このような考え方は誤りです。
静学ゲームのプレイヤーたちは互いに相談せずに自分の戦略を選ぶことを求められます。したがって、仮に自分が\(\beta \)を選んだ場合でも、相手もまた\(\beta \)を選ぶように仕向けることはできません。自分が\(\beta \)を選んだときに相手が\(\alpha \)を選べば、自分の利得は\(-1\)となり、これは自分にとって最悪の結果です。一歩譲って、テレパシーなどの超能力を用いて相手に\(\beta \)を選ぶように仕向けることができる場合でも、その場合には今度は自分が\(\alpha \)を選べば最大の利得である\(3\)を得られるため、やはり自分は\(\alpha \)を選んだ方が良いということになります。
狭義の支配純粋戦略
問題としている戦略的状況が完備状況の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。プレイヤー\(i\in I\)のある純粋戦略\(s_{i}\in S_{i}\)が自身の他の任意の純粋戦略を狭義支配する場合には、すなわち、\begin{equation*}\forall s_{i}^{\prime }\in S_{i}\backslash \left\{ s_{i}\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left( s_{i}^{\prime
},s_{-i}\right)
\end{equation*}が成り立つ場合には、\(s_{i}\)をプレイヤー\(i\)の狭義の支配戦略(strictly dominant strategy)と呼びます。これは、他のプレイヤーたちが選ぶ純粋戦略とは関係なく、プレイヤー\(i\)は\(s_{i}\)を選ぶことにより常に自身の利得を最大化できることを意味します。
s_{2}\in S_{2}:u_{1}\left( s_{1},s_{2}\right) >u_{1}\left( s_{1}^{\prime
},s_{2}\right)
\end{equation*}が成り立つことを意味します。また、プレイヤー\(2\)の純粋戦略\(s_{2}\in S_{2}\)が狭義の支配戦略であることとは、\begin{equation*}\forall s_{2}^{\prime }\in S_{2}\backslash \left\{ s_{2}\right\} ,\ \forall
s_{1}\in S_{1}:u_{2}\left( s_{1},s_{2}\right) >u_{2}\left(
s_{1},s_{2}^{\prime }\right)
\end{equation*}が成り立つことを意味します。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$
プレイヤー\(1\)については、\(D\)が\(U\)を狭義支配します。プレイヤー\(1\)の純粋戦略は\(U,D\)の2つだけであるため、\(D\)はプレイヤー\(1\)の狭義の支配戦略です。プレイヤー\(2\)については、\(R\)が\(L\)を狭義支配します。プレイヤー\(2\)の純粋戦略は\(L,R\)の2つだけであるため、\(R\)はプレイヤー\(2\)の狭義の支配戦略です。
狭義の支配戦略は存在するとは限らない
プレイヤーは狭義の支配戦略を持つとは限りません。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 1,-1 & -1,1 \\ \hline
D & -1,1 & 1,-1 \\ \hline
\end{array}$$
プレイヤー\(1\)については、\(U\)は\(D\)を狭義支配せず、\(D\)は\(U\)を狭義支配しないため、プレイヤー\(1\)は狭義の支配戦略を持ちません。プレイヤー\(2\)については、\(L\)は\(R\)を狭義支配せず、\(R\)は\(L\)を狭義支配しないため、プレイヤー\(2\)は狭義の支配戦略を持ちません。
狭義の支配純粋戦略は一意的
プレイヤーは狭義の支配戦略を持つとは限りませんが、存在する場合には一意的です。
狭義の支配純粋戦略が選ばれる理由
プレイヤー\(i\)の純粋戦略\(s_{i}\)が狭義の支配戦略であるものとします。つまり、\begin{equation*}\forall s_{i}^{\prime }\in S_{i}\backslash \left\{ s_{i}\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left( s_{i}^{\prime
},s_{-i}\right)
\end{equation*}が成り立つ状況を想定します。このとき、プレイヤー\(i\)は狭義の支配戦略\(s_{i}\)を選べば、他のプレイヤーたちが選ぶ戦略の組\(s_{-i}\)とは関係なく、自分が他の純粋戦略\(s_{i}^{\prime }\)を選ぶ場合よりも常に大きい利得を得ることができます。したがって、プレイヤー\(i\)が合理的であり、合理的なプレイヤーの目的が自己の利得の最大化である限りにおいて、プレイヤー\(i\)は狭義の支配戦略\(s_{i}\)を選びます。プレイヤー\(i\)が狭義の支配戦略\(s_{i}\)とは異なる純粋戦略を選ぶのであれば、それは合理性の仮定と矛盾します。
狭義の支配純粋戦略均衡
問題としている戦略的状況が完備状況の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。先に定義したように、プレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が狭義の支配戦略であることとは、\begin{equation*}\forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast }\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) >u_{i}\left(
s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが選ぶ戦略とは関係なく、プレイヤー\(i\)は\(s_{i}^{\ast }\)を選ぶことにより常に自身の利得を最大化できることを意味します。
プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast}\right) _{i\in I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が狭義の支配戦略になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} ,\ \forall s_{-i}\in S_{-i}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)を\(G\)の狭義の支配戦略均衡(strictly dominant strategy equilibrium)と呼びます。
s_{2}\in S_{2}:u_{1}\left( s_{1}^{\ast },s_{2}\right) >u_{1}\left(
s_{1},s_{2}\right) \\
\forall s_{2} &\in &S_{2}\backslash \left\{ s_{2}^{\ast }\right\} ,\ \forall
s_{1}\in S_{1}:u_{2}\left( s_{1},s_{2}^{\ast }\right) >u_{2}\left(
s_{1},s_{2}\right)
\end{eqnarray*}がともに成り立つことを意味します。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$
プレイヤー\(1\)にとって\(D\)は狭義の支配戦略であり、プレイヤー\(2\)にとって\(R\)は狭義の支配戦略です。したがって、\(\left( D,R\right) \)は狭義の支配戦略の組であるため、これは狭義の支配戦略均衡です。
狭義の支配純粋戦略均衡は存在するとは限らない
それぞれのプレイヤーは狭義の支配戦略を持つとは限りません。したがって、ゲームには狭義の支配戦略均衡は存在するとは限らないということになります。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 1,-1 & -1,1 \\ \hline
D & -1,1 & 1,-1 \\ \hline
\end{array}$$
プレイヤー\(1,2\)はともに狭義の支配戦略を持たないため、このゲームには狭義の支配戦略均衡は存在しません。
狭義の支配純粋戦略均衡は一意的
先に示したように、プレイヤーが狭義の支配戦略を持つ場合、それは一意的です。したがって、ゲームに狭義の支配戦略均衡が存在する場合、それは一意的です。
狭義の支配純粋戦略均衡がプレーされる理由
戦略型ゲーム\(G\)に狭義の支配戦略均衡\(s_{I}^{\ast }\)が存在する場合、それぞれのプレイヤー\(i\)は自身の均衡戦略である狭義の支配戦略\(s_{i}^{\ast }\)を選べば、他のプレイヤーたちがどのような戦略\(s_{-i}\)を選ぶかに関わらず、自分は他の純粋戦略を選ぶ場合よりも大きな利得を得られます。したがって、ゲームに狭義の支配戦略均衡が存在する場合、それぞれのプレイヤーは他のプレイヤーたちの行動について考える必要がなく、他のプレイヤーたちが合理的であるかどうかを考える必要もなく、自分は狭義の支配戦略\(s_{i}^{\ast }\)を選ぶことが常に最適になります。狭義の支配戦略均衡が存在するゲームでは、プレイヤーは他のプレイヤーたちの手を読んだり、相手の合理性を疑う必要がないということです。プレイヤーの合理性が相互知識もしくは共有知識であるという仮定は必要なく、それぞれのプレイヤーが合理的でありさえすれば、全員が均衡戦略である狭義の支配戦略を選び、その結果、均衡である狭義の支配戦略均衡が実現します。
演習問題
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & X & Y \\ \hline
A & 5,2 & 4,2 \\ \hline
B & 3,1 & 3,2 \\ \hline
C & 2,1 & 4,1 \\ \hline
D & 4,3 & 5,4 \\ \hline
\end{array}$$
このゲームには狭義の支配戦略均衡は存在しますか。存在する場合にはそれを具体的に特定し、存在しない場合には理由を述べてください。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$
- このゲームには狭義の支配戦略均衡が存在しますか。存在する場合にはそれを具体的に特定し、存在しない場合には理由を述べてください。
- 上のゲームを題材に、「利他的な行動は必ず自身の犠牲を伴う」という言明の妥当性を検討してください。
s_{I}^{\prime }\right) \\
&&\left( b\right) \ \exists i\in I:u_{i}\left( s_{I}\right) >u_{i}\left(
s_{I}^{\prime }\right)
\end{eqnarray*}がともに成り立つのであれば、つまり、任意のプレイヤーにとって\(s_{I}\)は\(s_{I}^{\prime }\)以上に望ましく、少なくとも1人のプレイヤーにとって\(s_{I}\)は\(s_{I}^{\prime }\)よりも望ましい場合には、\(s_{I}\)は\(s_{I}^{\prime }\)をパレート支配する(Paretodominate)と言います。\(s_{I}\)が\(s_{I}^{\prime }\)をパレート支配する場合、\(s_{I}^{\prime }\)から\(s_{I}\)へ移行することにより、全員の効用を下げることなく少なくとも1人の効用を上げることができます。そのような意味において、\(s_{I}^{\prime }\)から\(s_{I}\)へ移行することをパレート改善と呼びます。以上を踏まえた上で以下の問いに答えてください。
- 狭義の支配戦略均衡が他の純粋戦略の組によってパレート支配されるようなゲームの例を挙げてください。
- 「狭義の支配戦略均衡は常に他の純粋戦略の組によってパレート支配される」という言明は正しいでしょうか。正しい場合には証明し、正しくない場合には反例を挙げてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】