あるプレイヤーの純粋戦略が別の純粋戦略を強支配すること、強支配純粋戦略、強支配純粋戦略均衡などについて解説します。

強支配

問題としている戦略的状況が完備状況の静学ゲームであり、それが戦略型ゲーム\(G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I}\right) \)として表現されているものとします。ゲームの静学性より、プレイヤー\(i\in I\)は意思決定を行う時点において、他のプレイヤーたちが実際に選ぶ純粋戦略の組\(s_{-i}\in S_{-i}\)を事前に観察することはできません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る純粋戦略の組からなる集合\(S_{-i}\)を把握しているため、その要素であるそれぞれの組\(s_{-i}\)に対して、自分が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得られる利得\(u_{i}\left( s_{i},s_{-i}\right) \)を把握しています。

以上を踏まえた上で、プレイヤー\(i\in I\)が選択可能な2つの異なる純粋戦略\(s_{i},s_{i}^{\prime }\in S_{i}\)に注目したとき、他のプレイヤーたちがどのような純粋戦略の組\(s_{-i}\in S_{-i}\)を選ぶ場合においても、プレイヤー\(i\)が\(s_{i}\)を選んだときに得る利得\(u_{i}\left( s_{i},s_{-i}\right) \)が\(s_{i}^{\prime }\)を選んだときに得る利得\(u_{i}\left( s_{i}^{\prime },s_{-i}\right) \)よりも大きい場合には、すなわち、\begin{equation*}
\forall s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right)
>u_{i}\left( s_{i}^{\prime },s_{-i}\right)
\end{equation*}が成り立つのであれば、\(s_{i}\)は\(s_{i}^{\prime }\)を強支配する(strongly dominate)や狭義支配する(strictly dominate)などと言います。同じことを、\(s_{i}^{\prime }\)は\(s_{i}\)に強支配される(strongly dominated)や狭義支配される(strictly dominated)などと言うこともできます。

例(強支配)
以下の利得行列で表される戦略型ゲームについて考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$

表:強支配

プレイヤー\(1\)については、\begin{eqnarray*}
u_{1}\left( D,L\right) &=&8>5=u_{1}\left( U,L\right) \\
u_{1}\left( D,R\right) &=&2>0=u_{1}\left( U,R\right)
\end{eqnarray*}が成り立つため、\(D\)は\(U\)を強支配します。プレイヤー\(2\)については、\begin{eqnarray*}
u_{2}\left( U,R\right) &=&8>5=u_{2}\left( U,L\right) \\
u_{2}\left( D,R\right) &=&2>0=u_{2}\left( D,L\right)
\end{eqnarray*}が成り立つため、\(R\)は\(L\)を強支配します。

以下の例が示唆するように、それぞれのプレイヤーは、自分の他の戦略を強支配する戦略を持つとは限りません。言い換えると、自分の他の戦略によって強支配される戦略を持つとは限りません。

例(強支配)
以下の利得行列で表される戦略型ゲームについて考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 1,-1 & -1,1 \\ \hline
D & -1,1 & 1,-1 \\ \hline
\end{array}$$

表:強支配

プレイヤー\(1\)については、\begin{eqnarray*}
u_{1}\left( U,L\right) &=&1>-1=u_{1}\left( D,L\right) \\
u_{1}\left( D,R\right) &=&1>-1=u_{1}\left( U,R\right)
\end{eqnarray*}が成り立ちます。つまり、相手が\(L\)を選ぶ場合には自分は\(U\)を選んだ方が良く、相手が\(R\)を選ぶ場合には自分が\(D\)を選んだ方が良いため、\(U\)は\(D\)を強支配しませんし、逆に\(D\)は\(U\)を強支配しません。プレイヤー\(2\)についても同様です。\(L\)は\(R\)を強支配せず、\(R\)は\(L\)を強支配しません。

プレイヤー\(i\)の純粋戦略\(s_{i}\)が自分の他の純粋戦略\(s_{i}^{\prime }\)によって強支配されるものとします。つまり、\begin{equation*}
\exists s_{i}^{\prime }\in S_{i}\backslash \left\{ s_{i}\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i}^{\prime },s_{-i}\right) >u_{i}\left(
s_{i},s_{-i}\right)
\end{equation*}が成り立つ状況を想定します。このとき、プレイヤー\(i\)は強支配される戦略\(s_{i}\)を選ぶ代わりに、\(s_{i}\)を強支配する戦略\(s_{i}^{\prime }\)を選べば、他のプレイヤーたちがどのような戦略の組\(s_{-i}\)を選ぶかに関わらず、自分はより大きな利得を得ることができます。したがって、プレイヤー\(i\)が合理的であり、合理的なプレイヤーの目的が自己の利得の最大化である限りにおいて、プレイヤー\(i\)は強支配される戦略\(s_{i}\)を選びません。言い換えると、仮にプレイヤー\(i\)が強支配される戦略\(s_{i}\)を選ぶのであれば、それは合理性の仮定と矛盾します。

命題(合理性と強支配される戦略)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が自身の他の純粋戦略によって強支配される場合、合理性の仮定のもとでは、プレイヤー\(i\)は\(s_{i}\)を選択しない。
証明を見る(プレミアム会員限定)

以下の利得行列によって表される戦略型ゲーム\(G\)について考えます。プレイヤー\(1\)にとって\(\beta \)は\(\alpha \)によって強支配され、プレイヤー\(2\)にとっても\(\beta \)は\(\alpha \)によって強支配されます。したがって、合理性の仮定のもとでは、両者はともに強支配される戦略\(\beta \)を選ばず、それを強支配する戦略\(\alpha \)を選ぶはずです。その結果、2人はともに利得\(0\)を得ます。

$$\begin{array}{|c|c|c|}
\hline
1/2 & \alpha & \beta \\ \hline
\alpha & 0,0 & 3,-1 \\ \hline
\beta & -1,3 & 1,1 \\ \hline
\end{array}$$

表:強支配

仮に2人が強支配される戦略\(\beta \)を選んだ場合、2人はともに利得\(1\)を獲得できますが、これは2人が戦略\(\alpha \)を選んだ場合に得る利得\(0\)よりも大きくなっています。したがって、2人はともに強支配される戦略\(\beta \)を選ぶべきであると言えるかもしれません。しかし、このような考え方は誤りです。静学ゲームのプレイヤーたちはお互いに相談せずに自分の戦略を選ぶことを求められます。したがって、仮に自分が\(\beta \)を選んだ場合でも、相手に対して自分と同じように\(\beta \)を選ぶように仕向けることはできません。自分が\(\beta \)を選んだときに相手が\(\alpha \)を選べば、自分の利得は\(-1\)となり、これは自分にとって最悪の結果です。百歩譲って、テレパシーなどの能力を用いて相手に\(\beta \)を選ぶように仕向けることができる場合でも、その場合には今度は自分が\(\alpha \)を選べば最大の利得である\(3\)を得られるため、やはり自分は\(\alpha \)を選んだ方が良いということになります。

 

強支配純粋戦略

プレイヤー\(i\in I\)のある純粋戦略\(s_{i}\in S_{i}\)が自身の他の任意の純粋戦略を強支配する場合には、すなわち、\begin{equation*}
\forall s_{i}^{\prime }\in S_{i}\backslash \left\{ s_{i}\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left( s_{i}^{\prime
},s_{-i}\right)
\end{equation*}が成り立つ場合には、\(s_{i}\)をプレイヤー\(i\)の強支配純粋戦略(strongly dominant pure strategy)や狭義支配純粋戦略(strictly dominant pure strategy)などと呼びます。

例(強支配純粋戦略)
以下の利得行列で表される戦略型ゲームについて再び考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$

表:強支配戦略

プレイヤー\(1\)については、\(D\)が\(U\)を強支配します。さらに、プレイヤー\(1\)の純粋戦略は\(U,D\)の2つだけであるため、\(D\)はプレイヤー\(1\)の強支配戦略です。プレイヤー\(2\)については、\(R\)が\(L\)を強支配します。さらに、プレイヤー\(2\)の純粋戦略は\(L,R\)の2つだけであるため、\(R\)はプレイヤー\(2\)の強支配戦略です。

繰り返しになりますが、それぞれのプレイヤーは自分の他の戦略を強支配する戦略を持つとは限りません。したがって、プレイヤーは強支配戦略を持つとは限らないということになります。

例(強支配純粋戦略)
以下の利得行列で表される戦略型ゲームについて再び考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 1,-1 & -1,1 \\ \hline
D & -1,1 & 1,-1 \\ \hline
\end{array}$$

表:強支配戦略

プレイヤー\(1\)については、\(U\)は\(D\)を強支配せず、逆に\(D\)は\(U\)を強支配しないため、強支配戦略は存在しません。プレイヤー\(2\)については、\(L\)は\(R\)を強支配せず、逆に\(R\)は\(L\)を強支配しないため、強支配戦略は存在しません。

プレイヤーは強支配戦略を持つとは限りませんが、強支配戦略が存在する場合、それは一意的です。実際、プレイヤー\(i\)が異なる2つの強支配戦略\(s_{i},s_{i}^{\prime }\)を持つものと仮定すると、強支配戦略の定義より、\begin{eqnarray*}
\forall s_{-i} &\in &S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left(
s_{i}^{\prime },s_{-i}\right) \\
\forall s_{-i} &\in &S_{-i}:u_{i}\left( s_{i}^{\prime },s_{-i}\right)
>u_{i}\left( s_{i},s_{-i}\right)
\end{eqnarray*}がともに成り立ちますが、これは矛盾です。

命題(強支配純粋戦略の一意性)
戦略型ゲーム\(G\)において、プレイヤーが強支配純粋戦略を持つ場合、それは一意的である。
証明を見る(プレミアム会員限定)

プレイヤー\(i\)の純粋戦略\(s_{i}\)が強支配戦略であるものとします。つまり、\begin{equation*}
\forall s_{i}^{\prime }\in S_{i}\backslash \left\{ s_{i}\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i},s_{-i}\right) >u_{i}\left( s_{i}^{\prime
},s_{-i}\right)
\end{equation*}が成り立つ状況を想定します。このとき、プレイヤー\(i\)は強支配戦略\(s_{i}\)を選べば、他のプレイヤーたちがどのような戦略の組\(s_{-i}\)を選ぶかに関わらず、他の純粋戦略\(s_{i}^{\prime }\)を選ぶ場合よりも大きな利得を得ることができます。したがって、プレイヤー\(i\)が合理的であり、合理的なプレイヤーの目的が自己の利得の最大化である限りにおいて、プレイヤー\(i\)は強支配戦略\(s_{i}\)を選びます。言い換えると、仮にプレイヤー\(i\)が強支配戦略\(s_{i}\)を選ばないのであれば、それは合理性の仮定と矛盾します。

命題(合理性と強支配純粋戦略)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が強支配戦略である場合、合理性の仮定のもとでは、プレイヤー\(i\)は\(s_{i}\)を選択する。
証明を見る(プレミアム会員限定)

 

強支配純粋戦略均衡

繰り返しになりますが、戦略型ゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が強支配純粋戦略であることとは、\begin{equation*}
\forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast }\right\} ,\ \forall
s_{-i}\in S_{-i}:u_{i}\left( s_{i}^{\ast },s_{-i}\right) >u_{i}\left(
s_{i},s_{-i}\right)
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が強支配純粋戦略になっているならば、すなわち、\begin{equation*}
\forall i\in I,\ \forall s_{i}\in S_{i}\backslash \left\{ s_{i}^{\ast
}\right\} ,\ \forall s_{-i}\in S_{-i}:u_{i}\left( s_{i}^{\ast
},s_{-i}\right) >u_{i}\left( s_{i},s_{-i}\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の強支配純粋戦略均衡(strongly dominant pure strategy equilibrium)や狭義支配純粋戦略均衡(strictly dominant pure strategy equilibrium)などと呼びます。

例(強支配純粋戦略均衡)
以下の利得行列で表される戦略型ゲームについて再び考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$

表:強支配戦略均衡

プレイヤー\(1\)にとって\(D\)は強支配戦略であり、プレイヤー\(2\)にとって\(R\)は強支配戦略です。したがって、\(\left( D,R\right) \)は強支配戦略の組であるため、これはゲームの強支配戦略均衡です。

以下もまた強支配純粋戦略均衡が存在する完備情報の静学ゲームの例です。

囚人のジレンマ n人囚人のジレンマ 軍拡競争 価格競争 広告競争

繰り返しになりますが、それぞれのプレイヤーは強支配戦略を持つとは限りません。したがって、ゲームには強支配戦略均衡は存在するとは限らないということになります。

例(強支配純粋戦略均衡)
以下の利得行列で表される戦略型ゲームについて再び考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & L & R \\ \hline
U & 1,-1 & -1,1 \\ \hline
D & -1,1 & 1,-1 \\ \hline
\end{array}$$

表:強支配戦略均衡

プレイヤー\(1,2\)はともに強支配戦略を持たないため、このゲームには強支配戦略は存在しません。

繰り返しになりますが、プレイヤーが強支配戦略を持つ場合、それは一意的です。したがって、ゲームに強支配戦略均衡が存在する場合、それは一意的です。

命題(強支配純粋戦略均衡の一意性)
戦略型ゲーム\(G\)において、強支配純粋戦略均衡が存在する場合、それは一意的である。
証明を見る(プレミアム会員限定)

戦略型ゲーム\(G\)に強支配戦略均衡\(s_{I}^{\ast }\)が存在する場合、それぞれのプレイヤー\(i\)は自身の均衡戦略である強支配戦略\(s_{i}^{\ast }\)を選べば、他のプレイヤーたちがどのような戦略の組\(s_{-i}\)を選ぶかに関わらず、他の純粋戦略\(s_{i}^{\prime }\)を選ぶ場合よりも大きな利得を得ることができます。したがって、ゲームに強支配戦略均衡が存在する場合、それぞれのプレイヤーは他のプレイヤーたちの行動について考える必要がなく、他のプレイヤーたちが合理的であるかどうかを考える必要もなく、自身の強支配戦略\(s_{i}^{\ast }\)を選ぶことが常に最適になります。強支配戦略均衡が存在するゲームでは、プレイヤーは他のプレイヤーたちの手を読んだり、相手の合理性を疑う必要がないということです。プレイヤーの合理性が相互知識もしくは共有知識であるという仮定は必要なく、それぞれのプレイヤーが合理的でありさえすれば、全員が均衡戦略である強支配戦略を選び、その結果、均衡である強支配戦略均衡が実現します。

命題(合理性と強支配純粋戦略均衡)
戦略型ゲーム\(G\)において、強支配純粋戦略均衡\(s_{I}^{\ast }\in S_{I}\)が存在する場合、合理性の仮定のもとでは、プレイヤーたちは\(s_{I}^{\ast }\)をプレーする。
証明を見る(プレミアム会員限定)

次回は支配戦略均衡について解説します。

次へ進む 質問・コメント(プレミアム会員限定) 演習問題(プレミアム会員限定)
Share on facebook
Share on twitter
Share on email

プレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。プレミアム会員の方は以下からログインしてください。

会員登録 | パスワードを忘れましたか?

有料のプレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

本サイトは MathJax を実装しているため、コメント文中で LaTex コマンドを利用することで美しい数式を入力できます。その際、インライン数式は\(数式\)で、ディスプレイ数式は$$数式$$という形式でそれぞれ入力してください。 例えば、\(ax^{2}+bx+c=0\)と入力すると\(ax^{2}+bx+c=0\)と表示され、$$ax^{2}+bx+c=0$$と入力すると$$ax^{2}+bx+c=0$$と表示されます。MathJax(LaTex)の文法については次のサイト( https://easy-copy-mathjax.xxxx7.com )などを参照してください。 紙に手書きした数式や図をカメラやスマホで撮影した上で、コメント欄に張り付けることもできます。その場合、コメント入力欄にある「ファイルを選択」ボタンをクリックした上で画像をアップロードしてください。アップロード可能な画像フォーマットは jpg, gif, png の 3 種類、ファイルサイズの上限は 5 MB です。PDF ファイルの添付も可能です。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員だけが質問やコメントを投稿・閲覧できます。

完備情報の静学ゲーム
アカウント
ログイン