WIIS

完備情報の静学ゲーム

狭義の混合戦略ナッシュ均衡

目次

Mailで保存
Xで共有

混合戦略の範囲での広義の最適反応

問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

戦略型ゲーム\(G\)においてプレイヤーたちが混合戦略を選択する状況を想定する場合、その戦略的状況は\(G\)の混合拡張\begin{equation*}G^{\ast }=(I,\{\Delta \left( S_{i}\right) \}_{i\in I},\{F_{i}\}_{i\in I})
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(\Delta \left( S_{i}\right) \)はプレイヤー\(i\in I\)の混合戦略集合、\(F_{i}:\Delta \left( S_{I}\right)\rightarrow \mathbb{R} \)はプレイヤー\(i\)の期待利得関数です。

ゲームの静学性より、プレイヤー\(i\in I\)は意思決定を行う時点において他のプレイヤーたちが実際に選ぶ混合戦略の組\(\sigma _{-i}\in \Delta\left( S_{-i}\right) \)を事前に観察できません。ただ、ゲームの完備性より、プレイヤー\(i\)は他のプレイヤーたちが選択し得る混合戦略の組からなる集合\(\Delta \left(S_{-i}\right) \)を把握しているため、その要素であるそれぞれの組\(\sigma _{-i}\)に対して、自分が混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)を選んだときに直面する期待利得\(F_{i}\left( \sigma _{i},\sigma_{-i}\right) \)を把握しています。

以上を踏まえた上で、他のプレイヤーたちがある混合戦略\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)を選ぶ状況を想定したとき、自身が混合戦略\(\sigma _{i}^{\ast}\in \Delta \left( S_{i}\right) \)を選んだときに直面する期待利得\(F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right) \)が他の任意の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma_{i}^{\ast }\right\} \)を選んだときに直面する期待利得よりも大きい場合には、すなわち、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する狭義の最適反応(strict best response)であると言います。これは、\(\sigma _{-i}\)を所与としたとき、プレイヤー\(i\)が直面する期待利得は\(\sigma _{i}^{\ast }\)のもとで狭義に最大化されることを意味します。

純粋戦略は特別な混合戦略であるため、混合戦略が混合戦略の組に対する狭義の最適反応であることの意味を規定する上の定義は、純粋戦略が純粋戦略の組に対する狭義の最適反応であること、混合戦略が純粋戦略の組に対する狭義の最適反応であること、純粋戦略が混合戦略の組に対する狭義の最適反応であることの定義などを内包しています。

例(狭義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&-\sigma _{1}\sigma
_{2}+\sigma _{1}\left( 1-\sigma _{2}\right) +\left( 1-\sigma _{1}\right)
\sigma _{2}-\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&-\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}となります。したがって、\(\sigma _{2}>\frac{1}{2}\)を満たす\(\sigma _{2}\in \left[ 0,1\right] \)に対する狭義の最適反応は\(\sigma_{1}=0\)であり、\(\sigma _{2}<\frac{1}{2}\)を満たす\(\sigma _{2}\in \left[ 0,1\right] \)に対する狭義の最適反応は\(\sigma _{1}=1\)である一方で、\(\sigma _{2}=\frac{1}{2}\)に対する狭義の最適反応は存在しません。また、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)を選ぶとき、プレイヤー\(2\)が混合戦略\(\sigma_{2}\)から得る期待利得は、\begin{eqnarray*}F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sigma _{1}\sigma _{2}-\sigma
_{1}\left( 1-\sigma _{2}\right) -\left( 1-\sigma _{1}\right) \sigma
_{2}+\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}となります。したがって、\(\sigma _{1}>\frac{1}{2}\)を満たす\(\sigma _{1}\in \left[ 0,1\right] \)に対する狭義の最適反応は\(\sigma_{2}=1\)であり、\(\sigma _{1}<\frac{1}{2}\)を満たす\(\sigma _{1}\in \left[ 0,1\right] \)に対する狭義の最適反応は\(\sigma _{2}=1\)である一方で、\(\sigma _{1}=\frac{1}{2}\)に対する狭義の最適反応は存在しません。

プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略\(\sigma _{-i}\)に対する狭義の最適反応であることは、\begin{equation}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right) \quad \cdots (1)
\end{equation}が成り立つこととして定義されます。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma _{i}^{\ast }\)を選ぶことにより期待利得を狭義で最大化できることを意味します。ただ、たとえプレイヤー\(i\)が有限個の純粋戦略を持つ場合でも混合戦略の個数は無限であり、無限個の混合戦略を対象に\(\left(1\right) \)が成り立つことを検証するのは実質的に不可能です。ただ、このような問題は解決可能です。

実は、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略\(\sigma _{i}\)に対する狭義の最適反応である場合、\(\sigma _{i}^{\ast }\)は純粋戦略であることが保証されます。

命題(狭義の最適反応は純粋戦略)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略からなる組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する狭義の最適反応である場合、\(\sigma _{i}^{\ast }\)は純粋戦略になる。つまり、\(\sigma _{i}^{\ast }\in S_{i}\)が成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題より、すべてのプレイヤーが混合戦略を採用することを認める場合においても、狭義の最適反応の候補を純粋戦略に限定しても一般性は失われないことが明らかになりました。

 

狭義の混合戦略ナッシュ均衡

プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略\(\sigma _{-i}\in \Delta \left(S_{-i}\right) \)に対する狭義の最適反応であることとは、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つこととして定義されます。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma _{i}^{\ast }\)を選ぶことにより自身が直面する期待利得を狭義に最大化できることを意味します。さて、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left(\sigma _{i}^{\ast }\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma_{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
\backslash \left\{ \sigma _{i}^{\ast }\right\} :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) >F_{i}\left( \sigma _{i},\sigma
_{-i}\right)
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)を狭義の混合戦略ナッシュ均衡(strict mixed Nash equilibrium)や狭義のナッシュ均衡(strict Nashequilibrium)などと呼びます。

先に明らかにしたように、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略\(\sigma _{i}\)に対する狭義の最適反応である場合、\(\sigma _{i}^{\ast }\)は純粋戦略であることが保証されるため以下の命題が成り立ちます。

命題(狭義の混合戦略ナッシュ均衡は狭義の純粋戦略ナッシュ均衡)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)に狭義の混合戦略ナッシュ均衡\(\sigma_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在する場合、\(\sigma _{I}^{\ast }\)は狭義の純粋戦略ナッシュ均衡になる。つまり、\(\sigma _{I}^{\ast }\in S_{I}\)が成り立つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題より、すべてのプレイヤーが混合戦略を採用することを認める場合においても、狭義のナッシュ均衡の候補を狭義の純粋戦略ナッシュ均衡に限定しても一般性は失われないことが明らかになりました。

例(狭義の混合戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 5,5 & 0,8^{\ast } \\ \hline
D & 8^{\ast },0 & 2^{\ast },2^{\ast } \\ \hline
\end{array}$$

表にはそれぞれのプレイヤーが純粋戦略の範囲で狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、\begin{equation*}\left( D,R\right)
\end{equation*}は狭義の最適反応の組であるため、これは狭義の純粋戦略ナッシュ均衡です。したがって先の命題より、これは狭義の混合戦略ナッシュ均衡であるとともに、他に狭義の混合戦略ナッシュ均衡は存在しません。

例(狭義の混合戦略ナッシュ均衡)
以下の利得行列で表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
B & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

表にはそれぞれのプレイヤーが純粋戦略の範囲で狭義の最適反応を選んだ場合に得る利得に\(\ast \)を記しています。表から明らかであるように、このゲームには狭義の純粋戦略ナッシュ均衡は存在しません。したがって先の命題より、このゲームには狭義の混合戦略ナッシュ均衡は存在しません。

 

演習問題

問題(狭義のナッシュ均衡と広義のナッシュ均衡の関係)
以下の問いに答えてください。

  1. 戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において混合戦略の組\(\sigma _{I}^{\ast }\in \Delta\left( S_{I}\right) \)が狭義の混合戦略ナッシュ均衡である場合には、\(\sigma _{I}^{\ast }\)は広義の混合戦略ナッシュ均衡であることを示してください。
  2. 戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において混合戦略の組\(\sigma _{I}^{\ast }\in \Delta\left( S_{I}\right) \)が広義の混合戦略ナッシュ均衡である場合には、\(\sigma _{I}^{\ast }\)は狭義の混合戦略ナッシュ均衡であるとは限らないことを示してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(狭義のナッシュ均衡と広義のナッシュ均衡の関係)
以下の利得行列で表される完備情報の静学ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 0,0 & 0,0 \\ \hline
B & 0,0 & 0,0 \\ \hline
\end{array}$$

  1. 任意の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \in \Delta \left(S_{1}\right) \times \Delta \left( S_{2}\right) \)が広義の混合戦略ナッシュ均衡であることを示してください。
  2. 任意の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \in \Delta \left(S_{1}\right) \times \Delta \left( S_{2}\right) \)が狭義の混合戦略ナッシュ均衡ではないことを示してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録