教材一覧
教材検索
STATIC GAME OF COMPLETE INFORMATION

狭義の混合戦略ナッシュ均衡

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

混合戦略の範囲での狭義の最適反応

狭義の最適反応の概念は戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においても容易に拡張されます。つまり、プレイヤー\(i\in I\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に直面したとき、自身の期待利得が混合戦略\(\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \)のもとで狭義に最大化される場合には、すなわち、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する狭義の最適反応(strict best response)であると言います。

純粋戦略は特別な混合戦略であるため、あるプレイヤーの混合戦略が他のプレイヤーたちの混合戦略の組に対する狭義の最適反応であることを規定する上の定義は、純粋戦略が純粋戦略の組に対する狭義の最適反応であること、純粋戦略が混合戦略の組に対する狭義の最適反応であること、混合戦略が純粋戦略の組に対する狭義の最適反応であることの意味をすべて内包しています。

プレイヤー\(i\)による狭義の最適反応は、他のプレイヤーたちの混合戦略の組に依存して変化します。つまり、ある\(\sigma _{-i}\)に対するプレイヤー\(i\)の狭義の最適反応が\(\sigma _{i}^{\ast }\)であるとき、\(\sigma _{-i}\)とは別の\(\sigma _{-i}^{\prime }\)に対するプレイヤー\(i\)の狭義の最適反応は\(\sigma _{i}^{\ast }\)であるとは限りません。また、他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)が与えられたとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限りません。いずれも以下の例より明らかです。

例(狭義の最適反応)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:狭義の最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=1\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},1\right) &=&\left( -1\right) \sigma _{1}+1\left(
1-\sigma _{1}\right) \\
&=&-2\sigma _{1}+1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する減少関数であるため、\(\sigma _{2}=1\)に対する狭義の最適反応は\(\sigma _{1}=0\)です。一方、プレイヤー\(2\)が混合戦略\(\sigma _{2}=0\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},0\right) &=&1\sigma _{1}+\left( -1\right) \left(
1-\sigma _{1}\right) \\
&=&2\sigma _{2}-1
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関する増加関数であるため、\(\sigma _{2}=0\)に対する狭義の最適反応は\(\sigma _{1}=1\)です。さらに、プレイヤー\(2\)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\left( -1\right) \cdot \frac{\sigma _{1}}{2}+1\cdot \frac{\sigma _{1}}{2}+1\cdot \frac{1-\sigma _{1}}{2}+\left( -1\right) \cdot \frac{1-\sigma _{1}}{2} \\
&=&0
\end{eqnarray*}ですが、これは定数であるため、\(\sigma _{2}=\frac{1}{2}\)に対する狭義の最適反応は存在しません。

他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)が与えられたとき、それに対するプレイヤー\(i\)の狭義の最適反応は存在するとは限りませんが、存在する場合には一意的です。実際、プレイヤー\(i\)が\(\sigma _{-i}\)に対して異なる2つの狭義の最適反応\(\sigma _{i},\sigma _{i}^{\prime }\)を持つものと仮定すると、狭義の最適反応の定義より、\begin{eqnarray*}F_{i}\left( \sigma _{i},\sigma _{-i}\right) &>&F_{i}\left( \sigma
_{i}^{\prime },\sigma _{-i}\right) \\
F_{i}\left( \sigma _{i}^{\prime },\sigma _{-i}\right) &>&F_{i}\left( \sigma
_{i},\sigma _{-i}\right)
\end{eqnarray*}がともに成り立ちますが、これは矛盾です。

命題(狭義の最適反応の一意性)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤー\(i\in I\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する狭義の最適反応を持つ場合、それは一意的である。

他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対して、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が狭義の最適反応であるならば、これは広義の最適反応でもあります。しかも、これは\(\sigma _{-i}\)に対する唯一の広義の最適反応です。

命題(狭義の最適反応と広義の最適反応の関係)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においてプレイヤー\(i\)の混合戦略\(\sigma_{i}^{\ast }\in \Delta \left( S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する狭義の最適反応であるならば、\(\sigma _{i}^{\ast }\)は\(\sigma _{-i}\)に対する唯一の広義の最適反応である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題の逆は成り立つとは限りません。つまり、\(\sigma _{-i}\)に対する広義の最適反応は狭義の最適反応であるとは限らないということです。以下の例より明らかです。

例(狭義の最適反応と広義の最適反応の関係)
以下の利得行列で表される戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:最適反応

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)が混合戦略\(\sigma _{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\left( -1\right) \cdot \frac{\sigma _{1}}{2}+1\cdot \frac{\sigma _{1}}{2}+1\cdot \frac{1-\sigma _{1}}{2}+\left( -1\right) \cdot \frac{1-\sigma _{1}}{2} \\
&=&0
\end{eqnarray*}ですが、これは定数であるため、\(\sigma _{2}=\frac{1}{2}\)に対する狭義の最適反応は存在しない一方で、任意の\(\sigma _{1}\)は\(\sigma_{2}=\frac{1}{2}\)に対する広義の最適反応です。

 

狭義の混合戦略ナッシュ均衡

繰り返しになりますが、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left(S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する狭義の最適反応であることとは、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) \backslash \left\{ \sigma
_{i}^{\ast }\right\} :F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}\right)
>F_{i}\left( \sigma _{i},\sigma _{-i}\right)
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより自身の期待利得を狭義に最大化できることを意味します。さて、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast}=\left( \sigma _{i}^{\ast }\right) _{i\in I}\)において、それぞれのプレイヤー\(i\)の混合戦略\(\sigma_{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}^{\ast }\)に対する狭義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
\backslash \left\{ \sigma _{i}^{\ast }\right\} :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}^{\ast }\right) >F_{i}\left( \sigma _{i},\sigma
_{-i}^{\ast }\right)
\end{equation*}が成り立つならば、\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)における狭義のナッシュ均衡(strict Nash equilibrium)や狭義の混合戦略ナッシュ均衡(strict mixed Nash equilibrium)などと呼びます。

混合戦略の組\(\sigma _{I}^{\ast }\)が狭義の混合戦略ナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のプレイヤーたちが均衡戦略にしたがい\(\sigma _{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(\sigma _{i}^{\ast }\)から逸脱して他の混合戦略\(\sigma _{i}\)を選ぶと、狭義の混合ナッシュ均衡の定義より、\begin{equation*}F_{i}\left( \sigma _{i}^{\ast },\sigma _{-i}^{\ast }\right) >F_{i}\left(
\sigma _{i},\sigma _{-i}^{\ast }\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱によって損をしてしまいます。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちが狭義の混合ナッシュ均衡\(\sigma _{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(\sigma_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(\sigma _{i}^{\ast }\)から逸脱すると損をしてしまいます。狭義の混合ナッシュ均衡ではプレイヤーたちの戦略がお互いに狭義の最適反応になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが狭義の混合ナッシュ均衡\(\sigma _{I}^{\ast }\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

例(狭義の混合戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。プレイヤー\(2\)の混合戦略\(\sigma _{2}\)に対するプレイヤー\(1\)の狭義の最適反応からなる集合を\(b_{1}\left( \sigma _{2}\right) \)で表記するのであれば、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\phi & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}となります。また、プレイヤー\(1\)の混合戦略\(\sigma _{1}\)に対するプレイヤー\(2\)の狭義の最適反応からなる集合を\(b_{2}\left(\sigma _{1}\right) \)で表記するのであれば、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\phi & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}となります。

図:狭義の混合戦略ナッシュ均衡

プレイヤー\(1\)の狭義の最適反応対応\(b_{1}\)を上図の赤いグラフで、プレイヤー\(2\)の狭義の最適反応対応\(b_{2}\)を上図の青いグラフでそれぞれ図示しました。狭義の混合戦略ナッシュ均衡は狭義の最適反応の組\(\left( \sigma _{1}^{\ast},\sigma _{2}^{\ast }\right) \)として定義されるため、2つのグラフが交わる点が狭義の混合戦略ナッシュ均衡です。したがって、狭義の混合戦略ナッシュ均衡は、\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 0,1\right)
,\left( 1,0\right)
\end{equation*}の2つです。

プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する狭義の最適反応であるならば、それは\(\sigma _{-i}\)に対する広義の最適反応でもあります。したがって、狭義の混合戦略ナッシュ均衡は広義の混合戦略ナッシュ均衡でもあります。

命題(狭義の混合戦略ナッシュ均衡と広義の混合戦略ナッシュ均衡の関係)
戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)において、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left(S_{I}\right) \)が狭義の混合戦略ナッシュ均衡であるならば、\(\sigma _{I}^{\ast }\)は広義の混合戦略ナッシュ均衡でもある。

逆は成り立つとは限りません。つまり、広義の混合戦略ナッシュ均衡は狭義の混合戦略ナッシュ均衡であるとは限りません。以下の例より明らかです。

例(狭義の混合戦略ナッシュ均衡と広義の混合戦略ナッシュ均衡の関係)
以下の利得行列で表される完備情報の静学ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & -1,1 & 1,-1 \\ \hline
B & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の混合戦略\(\sigma _{i}\)を、\begin{equation*}\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right) \right)
=(\sigma _{i},1-\sigma _{i})
\end{equation*}と表記します。\(0\leq \sigma_{i}\leq 1\)です。このゲームの広義の混合戦略ナッシュ均衡は、\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 0,1\right)
,\left( \frac{1}{2},\frac{1}{2}\right) ,\left( 1,0\right)
\end{equation*}の3つである一方で、狭義の混合戦略ナッシュ均衡は、\begin{equation*}
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 0,1\right)
,\left( 1,0\right)
\end{equation*}の2つです。

繰り返しになりますが、狭義の混合戦略ナッシュ均衡は広義の混合戦略ナッシュ均衡でもあります。また、無限ゲームの混合拡張に広義の混合戦略ナッシュ均衡は存在するとは限らないため、無限ゲームの混合拡張に狭義の混合戦略ナッシュ均衡は存在するとは限りません。一方、後ほど示すように、有限ゲームの混合拡張には必ず広義の混合戦略ナッシュ均衡が存在する一方で、有限ゲームの混合拡張に狭義の混合戦略ナッシュ均衡は存在するとは限りません。以下の例より明らかです。

例(狭義の混合戦略ナッシュ均衡)
以下の利得行列で表される完備情報の静学ゲーム\(G\)の混合拡張\(G^{\ast }\)について考えます。明らかにこれは有限ゲームです。

$$\begin{array}{ccc}\hline
1\diagdown 2 & A & B \\ \hline
A & 0,0 & 0,0 \\ \hline
B & 0,0 & 0,0 \\ \hline
\end{array}$$

表:利得行列

任意の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)に対して、\begin{equation*}F_{1}\left( \sigma _{1},\sigma _{2}\right) =F_{2}\left( \sigma _{1},\sigma
_{2}\right) =0
\end{equation*}となるため、任意の\(\sigma _{1}\)に対して任意の\(\sigma_{2}\)は広義の最適反応であり、任意の\(\sigma _{2}\)に対して任意の\(\sigma _{1}\)は広義の最適反応であるため、任意の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)が広義の混合戦略ナッシュ均衡です。一方、任意の\(\sigma _{1}\)に対してプレイヤー\(2\)は狭義の最適反応を持たず、任意の\(\sigma _{2}\)に対してプレイヤー\(1\)は狭義の最適反応を持たないため、このゲームには狭義の混合戦略ナッシュ均衡は存在しません。

次回からナッシュの定理について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

ナッシュ均衡

広義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限らず、存在する場合にも一意的であるとは限りません。

ナッシュ均衡

狭義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに狭義の最適反応になっているならば、その組を狭義の純粋戦略ナッシュ均衡と呼びます。

ナッシュ均衡

広義の混合戦略ナッシュ均衡

戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに広義の最適反応になっているならば、その組を広義の混合戦略ナッシュ均衡と呼びます。

ナッシュ均衡

ナッシュ均衡と支配される戦略の逐次消去の関係

戦略型ゲームにナッシュ均衡が存在する場合、そのゲームに支配される戦略の逐次消去を適用すると、そのナッシュ均衡は最後まで残ります。特に、ゲームが逐次消去によって解ける場合、その解はゲームの一意的なナッシュ均衡であることが保証されます。

ナッシュ均衡

ナッシュ均衡と支配戦略均衡の関係

戦略型ゲームに支配戦略均衡が存在する場合、それはナッシュ均衡であることが保証されます。逆は成立するとは限りません。つまり、ナッシュ均衡は支配戦略均衡であるとは限りません。

ナッシュ均衡

ナッシュ均衡の正当性

合理性の仮定や期待効用仮説を採用する限りにおいて、完備情報の静学ゲームにおける均衡概念はナッシュ均衡しか存在しません。しかし、これはあくまでもゲームの分析者の立場から見たときの考え方であり、プレイヤーの視点から考えてみると話が少し複雑になります。

ナッシュ均衡

ナッシュ均衡と自己拘束的な合意

プレイヤーたちが事前交渉を行い何らかの合意に至った場合、それを強制する仕組みが存在しないにも関わらず合意が守られるのであれば、そのような合意は自己拘束的であると言われます。自己拘束的な合意は必ずナッシュ均衡である一方、その逆は成立するとは限りません。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

完備情報の静学ゲーム