WIIS

完備情報の動学ゲーム

展開型ゲームにおける混合戦略ナッシュ均衡

目次

関連知識

Mailで保存
Xで共有

混合戦略の範囲での最適反応

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\(\Gamma \)として表現されているものとします。それぞれのプレイヤー\(i\in I\)が純粋戦略\(s_{i}\in S_{i}\)を採用する場合、そこでプレイヤーたちが直面する戦略的状況は\(\Gamma \)の戦略型\begin{equation*}G\left( \Gamma \right) =\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{
U_{i}\right\} _{i\in I}\right)
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\)の純粋戦略集合、\(U_{i}\)はプレイヤー\(i\)が純粋戦略の組どうしを比較する\(S_{I}\)上の期待利得関数です。

一方、展開型ゲーム\(\Gamma \)においてそれぞれのプレイヤー\(i\in I\)が混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)を採用する場合、そこでプレイヤーたちが直面する戦略的状況は\(G\left( \Gamma \right) \)の混合拡張\begin{equation*}G^{\ast }\left( \Gamma \right) =\left( I,\left\{ \Delta \left( S_{i}\right)
\right\} _{i\in I},\left\{ F_{i}\right\} _{i\in I}\right)
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(\Delta \left( S_{i}\right) \)はプレイヤー\(i\)の混合戦略集合、\(F_{i}\)はプレイヤー\(i\)が混合戦略の組どうしを比較する\(\Delta\left( S_{I}\right) \)上の期待利得関数です。

広義の最適反応の概念は戦略型ゲーム\(G\left(\Gamma \right) \)の混合拡張\(G^{\ast }\left(\Gamma \right) \)においても容易に拡張されます。つまり、プレイヤー\(i\in I\)が他のプレイヤーたちの混合戦略の組\(\sigma_{-i}\in \Delta \left( S_{-i}\right) \)に直面したとき、自身の期待利得が混合戦略\(\sigma _{i}^{\ast}\in \Delta \left( S_{i}\right) \)のもとで最大化される場合には、すなわち、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}\left( \sigma
_{i}^{\ast },\sigma _{-i}\right) \geq F_{i}\left( \sigma _{i},\sigma
_{-i}\right)
\end{equation*}が成り立つのであれば、\(\sigma _{i}^{\ast }\)を\(\sigma _{-i}\)に対する広義の最適反応(weak best response)と呼びます。

純粋戦略は特別な混合戦略であるため、あるプレイヤーの混合戦略が他のプレイヤーたちの混合戦略の組に対する広義の最適反応であることを規定する上の定義は、純粋戦略が純粋戦略の組に対する広義の最適反応であること、純粋戦略が混合戦略の組に対する広義の最適反応であること、混合戦略が純粋戦略の組に対する広義の最適反応であることの意味をすべて内包しています。

プレイヤー\(i\)による広義の最適反応は、他のプレイヤーたちの混合戦略の組に依存して変化します。つまり、ある\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応が\(\sigma _{i}^{\ast }\)であるとき、\(\sigma _{-i}\)とは別の\(\sigma _{-i}^{\prime }\)に対するプレイヤー\(i\)の広義の最適反応は\(\sigma _{i}^{\ast }\)であるとは限りません。以下の例より明らかです。

例(広義の最適反応)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:ゲームの木
図:ゲームの木

それぞれのプレイヤーの純粋戦略集合は、\begin{eqnarray*}
S_{1} &=&\left\{ A\left( \left\{ x_{0}\right\} \right) \right\} =\left\{
a_{11},a_{12}\right\} \\
S_{2} &=&\left\{ A\left( \left\{ x_{1},x_{2}\right\} \right) \right\}
=\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}であり、この展開型ゲーム\(\Gamma \)の戦略型\(G\left(\Gamma \right) \)は以下の通りです。

$$\begin{array}{ccc}\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
a_{12} & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

利得行列

プレイヤー\(1\)の混合戦略\(\sigma _{1}\)を、\begin{equation*}\sigma _{1}=\left( \sigma _{1}\left( a_{11}\right) ,\sigma _{1}\left(
a_{12}\right) \right) =\left( \sigma _{1},1-\sigma _{1}\right)
\end{equation*}で表記します。つまり、混合戦略\(\sigma _{1}\)のもと、確率\(\sigma _{1}\)で純粋戦略\(a_{11}\)を選び、確率\(1-\sigma_{1}\)で純粋戦略\(a_{12}\)を選ぶということです。言い換えると、情報集合\(\left\{ x_{0}\right\} \)において確率\(\sigma _{1}\)で行動\(a_{11}\)を選び、確率\(1-\sigma _{1}\)で行動\(a_{12}\)を選ぶということです。同様に、プレイヤー\(2\)の混合戦略を、\begin{equation*}\sigma _{2}=\left( \sigma _{2}\left( a_{21}\right) ,\sigma _{2}\left(
a_{22}\right) \right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{equation*}で表記します。さて、プレイヤー\(2\)が混合戦略\(\sigma _{2}=1\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},1\right) &=&\left( -1\right) \cdot \sigma _{1}\cdot
1+1\cdot \left( 1-\sigma _{1}\right) \cdot 1 \\
&=&-2\sigma _{1}+1
\end{eqnarray*}ですが、これは\(\sigma _{1}\in \left[ 0,1\right] \)に関する減少関数であるため、\(\sigma _{2}=1\)に対する広義の最適反応は\(\sigma _{1}=0\)です。一方、プレイヤー\(2\)が混合戦略\(\sigma _{2}=0\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},0\right) &=&1\cdot \sigma _{1}\cdot 1+\left(
-1\right) \cdot \left( 1-\sigma _{1}\right) \cdot 1 \\
&=&2\sigma _{1}-1
\end{eqnarray*}ですが、これは\(\sigma _{1}\in \left[ 0,1\right] \)に関する増加関数であるため、\(\sigma _{2}=0\)に対する広義の最適反応は\(\sigma _{1}=1\)です。

以下の例が示すように、広義の最適反応は1つであるとは限りません。

例(広義の最適反応)
繰り返しになりますが、以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:ゲームの木
図:ゲームの木

それぞれのプレイヤーの純粋戦略集合は、\begin{eqnarray*}
S_{1} &=&\left\{ A\left( \left\{ x_{0}\right\} \right) \right\} =\left\{
a_{11},a_{12}\right\} \\
S_{2} &=&\left\{ A\left( \left\{ x_{1},x_{2}\right\} \right) \right\}
=\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}であり、この展開型ゲーム\(\Gamma \)の戦略型\(G\left(\Gamma \right) \)は以下の通りです。

$$\begin{array}{ccc}\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
a_{12} & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーの混合戦略を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( a_{11}\right) ,\sigma _{1}\left(
a_{12}\right) \right) =\left( \sigma _{1},1-\sigma _{1}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( a_{21}\right) ,\sigma _{2}\left(
a_{22}\right) \right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{eqnarray*}で表記します。プレイヤー\(2\)が混合戦略\(\sigma_{2}=\frac{1}{2}\)を選ぶとき、プレイヤー\(1\)が混合戦略\(\sigma _{1}\)から得る期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\frac{1}{2}\right) &=&\left( -1\right) \cdot \sigma
_{1}\cdot \frac{1}{2}+1\cdot \sigma _{1}\cdot \frac{1}{2}+1\cdot \left(
1-\sigma _{1}\right) \cdot \frac{1}{2}+\left( -1\right) \cdot \left(
1-\sigma _{1}\right) \cdot \frac{1}{2} \\
&=&0
\end{eqnarray*}ですが、これは\(\sigma _{1}\)に関係なく定数であるため、\(\sigma _{2}=\frac{1}{2}\)に対する広義の最適反応は任意の\(\sigma _{1}\)です。

繰り返しになりますが、戦略型ゲーム\(G\left(\Gamma \right) \)の混合拡張\(G^{\ast }\left(\Gamma \right) \)において、プレイヤー\(i\)の広義の最適反応は他のプレイヤーたちの戦略の組\(\sigma _{-i}\)に依存して変化します。また、それぞれの\(\sigma _{-i}\)に対するプレイヤー\(i\)の広義の最適反応は1つであるとは限りません。以上を踏まえた上で、それぞれの\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対して、それに対するプレイヤー\(i\)の広義の最適反応からなる集合\begin{equation*}b_{i}(\sigma _{-i})=\{\sigma _{i}^{\ast }\in \Delta \left( S_{i}\right) \ |\
F_{i}(\sigma _{i}^{\ast },\sigma _{-i})=\max_{\sigma _{i}\in \Delta \left(
S_{i}\right) }F_{i}(\sigma _{i},\sigma _{-i})\}
\end{equation*}を像として定める対応\begin{equation*}
b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left(
S_{i}\right)
\end{equation*}を定義し、これをプレイヤー\(i\)の広義の最適反応対応(weak best response correspondence)と呼びます。

例(広義の最適反応)
繰り返しになりますが、以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:ゲームの木
図:ゲームの木

それぞれのプレイヤーの純粋戦略集合は、\begin{eqnarray*}
S_{1} &=&\left\{ A\left( \left\{ x_{0}\right\} \right) \right\} =\left\{
a_{11},a_{12}\right\} \\
S_{2} &=&\left\{ A\left( \left\{ x_{1},x_{2}\right\} \right) \right\}
=\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}であり、この展開型ゲーム\(\Gamma \)の戦略型\(G\left(\Gamma \right) \)は以下の通りです。

$$\begin{array}{ccc}\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
a_{12} & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーの混合戦略を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( a_{11}\right) ,\sigma _{1}\left(
a_{12}\right) \right) =\left( \sigma _{1},1-\sigma _{1}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( a_{21}\right) ,\sigma _{2}\left(
a_{22}\right) \right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{eqnarray*}で表記します。混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&-\sigma _{1}\sigma
_{2}+\sigma _{1}\left( 1-\sigma _{2}\right) +\left( 1-\sigma _{1}\right)
\sigma _{2}-\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&-\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}であるため、プレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left( S_{2}\right) \twoheadrightarrow\Delta \left( S_{1}\right) \)はそれぞれの\(\sigma _{2}\in \Delta \left( S_{2}\right) \)に対して、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)においてプレイヤー\(2\)が直面する期待利得は、\begin{eqnarray*}F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sigma _{1}\sigma _{2}-\sigma
_{1}\left( 1-\sigma _{2}\right) -\left( 1-\sigma _{1}\right) \sigma
_{2}+\left( 1-\sigma _{1}\right) \left( 1-\sigma _{2}\right) \\
&=&\left( 2\sigma _{1}-1\right) \left( 2\sigma _{2}-1\right)
\end{eqnarray*}であるため、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow\Delta \left( S_{2}\right) \)はそれぞれの\(\sigma _{1}\in \Delta \left( S_{1}\right) \)に対して、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。

 

広義の混合戦略ナッシュ均衡

繰り返しになりますが、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}^{\ast }\in \Delta \left(S_{i}\right) \)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)に対する広義の最適反応であることとは、\begin{equation*}\forall \sigma _{i}\in \Delta \left( S_{i}\right) :F_{i}(\sigma _{i}^{\ast
},\sigma _{-i})\geq F_{i}(\sigma _{i},\sigma _{-i})
\end{equation*}が成り立つことを意味します。これは、他のプレイヤーたちが\(\sigma _{-i}\)を選ぶ場合には、プレイヤー\(i\)は\(\sigma_{i}^{\ast }\)を選ぶことにより自身の期待利得を最大化できることを意味します。さて、プレイヤーたちの混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma_{i}^{\ast }\right) _{i\in I}\)において、それぞれの任意のプレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}^{\ast }\)に対する広義の最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \sigma _{i}\in \Delta \left( S_{i}\right)
:F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma
_{i},\sigma _{-i}^{\ast })
\end{equation*}が成り立つならば、\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)における広義のナッシュ均衡(weak Nash equilibrium)や広義の混合戦略ナッシュ均衡(weak mixed strategy Nash equilibrium)などと呼びます。

混合戦略の組\(\sigma _{I}^{\ast }\)が広義のナッシュ均衡であるものとします。プレイヤー\(i\)を任意に選んだ上で、他のすべてのプレイヤーが均衡戦略に\(\sigma _{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(\sigma_{i}^{\ast }\)から逸脱して他の混合戦略\(\sigma _{i}\)を選ぶと、広義のナッシュ均衡の定義より、\begin{equation*}F_{i}(\sigma _{i}^{\ast },\sigma _{-i}^{\ast })\geq F_{i}(\sigma _{i},\sigma
_{-i}^{\ast })
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーについて成り立ちます。

つまり、プレイヤーたちが広義のナッシュ均衡\(\sigma _{I}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(\sigma _{i}^{\ast }\)から逸脱しても得できません。広義のナッシュ均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが広義のナッシュ均衡\(\sigma _{I}^{\ast }\)を実際にプレーすることを保証するために、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(\sigma _{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

プレイヤー\(i\)による広義の最適反応対応\(b_{i}:\Delta \left( S_{-i}\right) \twoheadrightarrow \Delta \left(S_{i}\right) \)を用いると、プレイヤー\(i\)の混合戦略\(\sigma _{i}^{\ast }\)が他のプレイヤーたちの混合戦略の組\(\sigma _{-i}\)に対する広義の最適反応であることは、\begin{equation*}\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}\right)
\end{equation*}が成り立つこととして表現可能です。したがって、混合戦略の組\(\sigma _{I}^{\ast }=\left( \sigma _{i}^{\ast }\right)_{i\in I}\)が広義の混合戦略ナッシュ均衡であることとは、\begin{equation*}\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast }\right)
\end{equation*}が成り立つことを意味します。

命題(広義の最適反応対応と広義の混合戦略ナッシュ均衡)
限界型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)の混合拡張\(G^{\ast }\left( \Gamma \right) \)において、それぞれのプレイヤー\(i\in I\)の広義の最適反応対応を\(b_{i}:\Delta \left( S_{-i}\right)\twoheadrightarrow \Delta \left( S_{i}\right) \)で表す。このとき、混合戦略の組\(\sigma _{I}^{\ast }\in \Delta \left( S_{I}\right) \)について、\begin{equation*}\forall i\in I:\sigma _{i}^{\ast }\in b_{i}\left( \sigma _{-i}^{\ast
}\right)
\end{equation*}が成り立つことは、\(\sigma _{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であるための必要十分条件である。
例(広義の混合戦略ナッシュ均衡)
繰り返しになりますが、以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:ゲームの木
図:ゲームの木

それぞれのプレイヤーの純粋戦略集合は、\begin{eqnarray*}
S_{1} &=&\left\{ A\left( \left\{ x_{0}\right\} \right) \right\} =\left\{
a_{11},a_{12}\right\} \\
S_{2} &=&\left\{ A\left( \left\{ x_{1},x_{2}\right\} \right) \right\}
=\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}であり、この展開型ゲーム\(\Gamma \)の戦略型\(G\left(\Gamma \right) \)は以下の通りです。

$$\begin{array}{ccc}\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
a_{12} & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
\end{array}$$

それぞれのプレイヤーの混合戦略を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( a_{11}\right) ,\sigma _{1}\left(
a_{12}\right) \right) =\left( \sigma _{1},1-\sigma _{1}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( a_{21}\right) ,\sigma _{2}\left(
a_{22}\right) \right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{eqnarray*}で表記します。先に明らかにしたように、プレイヤー\(1\)の広義の最適反応対応\(b_{1}:\Delta \left(S_{2}\right) \twoheadrightarrow \Delta \left( S_{1}\right) \)はそれぞれの\(\sigma _{2}\in \Delta \left( S_{2}\right) \)に対して、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cc}
\left\{ 0\right\} & \left( if\ \sigma _{2}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
\left\{ 1\right\} & \left( if\ \sigma _{2}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定め、プレイヤー\(2\)の広義の最適反応対応\(b_{2}:\Delta \left( S_{1}\right) \twoheadrightarrow \Delta \left(S_{2}\right) \)はそれぞれの\(\sigma_{1}\in \Delta \left( S_{1}\right) \)に対して、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cc}
\left\{ 1\right\} & \left( if\ \sigma _{1}>\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
\left\{ 0\right\} & \left( if\ \sigma _{1}<\frac{1}{2}\right)
\end{array}\right.
\end{equation*}を定めます。

図:混合戦略ナッシュ均衡
図:混合戦略ナッシュ均衡

プレイヤー\(1\)の広義の最適反応対応\(b_{1}\)を上図の青いグラフで、プレイヤー\(2\)の広義の最適反応対応\(b_{2}\)を上図の赤いグラフでそれぞれ図示しました。広義の混合戦略ナッシュ均衡は広義の最適反応の組\(\left( \sigma _{1}^{\ast},\sigma _{2}^{\ast }\right) \)として定義されるため、2つのグラフが交わる点が広義の混合戦略ナッシュ均衡です。したがって、広義の混合戦略ナッシュ均衡は、\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( \frac{1}{2},\frac{1}{2}\right)
\end{equation*}です。先の命題を用いて確認しましょう。実際、\begin{eqnarray*}
\frac{1}{2} &\in &b_{1}\left( \frac{1}{2}\right) \\
\frac{1}{2} &\in &b_{2}\left( \frac{1}{2}\right)
\end{eqnarray*}が成り立つため、\(\left(\sigma _{1},\sigma _{2}\right) =\left( \frac{1}{2},\frac{1}{2}\right) \)は広義の混合戦略ナッシュ均衡です。

 

広義の純粋戦略ナッシュ均衡と混合戦略ナッシュ均衡の関係

展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)に広義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在するものとします。プレイヤー\(i\in I\)を任意に選んだとき、純粋戦略は特別な混合戦略であることと、広義の純粋戦略ナッシュ均衡の定義を踏まえると、このとき、純粋戦略\(s_{i}^{\ast }\)は混合戦略\(s_{-i}^{\ast }\)に対する広義の最適反応です。混合戦略\(s_{i}^{\ast }\)は純粋戦略\(s_{i}^{\ast }\)にのみ正の確率を付与することを踏まえると、混合戦略\(s_{i}^{\ast }\)は混合戦略\(s_{-i}^{\ast }\)に対する広義の最適反応です。任意のプレイヤー\(i\)について同様の議論が成立するため、\(s_{I}^{\ast }\)が広義の混合戦略ナッシュ均衡であることが明らかになりました。

命題(広義の純粋戦略ナッシュ均衡と混合戦略ナッシュ均衡の関係)
展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)に広義の純粋戦略ナッシュ均衡\(s_{I}^{\ast }\in \Delta \left( S_{I}\right) \)が存在する場合、\(s_{I}^{\ast }\)は\(G\left( \Gamma \right) \)の混合拡張\(G^{\ast}\left( \Gamma \right) \)における広義の混合戦略ナッシュ均衡である。

上の命題の逆は成り立つとは限りません。つまり、広義の混合戦略ナッシュ均衡は広義の純粋戦略ナッシュ均衡であるとは限りません。先の例より明らかです。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録