教材一覧
STATIC GAME OF INCOMPLETE INFORMATION

純粋戦略事後均衡

Share on twitter
Twitterで共有
Share on email
メールで共有

純粋戦略事後最適反応

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G=\left( I,\left\{ A_{i}\right\} _{i\in I},\left\{\Theta _{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I}\right) \)として表現されているものとします。任意のプレイヤーの純粋戦略集合は共有知識であるため、プレイヤー\(i\in I\)は他のプレイヤーたちが選び得る純粋戦略の組からなる集合\(S_{-i}\)を把握していますが、ゲームの静学性より、他のプレイヤーたちが実際に選ぶ純粋戦略の組\(s_{-i}\in S_{-i}\)を事前に観察することはできません。また、任意のプレイヤーのタイプ集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちのタイプの組からなる集合\(\Theta _{-i}\)を把握していますが、ゲームの不完備性より、他のプレイヤーたちの真のタイプの組\(\theta _{-i}^{\ast}\in \Theta _{-i}\)を事前に観察することはできません。このような状況において、プレイヤー\(i\)は何らかの純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選択しますが、これは自身のそれぞれのタイプ値\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left(\theta _{i}\right) \in A_{i}\)を包括的に指定する行動計画に相当します。プレイヤー\(i\)は自身の真のタイプ\(\theta _{i}^{\ast }\)を知っていますが、純粋戦略\(s_{i}\)のもとでは、真のタイプ\(\theta _{i}^{\ast }\)のもとでの行動\(s_{i}\left( \theta _{i}^{\ast }\right) \)を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ\(\theta _{i}\)に対しても、その場合に自分が選ぶであろう行動\(s_{i}\left( \theta _{i}\right) \)をそれぞれ指定する必要があります。

以上を踏まえた上で、プレイヤー\(i\)が他のプレイヤーたちの純粋戦略のある組\(s_{-i}\in S_{-i}\)に直面した状況を想定します。仮に他のプレイヤーたちのタイプの組が\(\theta _{-i}\in \Theta _{-i}\)である場合、彼らが選ぶ行動の組は\(s_{-i}\left( \theta_{-i}\right) \in A_{-i}\)となります。仮にプレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)であり、なおかつ純粋戦略\(s_{i}\in S_{i}\)を選ぶのであれば、プレイヤー\(i\)が選ぶ行動は\(s_{i}\left( \theta _{i}\right) \in A_{i}\)となります。以上のタイプの組から構成される状態\(\theta _{I}=\left( \theta_{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) \)であるため、以上の想定のもとでプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}であり、プレイヤー\(i\)はこの利得を事前に把握しています。他の任意の\(\theta _{i},\theta _{-i},s_{i}\)についても同様です。ただ、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)に関わらず、与えられた\(s_{-i}\)に対して、自分はある純粋戦略\(s_{i}\)を選ぶことにより上の利得を最大化できることが保証される場合には、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{i}\in A_{i},:u_{i}\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta _{-i}\right) \geq
u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta
_{-i}\right)
\end{equation*}すなわち、\begin{equation*}
\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}を満たす純粋戦略\(s_{i}\in S_{i}\)が存在する場合には、そのような\(s_{i}\)を\(s_{-i}\)に対する純粋戦略事後最適反応(pure ex-post best response)や事後最適反応(ex-post best response)などと呼びます。特に、プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、上の条件を、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{i}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{i}\right)
\end{equation*}と言い換えることができます。

プレイヤー\(i\)の純粋戦略事後最適反応は、他のプレイヤーたちの純粋戦略の組に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の事後最適反応が\(s_{i}\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の事後最適反応は\(s_{i}\)であるとは限りません。

事後最適反応のもとで最大化されるものは中間期待利得ではなく利得であることから、これはプレイヤーの信念に依存しない概念です。プレイヤー\(i\)の純粋戦略\(s_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\)に対する事後最適反応である場合には、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、プレイヤー\(i\)がいかなる信念\(f_{i}\)を持っているかに関わらず、他のプレイヤーたちが\(s_{-i}\)にしたがって行動を選ぶ限りにおいて、プレイヤー\(i\)は\(s_{i}\)にしたがって行動を選択すれば自身の利得を常に最大化できます。したがって、プレイヤー\(i\)が事後最適反応を持つ場合には、プレイヤー\(i\)は他のプレイヤーのタイプを読んだり予想する必要はありません。ただ、これは他のプレイヤーたちが\(s_{-i}\)にしたがうという条件のもとで成り立つ事実であることに注意する必要があります。

 

事後最適反応を探す方法

ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する事後最適反応であるものとします。つまり、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}が成り立つということです。ここで、状態\(\theta _{I}\in \Theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta _{I}\right) \)を考えると、\begin{equation*}\forall a_{i}\in A_{i},:u_{i}\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立ちますが、これは\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)が\(s_{-i}\left( \theta_{-i}\right) \)に対する純粋戦略最適反応であることを意味します。任意の状態\(\theta _{I}\)において同様の議論が成立するため、結局、ベイジアンゲームにおいて\(s_{i}\)が\(s_{-i}\)に対する事後最適反応であることは、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)が\(s_{-i}\left( \theta _{-i}\right) \)に対する純粋戦略最適反応であることを意味します。逆も明らかに成立するため以下の命題を得ます。つまり、不完備情報ゲームにおける事後最適反応は、完備情報ゲームにおける最適反応の拡張であるということです。

命題(事後最適反応)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する事後最適反応であることは、任意の状態\(\theta _{I}\in \Theta _{I}\)において、状態ゲーム\(G\left(\theta _{I}\right) \)において\(s_{i}\left( \theta_{i}\right) \)が\(s_{-i}\left( \theta _{-i}\right) \)に対する最適反応であるための必要十分条件である。

以上の命題より、ベイジアンゲーム\(G\)と他のプレイヤーたちの純粋戦略の組\(s_{-i}\)が与えられたとき、それぞれの状態ゲーム\(G\left(\theta _{I}\right) \)における\(s_{-i}\left( \theta_{-i}\right) \)に対する最適反応に相当する行動\(a_{i}\)を特定した上で、それぞれの\(\theta _{I}\in \Theta _{I}\)に対して\(s_{i}\left( \theta _{I}\right) =a_{i}\)を定める\(s_{i}\)を構成すれば、そのような任意の\(s_{i}\)が\(G\)における\(s_{-i}\)に対する最適反応であることが保証されます。以下が具体例です。

例(支配純粋戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。プレイヤー\(2\)の純粋戦略\(s_{2}\)が、\begin{equation*}s_{2}\left( \theta _{21}\right) =a
\end{equation*}を満たすとき、プレイヤー\(1\)はこの\(s_{2}\)に対する事後最適反応を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において、プレイヤー\(1\)は\(s_{2}\left( \theta _{21}\right) =a\)に対する最適反応\(a\)を持ちます。もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)においても、プレイヤー\(1\)は\(s_{2}\left( \theta _{21}\right) =a\)に対する最適反応\(a\)を持ちます。したがって、\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}を満たす純粋戦略\(s_{1}\)はもとのベイジアンゲーム\(G\)において\(s_{2}\)に対する事後最適反応です。では、プレイヤー\(2\)の純粋戦略\(s_{2}\)が、\begin{equation*}s_{2}\left( \theta _{21}\right) =b
\end{equation*}を満たすとき、プレイヤー\(1\)はこの\(s_{2}\)に対する事後最適反応を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において、プレイヤー\(1\)は\(s_{2}\left( \theta _{21}\right) =b\)に対する2つの最適反応\(a,b\)を持ちます。もう一方の状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)においても、プレイヤー\(1\)は\(s_{2}\left( \theta_{21}\right) =b\)に対する最適反応\(a,b\)を持ちます。したがって、\begin{eqnarray*}s_{11} &=&\left( s_{11}\left( \theta _{11}\right) ,s_{11}\left( \theta
_{12}\right) \right) =\left( a,a\right) \\
s_{12} &=&\left( s_{12}\left( \theta _{11}\right) ,s_{12}\left( \theta
_{12}\right) \right) =\left( a,b\right) \\
s_{13} &=&\left( s_{13}\left( \theta _{11}\right) ,s_{13}\left( \theta
_{12}\right) \right) =\left( b,a\right) \\
s_{14} &=&\left( s_{14}\left( \theta _{11}\right) ,s_{14}\left( \theta
_{12}\right) \right) =\left( b,b\right)
\end{eqnarray*}を満たす4つの純粋戦略\(s_{11},s_{12},s_{13},s_{14}\)はいずれも\(s_{2}\)に対する事後最適反応です。

 

純粋戦略事後均衡

繰り返しになりますが、ベイジアンゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)に対する事後最適反応であることは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right)_{i\in I}\in S_{I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略の組\(s_{-i}^{\ast }\)に対する事後最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i},:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の純粋戦略事後均衡(pure ex-post equilibrium)や事後均衡(ex-post equilibrium)などと呼びます。特に、任意のプレイヤーの利得関数に関して私的価値の仮定が成り立つ場合には、上の条件を、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i},:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{i}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i}\right)
\end{equation*}と言い換えることができます。

純粋戦略の組\(s_{I}^{\ast }\)が事後均衡であるものとします。プレイヤー\(i\)と状態\(\theta _{I}\)を任意に選んだ上で、他のすべてのプレイヤーが事後均衡にしたがい\(s_{-i}^{\ast }\)を選ぶことを前提とするとき、プレイヤー\(i\)だけが事後均衡\(s_{I}^{\ast }\)における均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、事後均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left(
\theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left( a_{i},s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーと任意の状態について成り立ちます。

つまり、プレイヤーたちが事後均衡\(s_{i}^{\ast }\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱しても得できません。事後均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが事後均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が事後均衡であるものとします。つまり、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i},:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立つということです。ここで、状態\(\theta _{I}\in \Theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta _{I}\right) \)を考えると、\begin{equation*}\forall i\in I,\ \forall a_{i}\in A_{i},:u_{i}\left( s_{i}^{\ast }\left(
\theta _{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}が成り立ちますが、これは\(s_{I}^{\ast }\left( \theta _{I}\right) =\left(s_{i}^{\ast }\left( \theta _{i}\right) \right) _{i\in I}\)が\(G\left(\theta _{I}\right) \)における純粋戦略ナッシュ均衡であることを意味します。任意の状態\(\theta _{I}\)において同様の議論が成立するため、結局、ベイジアンゲームにおいて\(s_{I}^{\ast }\)が事後均衡であることは、任意の状態ゲーム\(G\left( \theta_{I}\right) \)において\(s_{I}^{\ast }\left( \theta_{I}\right) \)が純粋戦略ナッシュ均衡であることを意味します。逆も明らかに成立するため以下の命題を得ます。つまり、不完備情報ゲームにおける事後均衡は、完備情報の静学ゲームにおけるナッシュ均衡の拡張であるということです。

命題(純粋戦略事後均衡)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が純粋戦略事後均衡であることは、任意の状態\(\theta _{I}\in \Theta _{I}\)において、\(s_{I}^{\ast }\left( \theta_{I}\right) \in A_{I}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における純粋戦略ナッシュ均衡であるための必要十分条件である。
例(純粋戦略事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 3,1 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 3,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)に事後均衡\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)は存在するでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,a\right) \)と\(\left( b,b\right) \)であり、状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,b\right) \)です。したがって、\begin{eqnarray*}s_{1}^{\ast } &=&\left( s_{1}^{\ast }\left( \theta _{11}\right) ,s_{1}^{\ast
}\left( \theta _{12}\right) \right) =\left( b,a\right) \\
s_{2}^{\ast } &=&\left( s_{2}\left( \theta _{21}\right) \right) =\left(
b\right)
\end{eqnarray*}を満たす\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)がもとのベイジアンゲーム\(G\)の唯一の事後均衡です。

 

演習問題

問題(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21},\theta _{22}\right\} \)であるものとします。この場合、4通りの状態が存在します。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{22}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3,1 & 2,0 \\ \hline
b & 5,1 & 4,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3,0 & 2,1 \\ \hline
b & 5,0 & 4,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{22}\right) \)

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には純粋戦略事後均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21},\theta _{22}\right\} \)であるものとします。この場合、4通りの状態が存在します。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 0,0 \\ \hline
b & 3,0 & 1,1 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 3,0 & 1,2 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{22}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 1,2 & 3,0 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 1,1 & 3,0 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{22}\right) \)

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には純粋戦略事後均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は事後均衡と支配戦略均衡の関係について解説します。

質問・コメント(プレミアム会員限定) 次へ進む
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録