事後最適反応と中間最適反応の関係
問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。プレイヤー\(i\)の純粋戦略\(s_{i}\)が他のプレイヤーたちの戦略\(s_{-i}\)に対する事後最適反応であるものとします。つまり、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i}:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}が成り立つということです。この場合、プレイヤー\(i\)の信念\(f_{i}\)がいかなるものであっても、\(s_{i}\)は\(s_{-i}\)に対する中間最適反応であること、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall a_{i}\in A_{i}:E_{\theta _{-i}}
\left[ u_{i}\left( s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta
_{-i}\right) ,\theta _{I}\right) \ |\ \theta _{i}\right] \geq E_{\theta
_{-i}}\left[ u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \ |\ \theta _{i}\right]
\end{equation*}が成り立つことが保証されます。
上の命題の逆は成立するとは限りません。つまり、\(s_{i}\)が\(s_{-i}\)に対する中間最適反応であっても、\(s_{i}\)は\(s_{-i}\)に対する事後最適反応であるとは限りません(演習問題)。
支配戦略は事後最適反応でもあることと先の命題を踏まえると以下を得ます。
事後均衡はベイジアンナッシュ均衡
ベイジアンゲーム\(G\)においてプレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\)が事後均衡であるものとします。つまり、任意のプレイヤー\(i\)について\(s_{i}^{\ast }\)が\(s_{-i}^{\ast }\)に対する事後最適反応であるということです。すると、先の命題より、プレイヤー\(i\)の信念\(f_{i}\)を任意に選んだとき、\(s_{i}^{\ast }\)は\(s_{-i}^{\ast }\)に対する中間最適反応になります。任意のプレイヤーとその任意の信念について同様の議論が成立するため、結局、この場合、プレイヤーたちの信念\(\left\{ f_{i}\right\} _{i\in I}\)を任意に選んだとき、\(s_{I}^{\ast }\)はベイジアンナッシュ均衡であることが保証されます。
上の命題の逆は成立するとは限りません。つまり、ベイジアンゲームにおけるベイジアンナッシュ均衡は事後均衡であるとは限りません(演習問題)。
支配戦略均衡が事後均衡であることと上の命題より以下を得ます。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】