教材一覧
教材一覧
教材検索
STATIC GAME OF INCOMPLETE INFORMATION

ベイジアンゲームにおける事後均衡

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

事後最適反応

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。任意のプレイヤーの純粋戦略集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちが選び得る純粋戦略からなる集合\(S_{-i}\)を把握していますが、ゲームの静学性より、他のプレイヤーたちが実際に選ぶ純粋戦略の組\(s_{-i}\in S_{-i}\)を事前に観察することはできません。また、任意のプレイヤーのタイプ集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちのタイプがとり得る値からなる集合\(\Theta _{-i}\)を把握していますが、ゲームの不完備性より、他のプレイヤーたちの真のタイプ\(\theta _{-i}^{\ast }\in \Theta _{-i}\)を事前に観察することはできません。このような状況において、プレイヤー\(i\)は何らかの純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選択しますが、これは自身のそれぞれのタイプ値\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を包括的に指定する行動計画に相当します。プレイヤー\(i\)は自身の真のタイプ\(\theta _{i}^{\ast }\)を知っていますが、純粋戦略\(s_{i}\)のもとでは、真のタイプ\(\theta _{i}^{\ast }\)のもとでの行動\(s_{i}\left( \theta _{i}^{\ast }\right) \)を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ\(\theta _{i}\)に対しても、その場合に自分が選ぶであろう行動\(s_{i}\left(\theta _{i}\right) \)をそれぞれ指定する必要があります。

以上を踏まえた上で、プレイヤー\(i\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に直面した状況を想定します。仮に他のプレイヤーたちのタイプが\(\theta_{-i}\in \Theta _{-i}\)である場合、彼らが選ぶ行動の組は\(s_{-i}\left( \theta _{-i}\right) \in A_{-i}\)となります。仮にプレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta_{i}\)であり、なおかつ純粋戦略\(s_{i}\in S_{i}\)を選ぶのであれば、プレイヤー\(i\)が選ぶ行動は\(s_{i}\left(\theta _{i}\right) \in A_{i}\)となります。以上のタイプの組から構成される状態\(\theta_{I}=\left( \theta _{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) \)であるため、以上の想定のもとでプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}であり、プレイヤー\(i\)はこの利得を事前に把握しています。他の任意の\(\theta _{i},\theta _{-i},s_{i}\)についても同様です。ただ、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)に関わらず、問題としている\(s_{-i}\)に対して、自分は純粋戦略\(s_{i}\)を選ぶことにより上の利得を最大化できることが保証される場合には、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{i}\in A_{i},:u_{i}\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta _{-i}\right) \geq
u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta
_{-i}\right)
\end{equation*}すなわち、\begin{equation*}
\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}が成り立つ場合には、このような\(s_{i}\)を\(s_{-i}\)に対する事後最適反応(ex-post best response)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、プレイヤー\(i\)の純粋戦略\(s_{i}\)が他のプレイヤータイの純粋戦略\(s_{-i}\)に対する事後最適反応であることは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{i}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{i}\right)
\end{equation*}が成り立つことを意味します。

プレイヤー\(i\)の事後最適反応は、他のプレイヤーたちの純粋戦略に依存して変化します。つまり、ある\(s_{-i}\)に対するプレイヤー\(i\)の事後最適反応が\(s_{i}\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対するプレイヤー\(i\)の事後最適反応は\(s_{i}\)であるとは限りません。

事後最適反応のもとで最大化されるものは中間期待利得ではなく利得であることから、これはプレイヤーの信念に依存しない概念です。プレイヤー\(i\)の純粋戦略\(s_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\)に対する事後最適反応である場合には、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、プレイヤー\(i\)がいかなる信念\(f_{i}\)を持っているかに関わらず、他のプレイヤーたちが\(s_{-i}\)にしたがって行動を選ぶことを前提とする限りにおいて、プレイヤー\(i\)は\(s_{i}\)にしたがって行動を選択すれば自身の利得を常に最大化できます。したがって、プレイヤー\(i\)が事後最適反応を持つ場合には、プレイヤー\(i\)は他のプレイヤーのタイプを読んだり予想する必要はありません。ただ、これは他のプレイヤーたちが\(s_{-i}\)にしたがうという前提のもとで成り立つ事実であることに注意する必要があります。

 

ベイジアンゲームにおける事後最適反応と状態ゲームにおける最適反応の関係

ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する事後最適反応であるものとします。つまり、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i},:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}が成り立つということです。ここで、状態\(\theta _{I}\in \Theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta _{I}\right) \)を考えると、\begin{equation*}\forall a_{i}\in A_{i},:u_{i}\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立ちますが、これは\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)が\(s_{-i}\left( \theta_{-i}\right) \)に対する最適反応であることを意味します。任意の状態\(\theta _{I}\)において同様の議論が成立するため、結局、ベイジアンゲームにおいて\(s_{i}\)が\(s_{-i}\)に対する事後最適反応であることと、任意の状態ゲーム\(G\left( \theta_{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)が\(s_{-i}\left( \theta _{-i}\right) \)に対する最適反応であることは必要十分です。つまり、不完備情報ゲームにおける事後最適反応は完備情報ゲームにおける最適反応の一般化であるということです。

命題(ベイジアンゲームにおける事後最適反応と状態ゲームにおける最適反応の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する事後最適反応であることは、任意の状態\(\theta _{I}\in \Theta _{I}\)において、状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)が\(s_{-i}\left( \theta _{-i}\right) \)に対する最適反応であるための必要十分条件である。

以上の命題より、ベイジアンゲーム\(G\)と他のプレイヤーたちの純粋戦略\(s_{-i}\)が与えられたとき、それぞれの状態ゲーム\(G\left( \theta _{I}\right) \)における\(s_{-i}\left( \theta _{-i}\right) \)に対する最適反応に相当する行動\(a_{i}\)を特定した上で、それぞれの\(\theta _{I}\in \Theta _{I}\)に対して\(s_{i}\left( \theta _{I}\right) =a_{i}\)を定める純粋戦略\(s_{i}\)を構成すれば、それが\(G\)における\(s_{-i}\)に対する事後最適反応であることが保証されます。以下が具体例です。

例(事後最適反応)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。プレイヤー\(2\)の純粋戦略\(s_{2}\)が、\begin{equation*}s_{2}\left( \theta _{21}\right) =a
\end{equation*}を満たすとき、プレイヤー\(1\)はこの\(s_{2}\)に対する事後最適反応を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において、プレイヤー\(1\)は相手の\(a\)に対して最適反応\(a\)を持ちます。もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において、プレイヤー\(1\)は相手の\(a\)に対して最適反応\(a\)を持ちます。したがって、\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}を満たす純粋戦略\(s_{1}\)はもとのベイジアンゲーム\(G\)において\(s_{2}\)に対する事後最適反応です。では、プレイヤー\(2\)の純粋戦略\(s_{2}^{\prime }\)が、\begin{equation*}s_{2}^{\prime }\left( \theta _{21}\right) =b
\end{equation*}を満たすとき、プレイヤー\(1\)はこの\(s_{2}^{\prime }\)に対する事後最適反応を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において、プレイヤー\(1\)は相手の\(b\)に対して2つの最適反応\(a,b\)を持ちます。もう一方の状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)において、プレイヤー\(1\)は相手の\(b\)に対して2つの最適反応\(a,b\)を持ちます。したがって、\begin{eqnarray*}s_{11} &=&\left( s_{11}\left( \theta _{11}\right) ,s_{11}\left( \theta
_{12}\right) \right) =\left( a,a\right) \\
s_{12} &=&\left( s_{12}\left( \theta _{11}\right) ,s_{12}\left( \theta
_{12}\right) \right) =\left( a,b\right) \\
s_{13} &=&\left( s_{13}\left( \theta _{11}\right) ,s_{13}\left( \theta
_{12}\right) \right) =\left( b,a\right) \\
s_{14} &=&\left( s_{14}\left( \theta _{11}\right) ,s_{14}\left( \theta
_{12}\right) \right) =\left( b,b\right)
\end{eqnarray*}を満たす4つの純粋戦略\(s_{11},s_{12},s_{13},s_{14}\)はいずれももとのベイジアンゲーム\(G\)において\(s_{2}^{\prime }\)に対する事後最適反応です。

先の命題はベイジアンゲームに事後最適反応が存在しないことを示す上でも有用です。ベイジアンゲーム\(G\)の2つの状態ゲーム\(G\left( \theta _{I}\right) ,G\left( \theta _{I}^{\prime }\right) \)に注目したとき、\(G\left(\theta _{I}\right) \)において\(s_{-i}\left( \theta_{-i}\right) \)に対するプレイヤー\(i\)の最適反応が存在し、\(G\left( \theta _{I}^{\prime }\right) \)において\(s_{-i}\left( \theta _{-i}^{\prime }\right) \)に対するプレイヤー\(i\)の最適反応が存在する場合でも、\(G\)においてそれらの最適反応をともに選択できるようなプレイヤー\(i\)の純粋戦略が存在しない場合、先の命題より、プレイヤー\(i\)は\(G\)において\(s_{-i}\)に対する事後最適反応を持ちません。以下が具体例です。

例(事後最適反応)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。プレイヤー\(1\)の純粋戦略\(s_{1}\)が、\begin{equation*}s_{1}\left( \theta _{11}\right) =s_{1}\left( \theta _{12}\right) =a
\end{equation*}を満たすとき、プレイヤー\(2\)はこの\(s_{1}\)に対する事後最適反応を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において、プレイヤー\(2\)は相手の\(a\)に対して最適反応\(a\)を持ちます。もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において、プレイヤー\(2\)は相手の\(a\)に対して最適反応\(b\)を持ちます。ただ、プレイヤー\(2\)はプレイヤー\(1\)のタイプを観察できず、したがって2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta_{21}\right) \)において\(a\)をプレーし\(G\left( \theta _{12},\theta _{21}\right) \)において\(b\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、先の命題より、プレイヤー\(2\)はもとのゲーム\(G\)において先の\(s_{1}\)に対する事後最適反応を持たないことが明らかになりました。

 

事後均衡

繰り返しになりますが、ベイジアンゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する事後最適反応であることは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i}:u_{i}\left(
s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right)_{i\in I}\in S_{I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が他のプレイヤーたちの純粋戦略\(s_{-i}^{\ast }\)に対する事後最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の事後均衡(ex-post equilibrium)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、純粋戦略の組\(s_{I}^{\ast }\)が事後均衡であることは、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{i}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i}\right)
\end{equation*}が成り立つことを意味します。

ベイジアンゲーム\(G\)において純粋戦略の組\(s_{I}^{\ast }\)が事後均衡であるものとします。プレイヤー\(i\)と状態\(\theta _{I}\)を任意に選んだ上で、他のすべてのプレイヤーが均衡戦略\(s_{-i}^{\ast }\)にしたがって行動することを前提とするとき、プレイヤー\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、事後均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left(
\theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left( s_{i}\left( \theta
_{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}という関係が成り立つため、プレイヤー\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーと任意の状態について成り立ちます。つまり、プレイヤーたちが事後均衡\(s_{i}^{\ast}\)をプレーしているとき、それぞれのプレイヤー\(i\)は、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱しても得できません。事後均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが事後均衡\(s_{I}^{\ast }\)を実際にプレーすることを保証するためには、それぞれのプレイヤー\(i\)が、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

ベイジアンゲーム\(G\)に事後均衡\(s_{I}^{\ast }\)が存在する場合には、任意のプレイヤー\(i\)について、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、他のプレイヤーたちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、プレイヤー\(i\)は均衡戦略\(s_{i}^{\ast }\)にしたがって行動を選択すれば自身の利得を常に最大化できます。つまり、事後均衡\(s_{I}^{\ast }\)が存在する場合には、プレイヤーたちはタイプや信念を読み合う必要がなく、お互いに均衡戦略にしたがうという確信さえあれば、理論が予測する均衡\(s_{I}^{\ast }\)が高い精度で実現します。

 

ベイジアンゲームにおける事後均衡と状態ゲームにおけるナッシュ均衡の関係

ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が事後均衡であるものとします。つまり、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i},:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立つということです。ここで、状態\(\theta _{I}\in \Theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta _{I}\right) \)を考えると、\begin{equation*}\forall i\in I,\ \forall a_{i}\in A_{i},:u_{i}\left( s_{i}^{\ast }\left(
\theta _{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}が成り立ちますが、これは\(s_{I}^{\ast }\left( \theta _{I}\right) =\left(s_{i}^{\ast }\left( \theta _{i}\right) \right) _{i\in I}\)が\(G\left(\theta _{I}\right) \)における広義の純粋戦略ナッシュ均衡であることを意味します。任意の状態\(\theta _{I}\)において同様の議論が成立するため、結局、ベイジアンゲームにおいて\(s_{I}^{\ast }\)が事後均衡であることと、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{I}^{\ast }\left( \theta _{I}\right) \)が広義の純粋戦略ナッシュ均衡であることは必要十分です。つまり、不完備情報ゲームにおける事後均衡は完備情報ゲームにおける広義の純粋戦略ナッシュ均衡の一般化であるということです。

命題(ベイジアンゲームにおける事後均衡と状態ゲームにおけるナッシュ均衡の関係)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が事後均衡であることは、任意の状態\(\theta _{I}\in \Theta _{I}\)において、\(s_{I}^{\ast }\left( \theta _{I}\right) \in A_{I}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における広義の純粋戦略ナッシュ均衡であるための必要十分条件である。
例(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 3,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 3,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)に事後均衡は存在するでしょうか。状態ゲーム\(G\left( \theta_{11},\theta _{21}\right) \)における広義の純粋戦略ナッシュ均衡は\(\left( a,a\right) \)と\(\left( b,b\right) \)であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)における広義の純粋戦略ナッシュ均衡は\(\left( a,b\right) \)です。したがって、\begin{eqnarray*}s_{1} &=&\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( b,a\right) \\
s_{2} &=&\left( s_{2}\left( \theta _{21}\right) \right) =\left( b\right)
\end{eqnarray*}を満たす純粋戦略の組\(\left( s_{1},s_{2}\right) \)はもとのベイジアンゲーム\(G\)の事後均衡です。

先の命題は、ベイジアンゲームにおいて事後均衡が存在しないことを示す上でも有用です。与えられたベイジアンゲーム\(G\)の何らかの状態ゲーム\(G\left( \theta _{I}\right) \)に広義の純粋戦略ナッシュ均衡が存在しない場合、もとのベイジアンゲーム\(G\)に事後均衡は存在しません。以下が具体例です。

例(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\left\{a,b\right\} \)、タイプ集合が\(\Theta_{1}=\left\{ \theta _{11},\theta _{12}\right\} \)かつ\(\Theta_{2}=\left\{ \theta _{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta_{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & -1,1 & 1,-1 \\ \hline
b & 1,-1 & -1,1 \\ \hline
\end{array}$$

表:状態ゲーム

として与えられているものとします。もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は任意です。状態ゲーム\(G\left( \theta_{11},\theta _{21}\right) \)には広義の純粋戦略ナッシュ均衡は存在しないため、先の命題より、もとのベイジアンゲーム\(G\)には事後均衡は存在しません。

ベイジアンゲーム\(G\)の任意の状態ゲーム\(G\left(\theta _{I}\right) \)に広義の純粋戦略ナッシュ均衡がそれぞれ存在する場合でも、ベイジアンゲーム\(G\)においてそれらを実現できるような純粋戦略が存在しない場合、もとのベイジアンゲーム\(G\)に事後均衡は存在しません。以下が具体例です。

例(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,1 & 3,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 3,1 & 2,0 \\ \hline
b & 2,1 & 0,0 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)に事後均衡は存在するでしょうか。状態ゲーム\(G\left( \theta_{11},\theta _{21}\right) \)における広義の純粋戦略ナッシュ均衡は\(\left( b,b\right) \)であり、状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)における広義の純粋戦略ナッシュ均衡は\(\left( a,a\right) \)です。ただ、プレイヤー\(2\)はプレイヤー\(1\)のタイプを観察できず、したがって2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta _{21}\right) \)において\(b\)をプレーし\(G\left(\theta _{12},\theta _{21}\right) \)において\(a\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、先の命題より、もとのゲーム\(G\)に事後均衡が存在しないことが明らかになりました。

 

演習問題

問題(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21},\theta _{22}\right\} \)であるものとします。この場合、4通りの状態が存在します。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 3,1 & 2,0 \\ \hline
b & 5,1 & 4,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 3,0 & 2,1 \\ \hline
b & 5,0 & 4,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には事後均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(事後均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21},\theta _{22}\right\} \)であるものとします。この場合、4通りの状態が存在します。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 0,0 \\ \hline
b & 3,0 & 1,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 3,0 & 1,2 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 1,2 & 3,0 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 1,1 & 3,0 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には事後均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は事後均衡と支配戦略均衡の関係について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

ベイジアンゲーム
ベイジアンゲームの定義

不完備情報の静学ゲームを記述するためにはプレイヤー、行動、情報、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここではベイジアンゲームと呼ばれるモデルについて解説します。

ベイジアンゲーム
ベイジアンゲームの私的価値モデル

不完備情報の静学ゲームをベイジアンゲームとして表現するとき、すべてのプレイヤーの利得関数が自身のタイプのみに依存し、他のプレイヤーのタイプに依存しないものと仮定する場合には、そのようなモデルを私的価値モデルと呼びます。

ベイジアンゲーム
メカニズムのもとでのゲーム

単一財オークション市場においてメカニズムを提示された入札者たちが直面する戦略的状況はベイジアンゲームとして定式化されます。そのようなゲームにおいて、それぞれの入札者は自身のタイプと信念にもとづいて他の入札者たちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

ベイジアンゲーム
ベイジアンゲームにおける純粋戦略

不完備情報の静学ゲームをベイジアンゲームとして表現したとき、プレイヤーによる意思決定は純粋戦略と呼ばれる概念として定式化されます。プレイヤーの純粋戦略とは、自身のそれぞれのタイプに対して行動を1つずつ定める行動計画です。

ベイジアンゲーム
ベイジアンゲームにおける信念

ベイジアンゲームにおいて不確実な状況下で意思決定を迫られるプレイヤーは、自身のそれぞれのタイプに対して、その場合に自分が直面し得る状態ゲームがそれぞれどの程度の確率で起こりえるか主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。

ベイジアンゲーム
中間期待利得とベイジアン仮説

不完備情報の静学ゲームを表現するベイジアンゲームに直面したそれぞれのプレイヤーは、自身のタイプと信念にもとづいて他のプレイヤーたちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

ベイジアンゲーム
ベイジアンゲームにおける支配戦略均衡

ベイジアンゲームにおいてプレイヤーがある純粋戦略を選ぶとき、自身を含めた全員のタイプや他のプレイヤーたちの行動、信念に関わらず利得を常に最大化できるならば、そのような戦略を支配純粋戦略と呼びます。支配純粋戦略の組を支配純粋戦略均衡と呼びます。

事後均衡
事後均衡と支配戦略均衡の関係

ベイジアンゲームにおいて事後均衡は支配戦略均衡でもありますが、その逆は成立するとは限りません。ただ、私的価値モデルにおいて事後均衡が一定の条件を満たす場合、それは支配戦略均衡になることが保証されます。

ベイジアンゲーム
ベイジアンナッシュ均衡

ベイジアンナッシュ均衡における最適反応の概念を定義するとともに、最適反応であるような純粋戦略の組としてベイジアンナッシュ均衡と呼ばれる均衡概念を定義します。

ベイジアンゲーム
ベイジアンナッシュ均衡と事後均衡の関係

ベイジアンゲームにおいて、事後均衡はベイジアンナッシュ均衡でもある一方で、その逆は成り立つとは限りません。また、支配戦略均衡はベイジアンナッシュ均衡でもある一方で、その逆は成り立つとは限りません。

ベイジアンゲーム
ベイジアンゲームにおける高階の信念と共通事前分布

ベイジアンゲームにおいてプレイヤーたちが各々のタイプを読み合う可能性を認めると、ゲームの分析が突如として複雑になってしまいます。このような問題を解消するために、多くの場合、プレイヤーたちのタイプに関して共通事前分布という仮定を設けます。

ハーサニ変換
ベイジアンゲームのハーサニ変換とベイズ同値仮説

ベイジアンゲームの分析を容易にするため、共通事前分布の仮定のもとで、ゲームを不完全な動学ゲームへハーサニ変換します。変換後のゲームにおける均衡概念は事前ベイジアンナッシュ均衡です。