ベイジアンゲームにおける広義の事後均衡

ベイジアンゲームにおける広義の事後最適反応

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム$G$として表現されているものとします。任意のプレイヤーの純粋戦略集合は共有知識であるため、プレイヤー$i$は他のプレイヤーたちが選び得る純粋戦略からなる集合$S_{-i}$を把握していますが、ゲームの静学性より、他のプレイヤーたちが実際に選ぶ純粋戦略$s_{-i}\in S_{-i}$を事前に観察することはできません。また、任意のプレイヤーのタイプ集合は共有知識であるため、プレイヤー$i$は他のプレイヤーたちのタイプがとり得る値からなる集合$\Theta _{-i}$を把握していますが、ゲームの不完備性より、他のプレイヤーたちの真のタイプ$\theta _{-i}^{\ast}\in \Theta _{-i}$を事前に観察することはできません。このような状況において、プレイヤー$i$は何らかの純粋戦略$s_{i}:\Theta _{i}\rightarrow A_{i}$を選択しますが、これは自身のそれぞれのタイプ値$\theta _{i}\in \Theta _{i}$に対して、そのときに自分が選択するであろう行動$s_{i}\left(\theta _{i}\right) \in A_{i}$を1つずつ指定する行動計画に相当します。プレイヤー$i$は自身の真のタイプ$\theta _{i}^{\ast }$を知っていますが、純粋戦略$s_{i}$のもとでは、真のタイプ$\theta _{i}^{\ast }$のもとでの行動$s_{i}\left( \theta _{i}^{\ast }\right) $を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ$\theta _{i}$に対しても、その場合に自分が選ぶであろう行動$s_{i}\left( \theta _{i}\right) $をそれぞれ指定する必要があります。

以上を踏まえた上で、プレイヤー$i$が他のプレイヤーたちの純粋戦略$s_{-i}\in S_{-i}$に直面した状況を想定します。仮に他のプレイヤーたちのタイプが$\theta_{-i}\in \Theta _{-i}$である場合、彼らが選ぶ行動は$s_{-i}\left( \theta _{-i}\right) \in A_{-i}$となります。仮にプレイヤー$i$のタイプが$\theta _{i}\in \Theta _{i}$であり、なおかつ純粋戦略$s_{i}\in S_{i}$を選ぶのであれば、プレイヤー$i$が選ぶ行動は$s_{i}\left( \theta_{i}\right) \in A_{i}$となります。以上のタイプの組から構成される状態$\theta_{I}=\left( \theta _{i},\theta _{-i}\right) $におけるプレイヤー$i$の利得関数は$u_{i}\left( \cdot ,\theta _{I}\right) $であるため、以上の想定のもとでプレイヤー$i$が得る利得は、\begin{equation*}u_{i}\left( s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right) =u_{i}\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta _{-i}\right)
\end{equation*}であり、プレイヤー$i$はこの利得を事前に把握しています。他の任意の$\theta _{i},\theta _{-i},s_{i}$についても同様です。ただ、自分のタイプ$\theta _{i}$や他のプレイヤーたちのタイプ$\theta _{-i}$がどのようなものであったとしても、問題としている$s_{-i}$に対して、自分は純粋戦略$s_{i}$を選ぶことにより上の利得が常に最大化されることが保証される場合には、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta _{-i}\right) \geq
u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta _{i},\theta
_{-i}\right)
\end{equation*}すなわち、\begin{equation*}
\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i}:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}が成り立つ場合には、$s_{i}$を$s_{-i}$に対する広義の事後最適反応（weakly ex-post best response）と呼びます。

例（私的価値モデルの場合）

プレイヤー$i$の利得関数$u_{i}$に関して私的価値の仮定が成り立つ場合には、$u_{i}$の形状は他のプレイヤーたちのタイプの組$\theta _{-i}$に依存せず、自身のタイプ$\theta _{i}$にのみ依存するため、プレイヤー$i$の純粋戦略$s_{i}$が他のプレイヤーたちの純粋戦略$s_{-i}$に対する広義の事後最適反応であることは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i}:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{i}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{i}\right)
\end{equation*}が成り立つことを意味します。

プレイヤー$i$の広義の事後最適反応は、他のプレイヤーたちの純粋戦略に依存して変化します。つまり、ある$s_{-i}$に対するプレイヤー$i$の広義の事後最適反応が$s_{i}$であるとき、$s_{-i}$とは別の$s_{-i}^{\prime }$に対するプレイヤー$i$の広義の事後最適反応は$s_{i}$であるとは限りません。

広義の事後最適反応のもとで最大化されるものは中間期待利得ではなく利得であることから、これはプレイヤーの信念に依存しない概念です。プレイヤー$i$の純粋戦略$s_{i}$が他のプレイヤーたちの純粋戦略$s_{-i}$に対する広義の事後最適反応である場合には、自分のタイプ$\theta _{i}$や他のプレイヤーたちのタイプ$\theta _{-i}$がどのようなものであるかに関わらず、また、自分がどのような信念$f_{i}$を持っているかに関わらず、他のプレイヤーたちが$s_{-i}$にしたがって行動することを前提とする限りにおいて、プレイヤー$i$は$s_{i}$にしたがって行動を選択すれば自身の利得を常に最大化できます。したがって、プレイヤー$i$が広義の事後最適反応を持つ場合には、プレイヤー$i$は他のプレイヤーのタイプを読んだり、予想する必要はありません。ただ、これは他のプレイヤーたちが$s_{-i}$にしたがって行動するという前提のもとで成り立つ事実であることに注意する必要があります。

ベイジアンゲームの事後最適反応と状態ゲームの最適反応の関係

ベイジアンゲーム$G$において、プレイヤー$i$の純粋戦略$s_{i}$が他のプレイヤーたちの純粋戦略$s_{-i}$に対する広義の事後最適反応であるものとします。状態$\theta _{I}$を任意に選び、そこでの状態ゲーム$G\left( \theta _{I}\right) $について考えます。ベイジアンゲーム$G$においてプレイヤー$i$が$s_{i}$を採用し、他のプレイヤーたちが$s_{-i}$を採用する場合、状態ゲーム$G\left( \theta_{I}\right) $においてプレイヤー$i$は行動$s_{i}\left( \theta _{i}\right) $を選択し、他のプレイヤーたちは行動$s_{-i}\left( \theta_{-i}\right) $を選択することになります。状態ゲーム$G\left( \theta _{I}\right) $は完備情報ゲームであるため、行動は純粋戦略と同一視されますが、状態ゲーム$G\left( \theta _{I}\right) $において$s_{i}\left( \theta _{i}\right) $は$s_{-i}\left( \theta _{-i}\right) $に対する広義の最適反応になることが保証されます。つまり、ベイジアンゲームにおいて$s_{i}$が$s_{-i}$に対する広義の事後最適反応である場合、それぞれの状態ゲームにおいて$s_{i}$が命じる行動は$s_{-i}$が命じる行動に対する広義の最適反応になることが保証されるということです。

命題（ベイジアンゲームの事後最適反応は状態ゲームの最適反応を導く）

ベイジアンゲーム$G$において、プレイヤー$i\in I$の純粋戦略$s_{i}\in S_{i}$が他のプレイヤーたちの純粋戦略$s_{-i}\in S_{-i}$に対する広義の事後最適反応であるならば、状態$\theta _{I}\in \Theta _{I}$を任意に選んだとき、状態ゲーム$G\left( \theta _{I}\right) $において$s_{i}\left( \theta _{i}\right) \in A_{i}$は$s_{-i}\left( \theta_{-i}\right) \in A_{-i}$に対する広義の最適反応である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

逆の議論も成立します。つまり、ベイジアンゲーム$G$においてプレイヤー$i$が純粋戦略$s_{i}$を採用し、他のプレイヤーたちが純粋戦略$s_{-i}$を採用する場合、それぞれの状態ゲーム$G\left( \theta _{I}\right) $においてプレイヤー$i$は行動$s_{i}\left( \theta _{i}\right) $を選択し、他のプレイヤーたちは行動$s_{-i}\left( \theta _{-i}\right) $を選択することになりますが、任意の状態ゲーム$G\left( \theta _{I}\right) $において$s_{i}\left( \theta _{i}\right) $が$s_{-i}\left( \theta_{-i}\right) $に対する広義の最適反応になることが保証される場合、もとのベイジアンゲーム$G$において$s_{i}$は$s_{-i}$に対する広義の事後最適反応になります。

命題（状態ゲームの最適反応を導く純粋戦略は事後最適反応）

ベイジアンゲーム$G$において、プレイヤー$i\in I$の純粋戦略$s_{i}\in S_{i}$と他のプレイヤーたちの純粋戦略$s_{-i}\in S_{-i}$が与えられているものとする。状態$\theta _{I}\in \Theta _{I}$を任意に選んだとき、状態ゲーム$G\left( \theta _{I}\right) $において$s_{i}\left( \theta _{i}\right) \in A_{i}$が$s_{-i}\left( \theta _{-i}\right) \in A_{-i}$に対する広義の最適反応であるならば、ベイジアンゲーム$G$において$s_{i}$は$s_{-i}$に対する広義の事後最適反応である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

以上の2つの命題を踏まえると、ベイジアンゲームにおける広義の事後最適反応を以下のように特徴づけることができます。

命題（ベイジアンゲームの事後最適反応と状態ゲームの最適反応の関係）

ベイジアンゲーム$G$において、プレイヤー$i\in I$の純粋戦略$s_{i}\in S_{i}$と他のプレイヤーたちの純粋戦略$s_{-i}\in S_{-i}$が与えられているものとする。状態$\theta _{I}\in \Theta _{I}$を任意に選んだとき、状態ゲーム$G\left( \theta _{I}\right) $において$s_{i}\left( \theta _{i}\right) \in A_{i}$が$s_{-i}\left( \theta _{-i}\right) \in A_{-i}$に対する広義の最適反応であることと、ベイジアンゲーム$G$において$s_{i}$が$s_{-i}$に対する広義の事後最適反応であることは必要十分である。

以上の命題は、ベイジアンゲームにおける広義の事後最適反応を特定する作業を、完備情報ゲームである状態ゲームにおける広義の最適反応を特定する作業へ帰着させられることを保証しています。つまり、ベイジアンゲーム$G$における他のプレイヤーたちの純粋戦略$s_{-i}$が与えられたとき、それぞれの状態ゲーム$G\left( \theta _{I}\right) $において他のプレイヤーたちの行動$s_{-i}\left( \theta _{-i}\right) $に対する広義の最適反応に相当する行動$a_{i}$を特定した上で、それぞれの状態$\theta _{I}\in\Theta _{I}$に対して$s_{i}\left( \theta _{i}\right)=a_{i}$を満たす純粋戦略$s_{i}$を構成すれば、それはもとのベイジアンゲーム$G$において$s_{-i}$に対する広義の事後最適反応であることが保証されるということです。

例（広義の事後最適反応）

ベイジアンゲーム$G$のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム$G\left(\theta _{11},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム$G$におけるプレイヤー$2$の純粋戦略$s_{2}$の中でも、\begin{equation*}s_{2}\left( \theta _{21}\right) =a
\end{equation*}に注目します。プレイヤー$1$は$s_{2}$に対する広義の最適反応を持つでしょうか。状態ゲーム$G\left( \theta _{11},\theta _{21}\right) $においてプレイヤー$2$は先の$s_{2}$のもとで$s_{2}\left( \theta_{21}\right) =a$を選びますが、これに対するプレイヤー$1$の広義の最適反応は$a$です。もう一方の状態ゲーム$G\left( \theta _{12},\theta_{21}\right) $においてプレイヤー$2$は先の$s_{2}$のもとで$s_{2}\left( \theta _{21}\right) =a$を選びますが、これに対するプレイヤー$1$の広義の最適反応は$a$です。したがって、\begin{eqnarray*}s_{1}\left( \theta _{11}\right) &=&a \\
s_{1}\left( \theta _{12}\right) &=&a
\end{eqnarray*}を満たす$s_{1}$はもとのベイジアンゲーム$G$において$s_{2}$に対する広義の事後最適反応です。

例（広義の事後最適反応）

1つの商品をめぐって$2$人が入札を行うオークションを分析します。プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。それぞれの入札者$i\in I$の商品への評価額$\theta _{i}$は私的情報であり、入札者$i$のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ 0,100\right] \end{equation*}です。それぞれの入札者$i$の行動$a_{i}$は入札額であり、任意の非負の実数を入札できるものとします。入札者$i$の行動集合は、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}です。入札者たちが提示する入札額の組が$a_{I}=\left( a_{1},a_{2}\right) $であるとき、\begin{equation*}a_{i}>a_{j}
\end{equation*}を満たす入札者$i$が商品を落札し、相手の入札額$a_{j}$に等しい金額を支払うものとします。他の任意の入札者$j\ \left( \not=i\right) $は商品を落札できず、支払いも行いません。また、\begin{equation*}a_{i}=a_{j}
\end{equation*}の場合には両者とも商品を落札できず、支払いも行いません。状態$\theta _{I}=\left( \theta _{1},\theta _{2}\right) $における入札者$1$の利得関数$u_{1}\left( \cdot ,\theta _{I}\right):A_{I}\rightarrow \mathbb{R} $がそれぞれの$a_{I}\in A_{I}$に対して定める値は、\begin{equation*}u_{1}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{1}-a_{2} & \left( if\ a_{1}>a_{2}\right) \\
0 & \left( if\ a_{1}\leq a_{2}\right)
\end{array}\right.
\end{equation*}です。以上のベイジアンゲーム$G$における入札者$2$の純粋戦略$s_{2}$の中でも、\begin{equation*}\forall \theta _{2}\in \Theta _{2}:s_{2}\left( \theta _{2}\right) =\theta
_{2}
\end{equation*}に注目します。入札者$1$は$s_{2}$に対する広義の最適反応を持つでしょうか。状態$\theta _{I}\in\Theta _{I}$を任意に選んだ上で、状態ゲーム$G\left( \theta_{I}\right) $を分析します。この状態ゲームにおいて入札者$2$は先の$s_{2}$のもとで$s_{2}\left( \theta _{2}\right) =\theta _{2}$を入札するため、入札者$1$の利得関数は、\begin{equation*}u_{1}\left( a_{1},\theta _{2},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{1}-\theta _{2} & \left( if\ a_{1}>\theta _{2}\right) \\
0 & \left( if\ a_{1}\leq \theta _{2}\right)
\end{array}\right.
\end{equation*}となります。まずは$\theta _{2}>\theta _{1}$を想定した場合、$a_{1}>\theta _{2}$を満たす入札額$a_{1}$を選択すると商品を落札して負の利得$\theta _{1}-\theta _{2}<0$を得る一方で、$a_{1}\leq \theta _{2}$を満たす入札額$a_{1}$を選択すると商品を落札せず利得$0$を得ます。$\theta_{2}>\theta _{1}$であるため、この場合には$a_{1}=\theta _{1}$は$\theta_{2}$に対する広義の最適反応の1つです。続いて$\theta _{2}<\theta _{1}$を想定した場合、$a_{1}>\theta _{2}$を満たす入札額$a_{1}$を選択すると商品を落札して正の利得$\theta _{1}-\theta _{2}>0$を得る一方で、$a_{1}\leq \theta _{2}$を満たす入札額$a_{1}$を選択すると商品を落札せず利得$0$を得ます。$\theta_{2}<\theta _{1}$であるため、この場合には$a_{1}=\theta _{1}$は$\theta_{2}$に対する広義の最適反応の1つです。最後に、$\theta _{2}=\theta _{1}$を想定した場合、$a_{1}>\theta _{2}$を満たす入札額$a_{1}$を選択すると商品を落札して利得$\theta _{1}-\theta _{2}=0$を得る一方で、$a_{1}\leq \theta _{2}$を満たす入札額$a_{1}$を選択すると商品を落札せず利得$0$を得ます。$\theta_{2}=\theta _{1}$であるため、この場合には$a_{1}=\theta _{1}$は$\theta_{2}$に対する広義の最適反応の1つです。任意の状態ゲーム$G\left( \theta _{I}\right) $において$a_{1}=\theta _{1}$は$s_{2}\left(\theta _{2}\right) =\theta _{2}$に対する広義の最適反応であることが明らかになったため、以下の条件\begin{equation*}\forall \theta _{1}\in \Theta _{1}:s_{1}\left( \theta _{1}\right) =\theta
_{1}
\end{equation*}を満たす純粋戦略$s_{1}$はもとのベイジアンゲーム$G$において$s_{2}$に対する広義の事後最適反応であることが明らかになりました。

広義の事後最適反応は一意的に定まるとは限りません。以下の例より明らかです。

例（広義の事後最適反応が複数存在する場合）

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム$G$におけるプレイヤー$2$の純粋戦略$s_{2}$の中でも、\begin{equation*}s_{2}\left( \theta _{21}\right) =b
\end{equation*}に注目します。プレイヤー$1$は$s_{2}$に対する広義の最適反応を持つでしょうか。状態ゲーム$G\left( \theta _{11},\theta _{21}\right) $においてプレイヤー$2$は先の$s_{2}$のもとで$s_{2}\left( \theta_{21}\right) =b$を選びますが、これに対するプレイヤー$1$の広義の最適反応は$a$と$b$です。もう一方の状態ゲーム$G\left(\theta _{12},\theta _{21}\right) $においてプレイヤー$2$は先の$s_{2}$のもとで$s_{2}\left( \theta _{21}\right) =b$を選びますが、これに対するプレイヤー$1$の広義の最適反応は$a$と$b$です。したがって、以下の4つの純粋戦略\begin{eqnarray*}s_{11} &=&\left( s_{11}\left( \theta _{11}\right) ,s_{11}\left( \theta
_{12}\right) \right) =\left( a,a\right) \\
s_{12} &=&\left( s_{12}\left( \theta _{11}\right) ,s_{12}\left( \theta
_{12}\right) \right) =\left( a,b\right) \\
s_{13} &=&\left( s_{13}\left( \theta _{11}\right) ,s_{13}\left( \theta
_{12}\right) \right) =\left( b,a\right) \\
s_{14} &=&\left( s_{14}\left( \theta _{11}\right) ,s_{14}\left( \theta
_{12}\right) \right) =\left( b,b\right)
\end{eqnarray*}はいずれももとのベイジアンゲーム$G$において$s_{2}$に対する広義の事後最適反応です。

先の命題はベイジアンゲームに広義の事後最適反応が存在しないことを示す上でも有用です。つまり、ベイジアンゲーム$G$と他のプレイヤーたちの純粋戦略$s_{-i}$が与えられたとき、何らかの状態ゲーム$G\left( \theta_{I}\right) $においてプレイヤー$i$が他のプレイヤーたちの行動$s_{-i}\left( \theta _{-i}\right) $に対する広義の最適反応を持たない場合、先の命題より、プレイヤー$i$はもとのベイジアンゲーム$G$において$s_{-i}$に対する広義の事後最適反応を持ちません。

例（広義の事後最適反応が存在しない場合）

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム$G$におけるプレイヤー$1$の純粋戦略$s_{1}$の中でも、\begin{equation*}s_{1}\left( \theta _{11}\right) =s_{1}\left( \theta _{12}\right) =a
\end{equation*}に注目します。プレイヤー$2$は$s_{1}$に対する広義の最適反応を持つでしょうか。状態ゲーム$G\left( \theta _{11},\theta _{21}\right) $においてプレイヤー$1$は先の$s_{1}$のもとで$s_{1}\left( \theta_{11}\right) =a$を選びますが、これに対するプレイヤー$2$の広義の最適反応は$a$です。もう一方の状態ゲーム$G\left( \theta _{12},\theta_{21}\right) $においてプレイヤー$1$は先の$s_{1}$のもとで$s_{1}\left( \theta _{12}\right) =a$を選びますが、これに対するプレイヤー$2$の広義の最適反応は$b$です。ただ、プレイヤー$2$は相手のタイプを事前に観察できず、したがって2つの状態ゲームを事前に区別できないため、$G\left( \theta _{11},\theta _{21}\right) $において$a$をプレーし$G\left( \theta _{12},\theta _{21}\right) $において$b$をプレーするようなプレイヤー$2$の純粋戦略は存在しません。したがって、先の命題より、プレイヤー$2$はもとのベイジアンゲーム$G$において$s_{1}$に対する広義の事後最適反応を持たないことが明らかになりました。

繰り返しになりますが、ベイジアンゲーム$G$においてプレイヤー$i\in I$の純粋戦略$s_{i}^{\ast }\in S_{i}$が他のプレイヤーたちの純粋戦略$s_{-i}\in S_{-i}$に対する広義の事後最適反応であることとは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i}:u_{i}\left(
s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right)
,\theta _{I}\right)
\end{equation*}が成り立つことを意味します。これは、プレイヤー$i$にとって、自分のタイプ$\theta _{i}$や他のプレイヤーたちのタイプ$\theta _{-i}$がどのようなものであるかに関わらず、また、自分がどのような信念$f_{i}$を持っているかに関わらず、他のプレイヤーたちが$s_{-i}$にしたがって行動することを前提とする限りにおいて、自分は$s_{i}$にしたがって行動を選択すれば自身の利得を常に最大化できることを意味します。

さて、プレイヤーたちの純粋戦略の組$s_{I}^{\ast}\in S_{I}$において、任意のプレイヤー$i$の純粋戦略$s_{i}^{\ast }$が他のプレイヤーたちの純粋戦略$s_{-i}^{\ast }$に対する広義の事後最適反応になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}が成り立つならば、$s_{I}^{\ast }$を$G$の広義の事後均衡（weakly ex-post equilibrium）と呼びます。

例（私的価値モデルの場合）

プレイヤー$i$の利得関数$u_{i}$に関して私的価値の仮定が成り立つ場合には、$u_{i}$の形状は他のプレイヤーたちのタイプの組$\theta _{-i}$に依存せず、自身のタイプ$\theta _{i}$にのみ依存するため、純粋戦略の組$s_{I}^{\ast }$が事後均衡であることは、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in
A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast
}\left( \theta _{-i}\right) ,\theta _{i}\right) \geq u_{i}\left(
a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i}\right)
\end{equation*}が成り立つことを意味します。

ベイジアンゲーム$G$に広義の事後均衡$s_{I}^{\ast }$が存在するものとします。プレイヤー$i$と状態$\theta _{I}$を任意に選んだ上で、他のすべてのプレイヤーが均衡戦略$s_{-i}^{\ast }$にしたがって行動することを前提とした場合、プレイヤー$i$だけが均衡戦略$s_{i}^{\ast }$から逸脱して他の純粋戦略$s_{i}$を選ぶと、広義の事後均衡の定義より、\begin{equation*}u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left(
\theta _{-i}\right) ,\theta _{I}\right) \geq u_{i}\left( s_{i}\left( \theta
_{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{I}\right)
\end{equation*}という関係が成り立つため、プレイヤー$i$はそのような逸脱から得できる可能性はありません。同様の議論は任意のプレイヤーと任意の状態について成り立ちます。つまり、プレイヤーたちが広義の事後均衡$s_{i}^{\ast }$をプレーしているとき、それぞれのプレイヤー$i$は、他のプレイヤーたちが均衡戦略$s_{-i}^{\ast }$にしたがう限りにおいて、自分は均衡戦略$s_{i}^{\ast}$から逸脱しても得できません。広義の事後均衡ではプレイヤーたちの戦略がお互いに最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。ただし、プレイヤーたちが広義の事後均衡$s_{I}^{\ast }$を実際にプレーすることを保証するためには、それぞれのプレイヤー$i$が、他のプレイヤーたちが均衡戦略$s_{-i}^{\ast }$にしたがうことを正しく予想する必要があります。これはどのような理屈によって正当化できるのでしょうか。この点については場を改めて議論します。

ベイジアンゲーム$G$に広義の事後均衡$s_{I}^{\ast }$が存在する場合には、任意のプレイヤー$i$は、自分のタイプ$\theta _{i}$や他のプレイヤーたちのタイプ$\theta _{-i}$がどのようなものであるかに関わらず、また、自分がどのような信念$f_{i}$を持っているかに関わらず、他のプレイヤーたちが均衡戦略$s_{-i}^{\ast }$にしたがう限りにおいて、自分もまた均衡戦略$s_{i}^{\ast}$にしたがって行動を選択すれば自身の利得を常に最大化できます。つまり、広義の事後均衡$s_{I}^{\ast }$が存在する場合には、プレイヤーたちはタイプや信念を読み合う必要がなく、お互いに均衡戦略にしたがうという確信さえあれば、理論が予測する均衡$s_{I}^{\ast }$が高い精度で実現します。

ベイジアンゲームの事後均衡と状態ゲームのナッシュ均衡の関係

ベイジアンゲームにおける広義の事後最適反応と状態ゲームにおける広義の最適反応に関する先の命題を踏まえると、ベイジアンゲームにおける広義の事後均衡と状態ゲームにおける広義のナッシュ均衡の間に以下の関係が成り立つことが示されます。

命題（ベイジアンゲームの事後均衡と状態ゲームのナッシュ均衡の関係）

ベイジアンゲーム$G$において、プレイヤーたちの純粋戦略の組$s_{I}^{\ast }\in S_{I}$が広義の事後均衡であることと、任意の状態$\theta _{I}\in \Theta _{I}$において$s_{I}^{\ast }\left( \theta _{I}\right) \in A_{I}$が状態ゲーム$G\left( \theta _{I}\right) $における広義の純粋戦略ナッシュ均衡であることは必要十分である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

以上の命題は、ベイジアンゲームにおける広義の事後均衡を特定する作業を、完備情報ゲームである状態ゲームにおける広義の純粋戦略ナッシュ均衡を特定する作業へ帰着させられることを保証しています。つまり、ベイジアンゲーム$G$が与えられたとき、それぞれの状態ゲーム$G\left( \theta_{I}\right) $における広義の純粋戦略ナッシュ均衡$a_{I}$を特定した上で、それぞれの状態$\theta _{I}\in\Theta _{I}$に対して$s_{I}\left( \theta _{I}\right)=a_{I}$を満たす純粋戦略の組$s_{I}$を構成すれば、それはもとのベイジアンゲーム$G$における広義の事後均衡であることが保証されるということです。

例（広義の事後均衡）

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },1^{\ast } & 2,0 \\ \hline
b & 0,1^{\ast } & 3^{\ast },1^{\ast } \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 3^{\ast },1^{\ast } \\ \hline
b & 0,0 & 2,1^{\ast } \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム$G$に広義の事後均衡は存在するでしょうか。それぞれの状態ゲームにおいてプレイヤーが広義の最適反応を選んだ場合に得られる利得に記号$\ast $をつけています。利得行列から明らかであるように、状態ゲーム$G\left( \theta_{11},\theta _{21}\right) $には以下の広義の純粋戦略ナッシュ均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,a\right) ,\left( b,b\right)
\end{equation*}が存在し、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $には以下の広義の純粋戦略ナッシュ均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,b\right)
\end{equation*}が存在します。したがって、以下の純粋戦略\begin{eqnarray*}
s_{1} &=&\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( b,a\right) \\
s_{2} &=&\left( s_{2}\left( \theta _{21}\right) \right) =b
\end{eqnarray*}からなる組$\left( s_{1},s_{2}\right) $はもとのベイジアンゲーム$G$における広義の事後均衡です。したがって、状態$\left( \theta _{11},\theta_{21}\right) $における均衡結果は、\begin{equation*}\left( s_{1}\left( \theta _{11}\right) ,s_{2}\left( \theta _{21}\right)
\right) =\left( b,b\right)
\end{equation*}であり、状態$\left( \theta _{12},\theta_{21}\right) $における均衡結果は、\begin{equation*}\left( s_{1}\left( \theta _{12}\right) ,s_{2}\left( \theta _{21}\right)
\right) =\left( a,b\right)
\end{equation*}です。

例（広義の事後均衡）

広義の事後均衡は一意的に定まるとは限りません。以下の例より明らかです。

例（広義の事後均衡が複数存在する場合）

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },1^{\ast } & 2^{\ast },0 \\ \hline
b & 0,1^{\ast } & 2^{\ast },1^{\ast } \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 2^{\ast },1^{\ast } \\ \hline
b & 0,0 & 2^{\ast },1^{\ast } \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム$G$に広義の事後均衡は存在するでしょうか。それぞれの状態ゲームにおいてプレイヤーが広義の最適反応を選んだ場合に得られる利得に記号$\ast $をつけています。利得行列から明らかであるように、状態ゲーム$G\left( \theta_{11},\theta _{21}\right) $には以下の広義の純粋戦略ナッシュ均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,a\right) ,\left( b,b\right)
\end{equation*}が存在し、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $には以下の広義の純粋戦略ナッシュ均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,b\right) ,\left( b,b\right)
\end{equation*}が存在します。したがって、以下の純粋戦略\begin{eqnarray*}
s_{1} &=&\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( b,a\right) \\
s_{2} &=&\left( s_{2}\left( \theta _{21}\right) \right) =b
\end{eqnarray*}からなる組$\left( s_{1},s_{2}\right) $と、以下の純粋戦略\begin{eqnarray*}s_{1}^{\prime } &=&\left( s_{1}^{\prime }\left( \theta _{11}\right)
,s_{1}^{\prime }\left( \theta _{12}\right) \right) =\left( b,b\right) \\
s_{2} &=&\left( s_{2}\left( \theta _{21}\right) \right) =b
\end{eqnarray*}からなる組$\left( s_{1}^{\prime },s_{2}\right) $はともにもとのベイジアンゲーム$G$における広義の事後均衡です。

先の命題は、ベイジアンゲームにおいて広義の事後均衡が存在しないことを示す上でも有用です。与えられたベイジアンゲーム$G$の何らかの状態ゲーム$G\left( \theta _{I}\right) $に広義の純粋戦略ナッシュ均衡が存在しない場合、先の命題より、もとのベイジアンゲーム$G$に広義の事後均衡は存在しません。

例（広義の事後均衡が存在しない場合）

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & -1,1 & 1,-1 \\ \hline
b & 1,-1 & -1,1 \\ \hline
\end{array}$$

として与えられているものとします。もう一方の状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $は任意です。状態ゲーム$G\left( \theta_{11},\theta _{21}\right) $には広義の純粋戦略ナッシュ均衡は存在しないため、もとのベイジアンゲーム$G$に広義の事後均衡は存在しません。

ベイジアンゲーム$G$の任意の状態ゲーム$G\left(\theta _{I}\right) $に広義の純粋戦略ナッシュ均衡がそれぞれ存在する場合でも、ベイジアンゲーム$G$においてそれらを実現できるような純粋戦略が存在しない場合、もとのベイジアンゲーム$G$に広義の事後均衡は存在しません。

例（広義の事後均衡が存在しない場合）

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 2,1^{\ast } \\ \hline
b & 0,1 & 3^{\ast },1^{\ast } \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3^{\ast },1^{\ast } & 2^{\ast },0 \\ \hline
b & 2,1^{\ast } & 0,0 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム$G$に広義の事後均衡は存在するでしょうか。それぞれの状態ゲームにおいてプレイヤーが広義の最適反応を選んだ場合に得られる利得に記号$\ast $をつけています。利得行列から明らかであるように、状態ゲーム$G\left( \theta_{11},\theta _{21}\right) $には以下の広義の純粋戦略ナッシュ均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( b,b\right)
\end{equation*}が存在し、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $には以下の広義の純粋戦略ナッシュ均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,a\right)
\end{equation*}が存在します。ただい、プレイヤー$2$はプレイヤー$2$は相手のタイプを事前に観察できず、したがって2つの状態ゲームを事前に区別できないため、$G\left( \theta _{11},\theta _{21}\right) $において$b$をプレーし$G\left( \theta_{12},\theta _{21}\right) $において$a$をプレーするようなプレイヤー$2$の純粋戦略は存在しません。したがって、もとのベイジアンゲーム$G$に広義の事後均衡は存在しません。

演習問題

問題（広義の事後均衡）

ベイジアンゲーム$G$のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21},\theta _{22}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{11},\theta
_{22}\right) ,\left( \theta _{12},\theta _{21}\right) ,\left( \theta
_{12},\theta _{22}\right) \right\}
\end{equation*}です。状態ゲーム$G\left(\theta _{11},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{11},\theta _{22}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3,1 & 2,0 \\ \hline
b & 5,1 & 4,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{22}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3,0 & 2,1 \\ \hline
b & 5,0 & 4,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。このベイジアンゲーム$G$には広義の事後均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

問題（広義の事後均衡）

ベイジアンゲーム$G$のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21},\theta _{22}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{11},\theta
_{22}\right) ,\left( \theta _{12},\theta _{21}\right) ,\left( \theta
_{12},\theta _{22}\right) \right\}
\end{equation*}です。状態ゲーム$G\left(\theta _{11},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 0,0 \\ \hline
b & 3,0 & 1,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{11},\theta _{22}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 3,0 & 1,2 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{21}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 1,2 & 3,0 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム$G\left( \theta _{12},\theta _{22}\right) $が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 1,1 & 3,0 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。このベイジアンゲーム$G$には広義の事後均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

問題（広義の事後均衡支配戦略）

1つの商品をめぐって$3$人が入札を行うオークションを分析します。プレイヤー集合は、\begin{equation*}I=\left\{ 1,2,3\right\}
\end{equation*}です。それぞれの入札者$i\in I$の商品への評価額$\theta _{i}$は私的情報であり、入札者$i$のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ 0,100\right] \end{equation*}です。それぞれの入札者$i$の行動$a_{i}$は入札額であり、任意の非負の実数を入札できるものとします。入札者$i$の行動集合は、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}です。入札者たちが提示する入札額の組が$a_{I}=\left( a_{1},a_{2},a_{3}\right) $であるとき、\begin{equation*}a_{i}>\max \left\{ a_{j},a_{k}\right\}
\end{equation*}を満たす入札者$i$が商品を落札し、$\max \left\{a_{j},a_{k}\right\} $に等しい金額を支払うものとします。他の入札者$j,k$は商品を落札できず、支払いも行いません。また、複数の入札者が最高額を入札する場合には誰も商品を落札できず、支払いも行いません。状態$\theta_{I}=\left( \theta _{1},\theta _{2},\theta _{3}\right) $における入札者$i$の利得関数$u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R} $がそれぞれの$a_{I}\in A_{I}$に対して定める値は、\begin{equation*}u_{i}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{i}-\max \left\{ a_{j},a_{k}\right\} & \left( if\ a_{i}>\max
\left\{ a_{j},a_{k}\right\} \right) \\
0 & \left( if\ a_{i}<\max \left\{ a_{j},a_{k}\right\} \right)
\end{array}\right.
\end{equation*}です。以上のベイジアンゲーム$G$において、以下の条件\begin{eqnarray*}\forall \theta _{1} &\in &\Theta _{1}:s_{1}\left( \theta _{1}\right) =\theta
_{1} \\
\forall \theta _{2} &\in &\Theta _{2}:s_{2}\left( \theta _{2}\right) =\theta
_{2} \\
\forall \theta _{3} &\in &\Theta _{3}:s_{3}\left( \theta _{3}\right) =\theta
_{3}
\end{eqnarray*}を満たす純粋戦略の組$\left( s_{1},s_{2},s_{3}\right) $は広義の事後均衡均衡であることを示してください。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

WIIS

数学のコース

経済学のコース

アカウント

WIIS

不完備情報の静学ゲーム

ベイジアンゲームにおける広義の事後均衡

目次

関連知識

ベイジアンゲームにおける広義の事後最適反応

ベイジアンゲームの事後最適反応と状態ゲームの最適反応の関係