WIIS

不完備情報の静学ゲーム

事後均衡と支配戦略均衡の関係

目次

関連知識

Mailで保存
Xで共有

支配戦略と事後最適反応の関係

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。プレイヤー\(i\)の純粋戦略\(s_{i}\)が支配戦略であるものとします。これは、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)がプレイヤー\(i\)の支配戦略であることを意味します。\(s_{i}\left( \theta _{i}\right) \)が\(G\left( \theta_{I}\right) \)においてプレイヤー\(i\)の支配戦略であるとき、\(s_{i}\left( \theta _{i}\right) \)は\(G\left(\theta _{I}\right) \)における他のプレイヤーたちの任意の純粋戦略の組に対する最適反応になりますが、これはもとのベイジアンゲーム\(G\)において\(s_{i}\)が他のプレイヤーたちの任意の純粋戦略の組に対する事後最適反応であることを意味します。したがって、ベイジアンゲーム\(G\)においてプレイヤー\(i\)の純粋戦略\(s_{i}\)が支配戦略であるとき、\(s_{i}\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\)に対する事後最適反応であることが保証されます。厳密な証明は演習問題にします。

命題(支配戦略と事後最適反応の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が支配戦略であるならば、\(s_{i}\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\in S_{-i}\)に対する事後最適反応である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(支配戦略と事後最適反応の関係)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)であり、行動集合が\(A_{1}=A_{2}=\left\{ a,b\right\} \)であり、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)と\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。このゲームには2通りの状態\(\left( \theta _{11},\theta_{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },1^{\ast } & 2^{\ast },0 \\ \hline
b & 0,1^{\ast } & 2^{\ast },1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 2^{\ast },1^{\ast } \\ \hline
b & 0,0 & 2^{\ast },1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)においても支配戦略\(a\)を持ちます。したがって、以下の純粋戦略\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}はもとのベイジアンゲーム\(G\)におけるプレイヤー\(1\)の支配戦略です。上の命題より、\(s_{1}\)はプレイヤー\(2\)の任意の純粋戦略に対する事後最適反応であるはずです。以下でそのことを確認します。プレイヤー\(2\)は2つの純粋戦略を持ちますが、まずは、\begin{equation*}s_{21}\left( \theta _{21}\right) =a
\end{equation*}を満たす\(s_{21}\)について考えます。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において\(s_{1}\left( \theta _{11}\right) =a\)は\(s_{21}\left( \theta_{21}\right) =a\)に対する最適反応であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において\(s_{1}\left( \theta _{12}\right) =a\)は\(s_{21}\left( \theta_{21}\right) =a\)に対する最適反応です。したがって、\(s_{1}\)は\(s_{21}\)に対する事後最適反応であることが明らかになりました。続いて、\begin{equation*}s_{22}\left( \theta _{21}\right) =b
\end{equation*}を満たす\(s_{22}\)について考えます。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において\(s_{1}\left( \theta _{11}\right) =a\)は\(s_{22}\left( \theta_{21}\right) =b\)に対する最適反応であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において\(s_{1}\left( \theta _{12}\right) =a\)は\(s_{22}\left( \theta_{21}\right) =b\)に対する最適反応です。したがって、\(s_{1}\)は\(s_{22}\)に対する事後最適反応であることが明らかになりました。プレイヤー\(2\)の純粋戦略は以上の\(s_{21}\)と\(s_{22}\)の2通りであるため、\(s_{1}\)はプレイヤー\(2\)の任意の純粋戦略に対する事後最適反応であることが示されました。この結果は先の命題の主張と整合的です。

 

支配戦略均衡は事後均衡

ベイジアンゲーム\(G\)においてプレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\)が支配戦略均衡であるものとします。つまり、任意のプレイヤー\(i\)について\(s_{i}^{\ast }\)が支配戦略であるということです。すると、先の命題より\(s_{i}^{\ast }\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\)に対する事後最適反応であるため、\(s_{i}^{\ast }\)は\(s_{-i}^{\ast }\)に対する事後最適反応でもあります。つまり\(s_{I}^{\ast}\)は事後均衡であることが保証されます。

命題(支配戦略均衡は事後均衡)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が支配戦略均衡であるならば、\(s_{I}^{\ast }\)は事後均衡である。

上の命題の逆は成立するとは限りません。つまり、ベイジアンゲームにおける事後均衡は支配戦略均衡であるとは限りません。以下の例より明らかです。

例(事後均衡は支配戦略均衡であるとは限らない)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)と\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。このゲームには2通りの状態\(\left( \theta _{11},\theta_{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },1^{\ast } & 2,0 \\ \hline
b & 0,1^{\ast } & 3^{\ast },1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 3^{\ast },1^{\ast } \\ \hline
b & 0,0 & 2,1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)に事後均衡\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)は存在するでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,a\right) \)と\(\left( b,b\right) \)であり、状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,b\right) \)です。したがって、\begin{eqnarray*}s_{1}^{\ast } &=&\left( s_{1}^{\ast }\left( \theta _{11}\right) ,s_{1}^{\ast
}\left( \theta _{12}\right) \right) =\left( b,a\right) \\
s_{2}^{\ast } &=&\left( s_{2}\left( \theta _{21}\right) \right) =\left(
b\right)
\end{eqnarray*}を満たす\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)がもとのベイジアンゲーム\(G\)の唯一の事後均衡です。一方、状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)には支配戦略均衡は存在しないため、ベイジアンゲーム\(G\)にも支配戦略均衡は存在しません。

 

事後均衡が支配戦略均衡であるための条件

ベイジアンゲームにおいて支配戦略均衡は事後均衡でもある一方、その逆は成立するとは限らないことが明らかになりました。ただ、すべてのプレイヤーの利得関数が私的価値の仮定を満たすとともに、事後均衡を構成する最適戦略が以下の条件を満たす場合、事後均衡が支配戦略均衡になることが保証されます。

命題(事後均衡が支配戦略均衡であるための条件)
ベイジアンゲーム\(G\)において、任意のプレイヤー\(i\in I\)の利得関数が私的価値の仮定を満たすものとする。純粋戦略の組\(s_{I}^{\ast }\)が事後均衡であるとともに、\begin{equation*}\forall i\in I,\ \forall a_{i}\in A_{i},\ \exists \theta _{i}\in \Theta
_{i}:s_{i}^{\ast }\left( \theta _{i}\right) =a_{i}
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)は支配戦略均衡でもある。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題中の条件\begin{equation}
\forall i\in I,\ \forall a_{i}\in A_{i},\ \exists \theta _{i}\in \Theta
_{i}:s_{i}^{\ast }\left( \theta _{i}\right) =a_{i} \quad \cdots (1)
\end{equation}は何を意味しているのでしょうか。\(s_{i}^{\ast }\)は事後均衡におけるプレイヤー\(i\)の均衡戦略ですが、上の条件は、その均衡戦略\(s_{i}^{\ast}\)のもとで、プレイヤー\(i\)は自身が選択し得るすべての行動をプレーし得ることを意味します。なぜ、以上の条件のもとでは事後均衡が支配戦略均衡になるのでしょうか。

私的価値の仮定のもとでは、純粋戦略の組\(s_{I}^{\ast }\)が事後均衡である場合、任意のプレイヤー\(i\)について、\begin{equation*}\forall \theta _{i}\in \theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{i}\in A_{i},:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i}\right) \geq
u_{i}\left( a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta
_{i}\right)
\end{equation*}が成り立ちます。つまり、他のプレイヤーたちが「均衡戦略\(s_{-i}^{\ast }\)にしたがう場合には」自身も均衡戦略\(s_{i}^{\ast }\)にしたがえば利得を常に最大化できるということです。一方、\(s_{I}^{\ast }\)が支配戦略均衡であるためには、すなわち\(s_{i}^{\ast }\)がプレイヤー\(i\)の支配戦略であるためには、他のプレイヤーたちが「どのような行動を選ぶ場合においても」自身は\(s_{i}^{\ast }\)にしたがえば利得を常に最大化できることを保証する必要があります。通常、他のプレイヤーたちが「均衡戦略\(s_{-i}^{\ast }\)にしたがう」場合、それは彼らが「任意の行動を選び得る」ことを必ずしも含意しません。ただ、条件\(\left( 1\right) \)が成り立つ場合には話は別です。なぜなら、彼らが選び得る行動\(a_{-i}\in A_{-i}\)を任意に選んだとき、\(\left( 1\right) \)より、\begin{equation*}s_{-i}^{\ast }\left( \theta _{-i}\right) =a_{-i}
\end{equation*}を満たすタイプの組\(\theta _{-i}\in \Theta _{-i}\)が存在することが保証されるため、彼らは均衡戦略\(s_{-i}^{\ast }\)のもとで\(a_{-i}\)をプレーし得ることが保証されるからです。

例(表明原理)
私的価値の仮定はともかく、上の命題中の、\begin{equation}
\forall i\in I,\ \forall a_{i}\in A_{i},\ \exists \theta _{i}\in \Theta
_{i}:s_{i}^{\ast }\left( \theta _{i}\right) =a_{i} \quad \cdots (1)
\end{equation}はどれほど強い要求なのでしょうか。メカニズムデザインと呼ばれる学問領域では表明原理と呼ばれる命題を根拠に、プレイヤーの行動集合が自身のタイプ集合と一致するようなゲームに分析対象を限定します。つまり、\begin{equation*}
\forall i\in I:A_{i}=\Theta _{i}
\end{equation*}を満たすベイジアンゲーム\(G\)を分析対象にするということです。この場合のプレイヤー\(i\)の純粋戦略は\(s_{i}:\Theta _{i}\rightarrow \Theta _{i}\)と定義されますが、特に、\begin{equation*}\forall \theta _{i}\in \Theta _{i}:s_{i}^{\ast }\left( \theta _{i}\right)
=\theta _{i}
\end{equation*}を満たす純粋戦略\(s_{i}^{\ast}\)(これを正直戦略と呼ぶ)からなる組\(s_{I}^{\ast}=\left( s_{i}^{\ast }\right) _{i\in I}\)に注目する場合、\(\left( 1\right) \)は、\begin{equation*}\forall i\in I,\ \forall \theta _{i}\in \Theta _{i},\ \exists \theta _{i}\in
\Theta _{i}:s_{i}^{\ast }\left( \theta _{i}\right) =\theta _{i}
\end{equation*}となり、これは明らかに成り立ちます。つまり、メカニズムデザインでは表明原理を根拠に任意のプレイヤーの行動集合がタイプ集合と一致するようなベイジアンゲームを分析対象としますが、私的価値の仮定のもとでは、正直戦略の組が事後均衡である場合には、それが支配戦略均衡でもあることが保証されるということです。メカニズムデザインについては場を改めて解説します。

次回はベイジアンナッシュ均衡について解説します。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録

不完備情報の静学ゲーム