教材一覧
STATIC GAME OF INCOMPLETE INFORMATION

事後均衡と支配戦略均衡の関係

< 前のページ
次のページ >
Share on twitter
Twitterで共有
Share on email
メールで共有

支配戦略と事後最適反応の関係

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G=\left( I,\left\{ A_{i}\right\} _{i\in I},\left\{\Theta _{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I}\right) \)として表現されているものとします。プレイヤー\(i\)の純粋戦略\(s_{i}\)が支配戦略であるものとします。これは、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)がプレイヤー\(i\)の支配戦略であることを意味します。\(s_{i}\left( \theta _{i}\right) \)が\(G\left( \theta _{I}\right) \)においてプレイヤー\(i\)の支配戦略であるとき、\(s_{i}\left( \theta _{i}\right) \)は\(G\left( \theta _{I}\right) \)における他のプレイヤーたちの任意の純粋戦略の組に対する最適反応になりますが、これはもとのベイジアンゲーム\(G\)において\(s_{i}\)が他のプレイヤーたちの任意の純粋戦略の組に対する事後最適反応であることを意味します。したがって、ベイジアンゲーム\(G\)においてプレイヤー\(i\)の純粋戦略\(s_{i}\)が支配純粋戦略であるとき、\(s_{i}\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\)に対する純粋戦略事後最適反応であることが保証されます。厳密な証明は演習問題にします。

命題(支配戦略と事後最適反応の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が支配純粋戦略であるならば、\(s_{i}\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\in S_{-i}\)に対する純粋戦略事後最適反応である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(支配戦略と事後最適反応の関係)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)においても支配戦略\(a\)を持ちます。したがって、\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}を満たす純粋戦略\(s_{1}\)はもとのベイジアンゲーム\(G\)においてプレイヤー\(1\)の支配戦略です。上の命題より、\(s_{1}\)はプレイヤー\(2\)の任意の純粋戦略に対する事後最適反応であるはずです。以下でそのことを確認します。プレイヤー\(2\)は2つの純粋戦略を持ちますが、まずは\(s_{2}\left( \theta_{21}\right) =a\)を満たす\(s_{2}\)について考えます。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において\(s_{1}\left( \theta _{11}\right) =a\)は\(s_{2}\left( \theta _{21}\right) =a\)に対する最適反応であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において\(s_{1}\left( \theta _{12}\right) =a\)は\(s_{2}\left( \theta _{21}\right) =a\)に対する最適反応です。続いて\(s_{2}\left( \theta _{21}\right) =b\)を満たす\(s_{2}\)について考えます。状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において\(s_{1}\left( \theta_{11}\right) =a\)は\(s_{2}\left( \theta _{21}\right) =b\)に対する最適反応であり、状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)において\(s_{1}\left( \theta_{12}\right) =a\)は\(s_{2}\left( \theta _{21}\right) =b\)に対する最適反応です。したがって、\(s_{1}\)はプレイヤー\(2\)の任意の純粋戦略に対する事後最適反応であることが示されました。

 

支配戦略均衡は事後均衡

ベイジアンゲーム\(G\)においてプレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\)が支配戦略均衡であるものとします。つまり、任意のプレイヤー\(i\)について\(s_{i}^{\ast }\)が支配戦略であるということです。すると、先の命題より\(s_{i}^{\ast }\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\)に対する事後最適反応であるため、\(s_{i}^{\ast }\)は\(s_{-i}^{\ast }\)に対する事後最適反応でもあります。つまり\(s_{I}^{\ast}\)は事後均衡であることが保証されます。

命題(支配戦略均衡は事後均衡)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が支配純粋戦略均衡であるならば、\(s_{I}^{\ast }\)は純粋戦略事後均衡である。

上の命題の逆は成立するとは限りません。つまり、ベイジアンゲームにおける事後均衡は支配戦略均衡であるとは限りません。以下の例から明らかです。

例(事後均衡は支配戦略均衡であるとは限らない)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 3,1 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 3,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)に事後均衡\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)は存在するでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,a\right) \)と\(\left( b,b\right) \)であり、状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,b\right) \)です。したがって、\begin{eqnarray*}s_{1}^{\ast } &=&\left( s_{1}^{\ast }\left( \theta _{11}\right) ,s_{1}^{\ast
}\left( \theta _{12}\right) \right) =\left( b,a\right) \\
s_{2}^{\ast } &=&\left( s_{2}\left( \theta _{21}\right) \right) =\left(
b\right)
\end{eqnarray*}を満たす\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)がもとのベイジアンゲーム\(G\)の唯一の事後均衡です。一方、状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)には支配戦略均衡は存在しないため、ベイジアンゲーム\(G\)にも支配戦略均衡は存在しません。

 

事後均衡が支配戦略均衡であるための条件

ベイジアンゲームにおいて支配戦略均衡は事後均衡でもある一方、その逆は成立するとは限らないことが明らかになりました。ただ、すべてのプレイヤーの利得関数が私的価値の仮定を満たすとともに、それぞれのプレイヤーは自身のそれぞれの純粋戦略のもとで自身の行動集合に含まれる任意の行動が選択可能である場合には、事後均衡は支配戦略均衡であることが保証されます。つまり、以上の仮定のもとで事後均衡と支配戦略均衡は実質的に等しい均衡概念となります。

命題(事後均衡が支配戦略均衡であるための条件)
ベイジアンゲーム\(G\)において、任意のプレイヤー\(i\in I\)の利得関数が私的価値の仮定を満たすとともに、\begin{equation*}\forall i\in I,\ \forall s_{i}\in S_{i},\ \forall a_{i}\in A_{i},\ \exists
\theta _{i}\in \Theta _{i}:s_{i}\left( \theta _{i}\right) =a_{i}
\end{equation*}が成り立つものとする。この場合、純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が純粋戦略事後均衡であることは、\(s_{I}^{\ast }\)が支配純粋戦略均衡であるための必要十分条件である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(表明原理)
私的価値の仮定はともかく、上の命題中の、\begin{equation}
\forall i\in I,\ \forall s_{i}\in S_{i},\ \forall a_{i}\in A_{i},\ \exists
\theta _{i}\in \Theta _{i}:s_{i}\left( \theta _{i}\right) =a_{i} \quad \cdots (1)
\end{equation}という仮定はどれほど強い要求なのでしょうか。メカニズムデザインと呼ばれる学問領域においては、表明原理と呼ばれる命題を根拠に、プレイヤーの行動集合が自身のタイプ集合と一致するようなゲームに分析対象を限定します。つまり、\begin{equation*}
\forall i\in I:A_{i}=\Theta _{i}
\end{equation*}を満たすベイジアンゲーム\(G\)を分析対象とするということです。この場合のプレイヤー\(i\)の純粋戦略は\(s_{i}:\Theta _{i}\rightarrow \Theta _{i}\)と定義されますが、特に、\begin{equation*}\forall \theta _{i}\in \Theta _{i}:s_{i}^{\ast }\left( \theta _{i}\right)
=\theta _{i}
\end{equation*}を満たす純粋戦略\(s_{i}^{\ast}\)(これを正直戦略と呼ぶ)からなる組\(s_{I}^{\ast}=\left( s_{i}^{\ast }\right) _{i\in I}\)に注目する場合、\(\left( 1\right) \)は、\begin{equation*}\forall i\in I,\ \forall \theta _{i}\in \Theta _{i},\ \forall \theta _{i}\in
\Theta _{i},\ \exists \theta _{i}\in \Theta _{i}:s_{i}^{\ast }\left( \theta
_{i}\right) =\theta _{i}
\end{equation*}すなわち、\begin{equation*}
\forall i\in I,\ \forall \theta _{i}\in \Theta _{i},\ \exists \theta _{i}\in
\Theta _{i}:s_{i}^{\ast }\left( \theta _{i}\right) =\theta _{i}
\end{equation*}となり、これは明らかに成り立ちます。つまり、メカニズムデザインでは表明原理を根拠に任意のプレイヤーの行動集合がタイプ集合と一致するようなベイジアンゲームを分析対象としますが、私的価値の仮定のもとでは、正直戦略の組に関して、それが事後均衡であることと支配戦略均衡であることは必要十分になることが保証されるということです。メカニズムデザインについては場を改めて解説します。

次回はベイジアンナッシュ均衡について解説します。

質問・コメント(プレミアム会員限定) 次へ進む
< 前のページ
次のページ >
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録