教材一覧
教材一覧
教材検索
STATIC GAME OF INCOMPLETE INFORMATION

事後均衡と支配戦略均衡の関係

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

支配戦略と事後最適反応の関係

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。プレイヤー\(i\)の純粋戦略\(s_{i}\)が支配戦略であるものとします。これは、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{i}\left( \theta _{i}\right) \)がプレイヤー\(i\)の支配戦略であることを意味します。\(s_{i}\left( \theta _{i}\right) \)が\(G\left( \theta_{I}\right) \)においてプレイヤー\(i\)の支配戦略であるとき、\(s_{i}\left( \theta _{i}\right) \)は\(G\left(\theta _{I}\right) \)における他のプレイヤーたちの任意の純粋戦略の組に対する最適反応になりますが、これはもとのベイジアンゲーム\(G\)において\(s_{i}\)が他のプレイヤーたちの任意の純粋戦略の組に対する事後最適反応であることを意味します。したがって、ベイジアンゲーム\(G\)においてプレイヤー\(i\)の純粋戦略\(s_{i}\)が支配戦略であるとき、\(s_{i}\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\)に対する事後最適反応であることが保証されます。厳密な証明は演習問題にします。

命題(支配戦略と事後最適反応の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が支配戦略であるならば、\(s_{i}\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\in S_{-i}\)に対する事後最適反応である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(支配戦略と事後最適反応の関係)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)であり、行動集合が\(A_{1}=A_{2}=\left\{ a,b\right\} \)であり、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)と\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。このゲームには2通りの状態\(\left( \theta _{11},\theta_{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },1^{\ast } & 2^{\ast },0 \\ \hline
b & 0,1^{\ast } & 2^{\ast },1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 2^{\ast },1^{\ast } \\ \hline
b & 0,0 & 2^{\ast },1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)においても支配戦略\(a\)を持ちます。したがって、以下の純粋戦略\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}はもとのベイジアンゲーム\(G\)におけるプレイヤー\(1\)の支配戦略です。上の命題より、\(s_{1}\)はプレイヤー\(2\)の任意の純粋戦略に対する事後最適反応であるはずです。以下でそのことを確認します。プレイヤー\(2\)は2つの純粋戦略を持ちますが、まずは、\begin{equation*}s_{21}\left( \theta _{21}\right) =a
\end{equation*}を満たす\(s_{21}\)について考えます。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において\(s_{1}\left( \theta _{11}\right) =a\)は\(s_{21}\left( \theta_{21}\right) =a\)に対する最適反応であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において\(s_{1}\left( \theta _{12}\right) =a\)は\(s_{21}\left( \theta_{21}\right) =a\)に対する最適反応です。したがって、\(s_{1}\)は\(s_{21}\)に対する事後最適反応であることが明らかになりました。続いて、\begin{equation*}s_{22}\left( \theta _{21}\right) =b
\end{equation*}を満たす\(s_{22}\)について考えます。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において\(s_{1}\left( \theta _{11}\right) =a\)は\(s_{22}\left( \theta_{21}\right) =b\)に対する最適反応であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において\(s_{1}\left( \theta _{12}\right) =a\)は\(s_{22}\left( \theta_{21}\right) =b\)に対する最適反応です。したがって、\(s_{1}\)は\(s_{22}\)に対する事後最適反応であることが明らかになりました。プレイヤー\(2\)の純粋戦略は以上の\(s_{21}\)と\(s_{22}\)の2通りであるため、\(s_{1}\)はプレイヤー\(2\)の任意の純粋戦略に対する事後最適反応であることが示されました。この結果は先の命題の主張と整合的です。

 

支配戦略均衡は事後均衡

ベイジアンゲーム\(G\)においてプレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\)が支配戦略均衡であるものとします。つまり、任意のプレイヤー\(i\)について\(s_{i}^{\ast }\)が支配戦略であるということです。すると、先の命題より\(s_{i}^{\ast }\)は他のプレイヤーたちの任意の純粋戦略の組\(s_{-i}\)に対する事後最適反応であるため、\(s_{i}^{\ast }\)は\(s_{-i}^{\ast }\)に対する事後最適反応でもあります。つまり\(s_{I}^{\ast}\)は事後均衡であることが保証されます。

命題(支配戦略均衡は事後均衡)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が支配戦略均衡であるならば、\(s_{I}^{\ast }\)は事後均衡である。

上の命題の逆は成立するとは限りません。つまり、ベイジアンゲームにおける事後均衡は支配戦略均衡であるとは限りません。以下の例より明らかです。

例(事後均衡は支配戦略均衡であるとは限らない)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)と\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。このゲームには2通りの状態\(\left( \theta _{11},\theta_{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },1^{\ast } & 2,0 \\ \hline
b & 0,1^{\ast } & 3^{\ast },1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2^{\ast },0 & 3^{\ast },1^{\ast } \\ \hline
b & 0,0 & 2,1^{\ast } \\ \hline
\end{array}$$

\(G\left( \theta _{12},\theta _{21}\right) \)

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)に事後均衡\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)は存在するでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,a\right) \)と\(\left( b,b\right) \)であり、状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)におけるナッシュ均衡は\(\left( a,b\right) \)です。したがって、\begin{eqnarray*}s_{1}^{\ast } &=&\left( s_{1}^{\ast }\left( \theta _{11}\right) ,s_{1}^{\ast
}\left( \theta _{12}\right) \right) =\left( b,a\right) \\
s_{2}^{\ast } &=&\left( s_{2}\left( \theta _{21}\right) \right) =\left(
b\right)
\end{eqnarray*}を満たす\(\left( s_{1}^{\ast },s_{2}^{\ast }\right) \)がもとのベイジアンゲーム\(G\)の唯一の事後均衡です。一方、状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)には支配戦略均衡は存在しないため、ベイジアンゲーム\(G\)にも支配戦略均衡は存在しません。

 

事後均衡が支配戦略均衡であるための条件

ベイジアンゲームにおいて支配戦略均衡は事後均衡でもある一方、その逆は成立するとは限らないことが明らかになりました。ただ、すべてのプレイヤーの利得関数が私的価値の仮定を満たすとともに、事後均衡を構成する最適戦略が以下の条件を満たす場合、事後均衡が支配戦略均衡になることが保証されます。

命題(事後均衡が支配戦略均衡であるための条件)
ベイジアンゲーム\(G\)において、任意のプレイヤー\(i\in I\)の利得関数が私的価値の仮定を満たすものとする。純粋戦略の組\(s_{I}^{\ast }\)が事後均衡であるとともに、\begin{equation*}\forall i\in I,\ \forall a_{i}\in A_{i},\ \exists \theta _{i}\in \Theta
_{i}:s_{i}^{\ast }\left( \theta _{i}\right) =a_{i}
\end{equation*}が成り立つ場合には、\(s_{I}^{\ast }\)は支配戦略均衡でもある。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題中の条件\begin{equation}
\forall i\in I,\ \forall a_{i}\in A_{i},\ \exists \theta _{i}\in \Theta
_{i}:s_{i}^{\ast }\left( \theta _{i}\right) =a_{i} \quad \cdots (1)
\end{equation}は何を意味しているのでしょうか。\(s_{i}^{\ast }\)は事後均衡におけるプレイヤー\(i\)の均衡戦略ですが、上の条件は、その均衡戦略\(s_{i}^{\ast}\)のもとで、プレイヤー\(i\)は自身が選択し得るすべての行動をプレーし得ることを意味します。なぜ、以上の条件のもとでは事後均衡が支配戦略均衡になるのでしょうか。

私的価値の仮定のもとでは、純粋戦略の組\(s_{I}^{\ast }\)が事後均衡である場合、任意のプレイヤー\(i\)について、\begin{equation*}\forall \theta _{i}\in \theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{i}\in A_{i},:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i}\right) \geq
u_{i}\left( a_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta
_{i}\right)
\end{equation*}が成り立ちます。つまり、他のプレイヤーたちが「均衡戦略\(s_{-i}^{\ast }\)にしたがう場合には」自身も均衡戦略\(s_{i}^{\ast }\)にしたがえば利得を常に最大化できるということです。一方、\(s_{I}^{\ast }\)が支配戦略均衡であるためには、すなわち\(s_{i}^{\ast }\)がプレイヤー\(i\)の支配戦略であるためには、他のプレイヤーたちが「どのような行動を選ぶ場合においても」自身は\(s_{i}^{\ast }\)にしたがえば利得を常に最大化できることを保証する必要があります。通常、他のプレイヤーたちが「均衡戦略\(s_{-i}^{\ast }\)にしたがう」場合、それは彼らが「任意の行動を選び得る」ことを必ずしも含意しません。ただ、条件\(\left( 1\right) \)が成り立つ場合には話は別です。なぜなら、彼らが選び得る行動\(a_{-i}\in A_{-i}\)を任意に選んだとき、\(\left( 1\right) \)より、\begin{equation*}s_{-i}^{\ast }\left( \theta _{-i}\right) =a_{-i}
\end{equation*}を満たすタイプの組\(\theta _{-i}\in \Theta _{-i}\)が存在することが保証されるため、彼らは均衡戦略\(s_{-i}^{\ast }\)のもとで\(a_{-i}\)をプレーし得ることが保証されるからです。

例(表明原理)
私的価値の仮定はともかく、上の命題中の、\begin{equation}
\forall i\in I,\ \forall a_{i}\in A_{i},\ \exists \theta _{i}\in \Theta
_{i}:s_{i}^{\ast }\left( \theta _{i}\right) =a_{i} \quad \cdots (1)
\end{equation}はどれほど強い要求なのでしょうか。メカニズムデザインと呼ばれる学問領域では表明原理と呼ばれる命題を根拠に、プレイヤーの行動集合が自身のタイプ集合と一致するようなゲームに分析対象を限定します。つまり、\begin{equation*}
\forall i\in I:A_{i}=\Theta _{i}
\end{equation*}を満たすベイジアンゲーム\(G\)を分析対象にするということです。この場合のプレイヤー\(i\)の純粋戦略は\(s_{i}:\Theta _{i}\rightarrow \Theta _{i}\)と定義されますが、特に、\begin{equation*}\forall \theta _{i}\in \Theta _{i}:s_{i}^{\ast }\left( \theta _{i}\right)
=\theta _{i}
\end{equation*}を満たす純粋戦略\(s_{i}^{\ast}\)(これを正直戦略と呼ぶ)からなる組\(s_{I}^{\ast}=\left( s_{i}^{\ast }\right) _{i\in I}\)に注目する場合、\(\left( 1\right) \)は、\begin{equation*}\forall i\in I,\ \forall \theta _{i}\in \Theta _{i},\ \exists \theta _{i}\in
\Theta _{i}:s_{i}^{\ast }\left( \theta _{i}\right) =\theta _{i}
\end{equation*}となり、これは明らかに成り立ちます。つまり、メカニズムデザインでは表明原理を根拠に任意のプレイヤーの行動集合がタイプ集合と一致するようなベイジアンゲームを分析対象としますが、私的価値の仮定のもとでは、正直戦略の組が事後均衡である場合には、それが支配戦略均衡でもあることが保証されるということです。メカニズムデザインについては場を改めて解説します。

次回はベイジアンナッシュ均衡について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

囚人のジレンマ
囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

囚人のジレンマ
n人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

囚人のジレンマ
非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

囚人のジレンマ
囚人のジレンマの例:軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

ベイジアンゲーム
ベイジアンゲームにおける支配戦略均衡

ベイジアンゲームにおいてプレイヤーがある純粋戦略を選ぶとき、自身を含めた全員のタイプや他のプレイヤーたちの行動、信念に関わらず利得を常に最大化できるならば、そのような戦略を支配純粋戦略と呼びます。支配純粋戦略の組を支配純粋戦略均衡と呼びます。

支配戦略均衡
狭義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも狭義の支配戦略である場合、そのような戦略の組を狭義の支配戦略均衡と呼びます。

支配戦略均衡
広義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも広義の支配戦略である場合、そのような戦略の組を広義の支配戦略均衡と呼びます。

ベイジアンゲーム
ベイジアンゲームにおける事後均衡

ベイジアンゲームにおいて他のプレイヤーたちの純粋戦略に直面したプレイヤーがある純粋戦略を選ぶ場合、自身のタイプや他のプレイヤーたちのタイプによらず利得を最大化できる場合、そのような純粋戦略を事後最適反応と呼びます。事後最適反応の組を事後均衡と呼びます。

ベイジアンゲーム
ベイジアンナッシュ均衡と事後均衡の関係

ベイジアンゲームにおいて、事後均衡はベイジアンナッシュ均衡でもある一方で、その逆は成り立つとは限りません。また、支配戦略均衡はベイジアンナッシュ均衡でもある一方で、その逆は成り立つとは限りません。