教材一覧
教材一覧
教材検索
STATIC GAME OF INCOMPLETE INFORMATION

ベイジアンゲームにおける支配戦略均衡

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

支配戦略

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。任意のプレイヤーの行動集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちが選び得る行動の組からなる集合\(A_{-i}\)を把握していますが、ゲームの静学性より、他のプレイヤーたちが実際に選ぶ行動\(a_{-i}\in A_{-i}\)を事前に観察することはできません。また、任意のプレイヤーのタイプ集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちのタイプの組からなる集合\(\Theta _{-i}\)を把握していますが、ゲームの不完備性より、他のプレイヤーたちの真のタイプ\(\theta_{-i}^{\ast }\in \Theta _{-i}\)を事前に観察することはできません。このような状況において、プレイヤー\(i\)は何らかの純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選択しますが、これは自身のそれぞれのタイプ値\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を包括的に指定する行動計画に相当します。プレイヤー\(i\)は自身の真のタイプ\(\theta _{i}^{\ast }\)を知っていますが、純粋戦略\(s_{i}\)のもとでは、真のタイプ\(\theta _{i}^{\ast }\)のもとでの行動\(s_{i}\left( \theta _{i}^{\ast }\right) \)を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ\(\theta _{i}\)に対しても、その場合に自分が選ぶであろう行動\(s_{i}\left(\theta _{i}\right) \)をそれぞれ指定する必要があります。

以上を踏まえた上で、プレイヤー\(i\in I\)のある純粋戦略\(s_{i}\in S_{i}\)に注目します。つまり、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)である場合には行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を選ぶということです。加えて、他のプレイヤーたちのタイプの組が\(\theta _{-i}\in \Theta _{-i}\)であり、他のプレイヤーたちが選ぶ行動の組が\(a_{-i}\in A_{-i}\)であるものと仮定します。以上のタイプの組から構成される状態\(\theta _{I}=\left( \theta_{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) \)であるため、以上の想定のもとでプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta _{I}\right)
\end{equation*}であり、プレイヤー\(i\)はこの利得を事前に把握しています。他の任意の\(\theta _{i},\theta _{-i},a_{-i}\)についても同様です。ただ、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)、さらには他のプレイヤーたちが選ぶ行動の組\(a_{-i}\)に関わらず、問題としている純粋戦略\(s_{i}\)のもとで上の利得が最大化されることが保証される場合には、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{-i}\in A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}\left(
\theta _{i}\right) ,a_{-i},\theta _{i},\theta _{-i}\right) \geq u_{i}\left(
a_{i},a_{-i},\theta _{i},\theta _{-i}\right)
\end{equation*}すなわち、\begin{equation*}
\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つ場合には、\(s_{i}\)をプレイヤー\(i\)の支配戦略(dominant strategy)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、プレイヤー\(i\)にとって純粋戦略\(s_{i}\)が支配戦略であることは、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{i}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{i}\right)
\end{equation*}が成り立つことを意味します。

支配戦略のもとで最大化されるものは中間期待利得ではなく利得であることから、これはプレイヤーの信念に依存しない概念です。プレイヤー\(i\)が支配戦略\(s_{i}\)を持つ場合には、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらには他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、自分は\(s_{i}\)にしたがって行動を選択すれば自身の利得を常に最大化できることが保証されています。したがって、プレイヤー\(i\)が支配戦略を持つ場合、プレイヤー\(i\)は他のプレイヤーのタイプや行動を読んだり予想する必要さえありません。

 

ベイジアンゲームにおける支配戦略と状態ゲームにおける支配戦略の関係

ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が支配戦略であるものとします。つまり、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つということです。ここで、状態\(\theta _{I}\in \Theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta _{I}\right) \)を考えると、\begin{equation*}\forall a_{-i}\in A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}\left(
\theta _{i}\right) ,a_{-i},\theta _{I}\right) \geq u_{i}\left(
a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立ちますが、これは\(s_{i}\left( \theta _{i}\right) \)が\(G\left(\theta _{I}\right) \)における支配戦略であることを意味します。任意の状態\(\theta _{I}\)において同様の議論が成立するため、結局、ベイジアンゲームにおいて\(s_{i}\)が支配戦略であることと、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{i}\left(\theta _{i}\right) \)が支配戦略であることは必要十分です。つまり、不完備情報ゲームにおける支配戦略は完備情報ゲームにおける支配戦略の一般化であるということです。

命題(ベイジアンゲームにおける支配戦略と状態ゲームにおける支配戦略の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が支配戦略であることは、任意の状態\(\theta _{I}\in\Theta _{I}\)において\(s_{i}\left( \theta _{i}\right)\in A_{i}\)が状態ゲーム\(G\left( \theta_{I}\right) \)における支配戦略であるための必要十分条件である。

以上の命題より、ベイジアンゲーム\(G\)が与えられたとき、それぞれの状態ゲーム\(G\left(\theta _{I}\right) \)におけるプレイヤー\(i\)の支配戦略に相当する行動\(a_{i}\)を特定した上で、それぞれの\(\theta _{I}\in \Theta _{I}\)に対して\(s_{i}\left( \theta _{I}\right) =a_{i}\)を定める純粋戦略\(s_{i}\)を構成すれば、それが\(G\)における支配戦略になることが保証されます。以下が具体例です。

例(支配戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。プレイヤー\(1\)は支配戦略を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)においてプレイヤー\(1\)は支配戦略\(a\)を持ちます。もう一方の状態ゲーム\(G\left(\theta _{12},\theta _{21}\right) \)においてもプレイヤー\(1\)は支配戦略\(a\)を持ちます。したがって、\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}を満たす純粋戦略\(s_{1}\)はもとのベイジアンゲーム\(G\)においてプレイヤー\(1\)の支配戦略です。

先の命題はベイジアンゲームに支配戦略が存在しないことを示す上でも有用です。与えられたベイジアンゲーム\(G\)の何らかの状態ゲーム\(G\left( \theta _{I}\right) \)においてプレイヤー\(i\)が支配戦略を持たない場合、先の命題より、プレイヤー\(i\)は\(G\)において支配戦略を持ちません。以下が具体例です。

例(支配戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 1,0 \\ \hline
b & 0,1 & 1,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。プレイヤー\(1\)は支配戦略を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)においてプレイヤー\(1\)は支配戦略を持たないため、先の命題より、もとのベイジアンゲーム\(G\)においてもプレイヤー\(1\)は支配戦略を持ちません。

ベイジアンゲーム\(G\)の異なる2つの状態ゲーム\(G\left( \theta _{I}\right) ,G\left( \theta _{I}^{\prime }\right) \)においてプレイヤー\(i\)がそれぞれ支配戦略を持つ場合でも、\(G\)においてそれらを選択できるような純粋戦略が存在しない場合、先の命題より、プレイヤー\(i\)は\(G\)において支配戦略を持ちません。以下が具体例です。

例(支配戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。プレイヤー\(2\)は支配戦略を持つでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)においてプレイヤー\(2\)は支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)においてプレイヤー\(2\)は支配戦略\(b\)を持ちます。ただ、プレイヤー\(2\)はプレイヤー\(1\)のタイプを観察できず、したがって2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta _{21}\right) \)において\(a\)をプレーし\(G\left( \theta_{12},\theta _{21}\right) \)において\(b\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、先の命題より、プレイヤー\(2\)はもとのゲーム\(G\)において支配戦略を持たないことが明らかになりました。

 

支配戦略均衡

繰り返しになりますが、ベイジアンゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)支配戦略であることとは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つことを意味します。さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が支配戦略になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in
A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta
_{I}\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の支配戦略均衡(dominant pure strategy equilibrium)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、純粋戦略の組\(s_{I}^{\ast }\)がベイジアンゲーム\(G\)の支配戦略均衡であることは、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in
A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,a_{-i},\theta _{i}\right) \geq u_{i}\left( a_{i},a_{-i},\theta
_{i}\right)
\end{equation*}が成り立つことを意味します。

ベイジアンゲーム\(G\)に支配戦略均衡\(s_{I}^{\ast }\)が存在する場合には、任意のプレイヤー\(i\)について、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらに、他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、プレイヤー\(i\)は均衡戦略\(s_{i}^{\ast }\)にしたがって行動を選択すれば自身の利得を常に最大化できます。つまり、支配戦略均衡\(s_{I}^{\ast }\)が存在する場合には、プレイヤーたちはタイプや信念、さらには行動を読み合う必要がないため、理論が予測する均衡\(s_{I}^{\ast }\)が高い精度で実現します。

 

ベイジアンゲームにおける支配戦略均衡と状態ゲームにおける支配戦略均衡の関係

ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が支配戦略均衡であるものとします。つまり、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in
A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta
_{I}\right)
\end{equation*}が成り立つということです。ここで、状態\(\theta _{I}\in \Theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta _{I}\right) \)を考えると、\begin{equation*}\forall i\in I,\ \forall a_{-i}\in A_{-i},\ \forall a_{i}\in
A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right) ,a_{-i},\theta
_{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立ちますが、これは\(s_{I}^{\ast }\left( \theta _{I}\right) =\left(s_{i}^{\ast }\left( \theta _{i}\right) \right) _{i\in I}\)が\(G\left(\theta _{I}\right) \)における支配純粋均衡であることを意味します。任意の状態\(\theta _{I}\)において同様の議論が成立するため、結局、ベイジアンゲームにおいて\(s_{I}^{\ast}\)が支配戦略均衡であることと、任意の状態ゲーム\(G\left( \theta _{I}\right) \)において\(s_{I}^{\ast }\left( \theta _{I}\right) \)が支配戦略均衡であることは必要十分です。つまり、不完備情報ゲームにおける支配戦略均衡は完備情報ゲームにおける支配戦略均衡の一般化であるということです。

命題(ベイジアンゲームにおける支配戦略均衡と状態ゲームにおける支配戦略均衡の関係)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が支配純粋均衡であることは、任意の状態\(\theta _{I}\in \Theta _{I}\)において、\(s_{I}^{\ast }\left( \theta _{I}\right) \in A_{I}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における支配純粋均衡であるための必要十分条件である。
例(支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このゲーム\(G\)に支配戦略均衡は存在するでしょうか。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において支配戦略\(a\)を持ち、状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)において支配純粋戦略\(a\)を持ちます。したがって、\begin{equation*}s_{1}=\left( s_{1}\left( \theta _{11}\right) ,s_{1}\left( \theta
_{12}\right) \right) =\left( a,a\right)
\end{equation*}を満たす純粋戦略\(s_{1}\)はもとのベイジアンゲーム\(G\)においてプレイヤー\(1\)の支配戦略です。プレイヤー\(2\)は状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において支配戦略\(b\)を持ち、状態ゲーム\(G\left(\theta _{12},\theta _{21}\right) \)において支配戦略\(b\)を持ちます。したがって、\begin{equation*}s_{2}=\left( s_{2}\left( \theta _{21}\right) \right) =\left( b\right)
\end{equation*}を満たす純粋戦略\(s_{2}\)はもとのベイジアンゲーム\(G\)においてプレイヤー\(2\)の支配戦略です。したがって、以上の純粋戦略の組\(\left(s_{1},s_{2}\right) \)は\(G\)の支配戦略均衡です。

先の命題は、ベイジアンゲームにおいて支配戦略均衡が存在しないことを示す上でも有用です。与えられたベイジアンゲーム\(G\)の何らかの状態ゲーム\(G\left( \theta _{I}\right) \)に支配戦略均衡が存在しない場合、もとのベイジアンゲーム\(G\)に支配戦略均衡は存在しません。以下が具体例です。

例(支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 1,0 \\ \hline
b & 0,1 & 1,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)においてプレイヤー\(1\)は支配戦略を持たないため、この状態ゲームに支配戦略均衡は存在しません。したがって、先の命題より、もとのベイジアンゲーム\(G\)に支配戦略均衡は存在しません。

ベイジアンゲーム\(G\)の任意の状態ゲーム\(G\left(\theta _{I}\right) \)に支配戦略均衡がそれぞれ存在する場合でも、ベイジアンゲーム\(G\)においてそれらを実現できるような純粋戦略が存在しない場合、ベイジアンゲーム\(G\)に支配戦略均衡は存在しません。以下が具体例です。

例(支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{12},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)には支配戦略均衡\(\left( a,a\right) \)が存在し、状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)には支配戦略均衡\(\left( a,b\right) \)が存在します。ただ、プレイヤー\(2\)はプレイヤー\(1\)のタイプを観察できず、2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta _{21}\right) \)において\(a\)をプレーし、\(G\left( \theta_{12},\theta _{21}\right) \)において\(b\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、もとのゲーム\(G\)に支配戦略均衡は存在しません。

 

演習問題

問題(支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21},\theta _{22}\right\} \)であるものとします。この場合、4通りの状態が存在します。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 3,1 & 2,0 \\ \hline
b & 5,1 & 4,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 3,0 & 2,1 \\ \hline
b & 5,0 & 4,1 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には支配戦略均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta_{21},\theta _{22}\right\} \)であるものとします。この場合、4通りの状態が存在します。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 0,0 \\ \hline
b & 3,0 & 1,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 3,0 & 1,2 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 1,2 & 3,0 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

表:状態ゲーム

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)は以下の利得行列$$\begin{array}{ccc}\hline
1\diagdown 2 & a & b \\ \hline
a & 1,1 & 3,0 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}$$

表:状態ゲーム

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には支配戦略均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は事後均衡と呼ばれる均衡概念について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

囚人のジレンマ
囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

ベイジアンゲーム
ベイジアンゲームの定義

不完備情報の静学ゲームを記述するためにはプレイヤー、行動、情報、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここではベイジアンゲームと呼ばれるモデルについて解説します。

囚人のジレンマ
n人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

ベイジアンゲーム
ベイジアンゲームの私的価値モデル

不完備情報の静学ゲームをベイジアンゲームとして表現するとき、すべてのプレイヤーの利得関数が自身のタイプのみに依存し、他のプレイヤーのタイプに依存しないものと仮定する場合には、そのようなモデルを私的価値モデルと呼びます。

囚人のジレンマ
非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

ベイジアンゲーム
メカニズムのもとでのゲーム

単一財オークション市場においてメカニズムを提示された入札者たちが直面する戦略的状況はベイジアンゲームとして定式化されます。そのようなゲームにおいて、それぞれの入札者は自身のタイプと信念にもとづいて他の入札者たちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

囚人のジレンマ
囚人のジレンマの例:軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

ベイジアンゲーム
ベイジアンゲームにおける純粋戦略

不完備情報の静学ゲームをベイジアンゲームとして表現したとき、プレイヤーによる意思決定は純粋戦略と呼ばれる概念として定式化されます。プレイヤーの純粋戦略とは、自身のそれぞれのタイプに対して行動を1つずつ定める行動計画です。

ベイジアンゲーム
ベイジアンゲームにおける信念

ベイジアンゲームにおいて不確実な状況下で意思決定を迫られるプレイヤーは、自身のそれぞれのタイプに対して、その場合に自分が直面し得る状態ゲームがそれぞれどの程度の確率で起こりえるか主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。

ベイジアンゲーム
中間期待利得とベイジアン仮説

不完備情報の静学ゲームを表現するベイジアンゲームに直面したそれぞれのプレイヤーは、自身のタイプと信念にもとづいて他のプレイヤーたちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

支配戦略
狭義の支配戦略

プレイヤーの純粋戦略が狭義の支配戦略であることの意味を解説します。

支配戦略
広義の支配戦略

プレイヤーの純粋戦略が広義の支配戦略であることの意味を解説します。

支配戦略均衡
狭義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも狭義の支配戦略である場合、そのような戦略の組を狭義の支配戦略均衡と呼びます。

支配戦略均衡
広義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも広義の支配戦略である場合、そのような戦略の組を広義の支配戦略均衡と呼びます。