WIIS

不完備情報の静学ゲーム

ベイジアンゲームにおける広義の支配戦略均衡

目次

関連知識

Mailで保存
Xで共有

ベイジアンゲームにおける広義の支配戦略

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。任意のプレイヤーの行動集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちが選び得る行動の組からなる集合\(A_{-i}\)を把握していますが、ゲームの静学性より、他のプレイヤーたちが実際に選ぶ行動\(a_{-i}\in A_{-i}\)を事前に観察することはできません。また、任意のプレイヤーのタイプ集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちのタイプの組からなる集合\(\Theta _{-i}\)を把握していますが、ゲームの不完備性より、他のプレイヤーたちの真のタイプ\(\theta_{-i}^{\ast }\in \Theta _{-i}\)を事前に観察することはできません。このような状況において、プレイヤー\(i\)は何らかの純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選択しますが、これは自身のそれぞれのタイプ\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を1つずつ指定する行動計画に相当します。プレイヤー\(i\)は自身の真のタイプ\(\theta _{i}^{\ast }\)を知っていますが、純粋戦略\(s_{i}\)のもとでは、真のタイプ\(\theta _{i}^{\ast }\)のもとでの行動\(s_{i}\left( \theta _{i}^{\ast }\right) \)を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ\(\theta _{i}\)に対しても、その場合に自分が選ぶであろう行動\(s_{i}\left( \theta_{i}\right) \)をそれぞれ指定する必要があります。

以上を踏まえた上で、プレイヤー\(i\in I\)のある純粋戦略\(s_{i}\in S_{i}\)に注目します。つまり、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)である場合には行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を選ぶということです。加えて、他のプレイヤーたちのタイプが\(\theta _{-i}\in \Theta _{-i}\)であり、他のプレイヤーたちが選ぶ行動が\(a_{-i}\in A_{-i}\)であるものと仮定します。以上のタイプから構成される状態\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) \)であるため、以上の想定のもとでプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta _{I}\right)
=u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta _{i},\theta
_{-i}\right)
\end{equation*}であり、プレイヤー\(i\)はこの利得を事前に把握しています。他の任意の\(\theta _{i},\theta _{-i},a_{-i}\)についても同様です。ただ、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであったとしても、さらには他のプレイヤーたちが選ぶ行動の組\(a_{-i}\)がどのようなものであったとしても、問題としている純粋戦略\(s_{i}\)のもとで上の利得が常に最大化されることが保証される場合には、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{-i}\in A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}\left(
\theta _{i}\right) ,a_{-i},\theta _{i},\theta _{-i}\right) \geq u_{i}\left(
a_{i},a_{-i},\theta _{i},\theta _{-i}\right)
\end{equation*}すなわち、\begin{equation*}
\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つ場合には、\(s_{i}\)をプレイヤー\(i\)の広義の支配戦略(weakly dominant strategy)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、プレイヤー\(i\)にとって純粋戦略\(s_{i}\)が広義の支配戦略であることは、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{i}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{i}\right)
\end{equation*}が成り立つことを意味します。

広義の支配戦略のもとで最大化されるものは中間期待利得ではなく利得であることから、これはプレイヤーの信念に依存しない概念です。プレイヤー\(i\)が広義の支配戦略\(s_{i}\)を持つ場合には、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらには他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、自分は\(s_{i}\)にしたがって行動を選択すれば自身の利得を常に最大化できることが保証されます。したがって、プレイヤー\(i\)が広義の支配戦略を持つ場合、プレイヤー\(i\)は他のプレイヤーのタイプや行動を読んだり、予想する必要さえもありません。

 

ベイジアンゲームの支配戦略と状態ゲームの支配戦略の関係

ベイジアンゲーム\(G\)において、プレイヤー\(i\)の純粋戦略\(s_{i}\)が広義の支配戦略であるものとします。状態\(\theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta_{I}\right) \)について考えます。ベイジアンゲーム\(G\)においてプレイヤー\(i\)が\(s_{i}\)を採用する場合、状態ゲーム\(G\left( \theta _{I}\right) \)において行動\(s_{i}\left( \theta_{i}\right) \)を選択することになります。状態ゲーム\(G\left( \theta _{I}\right) \)は完備情報ゲームであるため、行動は純粋戦略と同一視されますが、先の行動\(s_{i}\left( \theta _{i}\right) \)は状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略になることが保証されます。つまり、ベイジアンゲームにおける広義の支配戦略がそれぞれの状態ゲームにおいて命じる行動は、その状態ゲームにおける広義の支配戦略になることが保証されるということです。

命題(ベイジアンゲームの支配戦略は状態ゲームの支配戦略を導く)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が広義の支配戦略であるならば、任意の状態\(\theta _{I}\in \Theta _{I}\)において\(s_{i}\left( \theta _{i}\right) \in A_{i}\)は状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

逆の議論も成立します。つまり、ベイジアンゲーム\(G\)においてプレイヤー\(i\)が純粋戦略\(s_{i}\)を採用する場合、それぞれの状態ゲーム\(G\left( \theta _{I}\right) \)において行動\(s_{i}\left( \theta _{i}\right) \)を選択することになりますが、この行動\(s_{i}\left( \theta_{i}\right) \)が状態ゲーム\(G\left( \theta_{I}\right) \)における広義の支配戦略になることが保証される場合、先の純粋戦略\(s_{i}\)はもとのベイジアンゲーム\(G\)における広義の支配戦略です。

命題(状態ゲームの支配戦略を導く純粋戦略はベイジアンゲームの支配戦略)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が与えられているものとする。任意の状態\(\theta _{I}\in \Theta _{I}\)において\(s_{i}\left(\theta _{i}\right) \in A_{i}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略であるならば、\(s_{i}\)はベイジアンゲーム\(G\)における広義の支配戦略である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の2つの命題を踏まえると、ベイジアンゲームにおける広義の支配戦略を以下のように特徴づけることができます。

命題(ベイジアンゲームの支配戦略と状態ゲームの支配戦略の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が与えられているものとする。任意の状態\(\theta _{I}\in \Theta _{I}\)において\(s_{i}\left(\theta _{i}\right) \in A_{i}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略であることと、\(s_{i}\)がベイジアンゲーム\(G\)における広義の支配戦略であることは必要十分である。

以上の命題は、ベイジアンゲームにおける広義の支配戦略を特定する作業を、完備情報ゲームである状態ゲームにおける広義の支配戦略を特定する作業へ帰着させられることを保証しています。つまり、ベイジアンゲーム\(G\)が与えられたとき、それぞれの状態ゲーム\(G\left( \theta _{I}\right) \)におけるプレイヤー\(i\)の広義の支配戦略に相当する行動\(a_{i}\)を特定した上で、それぞれの状態\(\theta_{I}\in \Theta _{I}\)に対して\(s_{i}\left( \theta_{i}\right) =a_{i}\)を満たす純粋戦略\(s_{i}\)を構成すれば、それはもとのベイジアンゲーム\(G\)における広義の支配戦略であることが保証されるということです。

例(広義の支配戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)においてプレイヤー\(1\)は広義の支配戦略を持つでしょうか。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において広義の支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において広義の支配戦略\(a\)を持つため、\begin{eqnarray*}s_{1}\left( \theta _{11}\right) &=&a \\
s_{2}\left( \theta _{12}\right) &=&a
\end{eqnarray*}を満たす純粋戦略\(s_{1}:\Theta _{1}\rightarrow A_{1}\)はもとのベイジアンゲーム\(G\)における広義の支配戦略です。

例(広義の支配戦略)
1つの商品をめぐって\(2\)人が入札を行うオークションを分析します。プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。それぞれの入札者\(i\in I\)の商品への評価額\(\theta _{i}\)は私的情報であり、入札者\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ 0,100\right] \end{equation*}です。それぞれの入札者\(i\)の行動\(a_{i}\)は入札額であり、任意の非負の実数を入札できるものとします。入札者\(i\)の行動集合は、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}です。入札者たちが提示する入札額の組が\(a_{I}=\left( a_{1},a_{2}\right) \)であるとき、\begin{equation*}a_{i}>a_{j}
\end{equation*}を満たす入札者\(i\)が商品を落札し、相手の入札額\(a_{j}\)に等しい金額を支払うものとします。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも行いません。また、\begin{equation*}a_{i}=a_{j}
\end{equation*}の場合には両者とも商品を落札できず、支払いも行いません。状態\(\theta _{I}=\left( \theta _{1},\theta _{2}\right) \)における入札者\(1\)の利得関数\(u_{1}\left( \cdot ,\theta _{I}\right):A_{I}\rightarrow \mathbb{R} \)がそれぞれの\(a_{I}\in A_{I}\)に対して定める値は、\begin{equation*}u_{1}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{1}-a_{2} & \left( if\ a_{1}>a_{2}\right) \\
0 & \left( if\ a_{1}\leq a_{2}\right)
\end{array}\right.
\end{equation*}です。以上のベイジアンゲーム\(G\)において入札者\(1\)は広義の支配戦略を持つでしょうか。状態\(\theta _{I}\)を任意に選んだ上で、状態ゲーム\(G\left( \theta _{I}\right) \)を分析します。まずは\(a_{2}>\theta _{1}\)を想定した場合、\(a_{1}>a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札して負の利得\(\theta _{1}-a_{2}<0\)を得る一方で、\(a_{1}\leq a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札せず利得\(0\)を得ます。\(a_{2}>\theta _{1}\)であるため、この場合には\(a_{1}=\theta _{1}\)は\(a_{2}\)に対する広義の最適反応の1つです。続いて\(a_{2}<\theta _{1}\)を想定した場合、\(a_{1}>a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札して正の利得\(\theta _{1}-a_{2}>0\)を得る一方で、\(a_{1}\leq a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札せず利得\(0\)を得ます。\(a_{2}<\theta _{1}\)であるため、この場合には\(a_{1}=\theta _{1}\)は\(a_{2}\)に対する広義の最適反応の1つです。最後に、\(a_{2}=\theta _{1}\)を想定した場合、\(a_{1}>a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札して利得\(\theta _{1}-a_{2}=0\)を得る一方で、\(a_{1}\leq a_{2}\)を満たす入札額を選択すると商品を落札せず利得\(0\)を得ます。\(a_{2}=\theta _{1}\)であるため、この場合には\(a_{1}=\theta _{1}\)は\(a_{2}\)に対する広義の最適反応の1つです。相手の行動\(a_{2}\)に関わらず、自身の行動\(a_{1}=\theta _{1}\)は常に広義の最適反応であることが明らかになりましたが、これは\(a_{1}=\theta _{1}\)が状態ゲーム\(G\left(\theta _{I}\right) \)における広義の支配戦略であることを意味します。任意の状態ゲーム\(G\left( \theta _{I}\right) \)について同様の議論が成立するため、以下の条件\begin{equation*}\forall \theta _{1}\in \Theta _{1}:s_{1}\left( \theta _{1}\right) =\theta
_{1}
\end{equation*}を満たす純粋戦略\(s_{1}:\Theta _{1}\rightarrow A_{1}\)がもとのベイジアンゲーム\(G\)における広義の支配戦略であることが明らかになりました。

先の命題はベイジアンゲームに支配戦略が存在しないことを示す上でも有用です。つまり、与えられたベイジアンゲーム\(G\)の何らかの状態ゲーム\(G\left( \theta _{I}\right) \)においてプレイヤー\(i\)が広義の支配戦略を持たない場合、先の命題より、プレイヤー\(i\)は\(G\)において広義の支配戦略を持ちません。

例(広義の支配戦略が存在しない場合)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 1,0 \\ \hline
b & 0,1 & 1,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 1,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)においてプレイヤー\(1\)は広義の支配戦略を持つでしょうか。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において広義の支配戦略\(a\)を持ちますが、もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において広義の支配戦略を持ちません。したがって、プレイヤー\(1\)はもとのベイジアンゲーム\(G\)において広義の支配戦略を持ちません。

ベイジアンゲーム\(G\)の異なる2つの状態ゲーム\(G\left( \theta _{I}\right) ,G\left( \theta _{I}^{\prime }\right) \)においてプレイヤー\(i\)がそれぞれ広義の支配戦略を持つ場合でも、\(G\)においてそれらを選択できるような純粋戦略が存在しない場合、先の命題より、プレイヤー\(i\)は\(G\)において広義の支配戦略を持ちません。

例(広義の支配戦略が存在しない場合)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)においてプレイヤー\(2\)は広義の支配戦略を持つでしょうか。プレイヤー\(2\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において広義の支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において広義の支配戦略\(b\)を持ちます。ただ、プレイヤー\(2\)は相手のタイプを事前に観察できず、したがって2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta _{21}\right) \)において\(a\)をプレーし\(G\left( \theta _{12},\theta_{21}\right) \)において\(b\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、先の命題より、プレイヤー\(2\)はもとのベイジアンゲーム\(G\)において広義の支配戦略を持たないことが明らかになりました。

 

ベイジアンゲームにおける広義の支配戦略均衡

繰り返しになりますが、ベイジアンゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が広義の支配戦略であることとは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つことを意味します。これは、プレイヤー\(i\)にとって、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらに、他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、自分は\(s_{i}^{\ast }\)にしたがって行動を選択すれば自身の利得を常に最大化できることを意味します。

さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\in S_{I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が広義の支配戦略になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in
A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta
_{I}\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の広義の支配戦略均衡(weakly dominant pure strategy equilibrium)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、純粋戦略の組\(s_{I}^{\ast }\)がベイジアンゲーム\(G\)の広義の支配戦略均衡であることは、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in
A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,a_{-i},\theta _{i}\right) \geq u_{i}\left( a_{i},a_{-i},\theta
_{i}\right)
\end{equation*}が成り立つことを意味します。

ベイジアンゲーム\(G\)に広義の支配戦略均衡\(s_{I}^{\ast }\)が存在する場合には、任意のプレイヤー\(i\)について、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらに、他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、プレイヤー\(i\)は均衡戦略\(s_{i}^{\ast }\)にしたがって行動を選択すれば自身の利得を常に最大化できます。つまり、広義の支配戦略均衡\(s_{I}^{\ast }\)が存在する場合には、プレイヤーたちはタイプや信念、さらには行動を読み合う必要がないため、理論が予測する均衡\(s_{I}^{\ast }\)が高い精度で実際にプレーされることになります。

 

ベイジアンゲームの支配戦略均衡と状態ゲームの支配戦略均衡の関係

ベイジアンゲームにおける広義の支配戦略と状態ゲームにおける広義の支配戦略の関係に関する先の命題を踏まえると、ベイジアンゲームにおける広義の支配戦略均衡と状態ゲームにおける広義の支配戦略均衡の間に以下の関係が成り立つことが示されます。

命題(ベイジアンゲームの支配戦略均衡と状態ゲームの支配戦略均衡の関係)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が広義の支配純粋均衡であることと、任意の状態\(\theta _{I}\in\Theta _{I}\)において\(s_{I}^{\ast }\left( \theta_{I}\right) \in A_{I}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略均衡であることは必要十分条件である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題は、ベイジアンゲームにおける広義の支配戦略均衡を特定する作業を、完備情報ゲームである状態ゲームにおける広義の支配戦略均衡を特定する作業へ帰着させられることを保証しています。つまり、ベイジアンゲーム\(G\)が与えられたとき、それぞれの状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略均衡\(a_{I}\)を特定した上で、それぞれの状態\(\theta _{I}\in \Theta _{I}\)に対して\(s_{I}\left( \theta _{I}\right) =a_{I}\)を満たす純粋戦略の組\(s_{I}\)を構成すれば、それはもとのベイジアンゲーム\(G\)における広義の支配戦略均衡であることが保証されるということです。

例(広義の支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)に広義の支配戦略均衡は存在するでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)においてプレイヤー\(1\)は広義の支配戦略\(a\)を持ち、プレイヤー\(2\)は広義の支配戦略\(b\)を持つため、この状態ゲームには広義の支配戦略均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,b\right)
\end{equation*}が存在します。状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)においてプレイヤー\(1\)は広義の支配戦略\(a\)を持ち、プレイヤー\(2\)は広義の支配戦略\(b\)を持つため、この状態ゲームには広義の支配戦略均衡\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,b\right)
\end{equation*}が存在します。したがって、以下の条件\begin{eqnarray*}
s_{1}\left( \theta _{11}\right) &=&a \\
s_{1}\left( \theta _{12}\right) &=&a
\end{eqnarray*}を満たすプレイヤー\(1\)の純粋戦略\(s_{1}\)と、以下の条件\begin{equation*}s_{2}\left( \theta _{21}\right) =b
\end{equation*}を満たすプレイヤー\(2\)の純粋戦略\(s_{2}\)からなる組\(\left( s_{1},s_{2}\right) \)はもとのベイジアンゲーム\(G\)の広義の支配戦略均衡です。

例(広義の支配戦略均衡)
1つの商品をめぐって\(2\)人が入札を行うオークションを分析します。プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。それぞれの入札者\(i\in I\)の商品への評価額\(\theta _{i}\)は私的情報であり、入札者\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ 0,100\right] \end{equation*}です。それぞれの入札者\(i\)の行動\(a_{i}\)は入札額であり、任意の非負の実数を入札できるものとします。入札者\(i\)の行動集合は、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}です。入札者たちが提示する入札額の組が\(a_{I}=\left( a_{1},a_{2}\right) \)であるとき、\begin{equation*}a_{i}>a_{j}
\end{equation*}を満たす入札者\(i\)が商品を落札し、相手の入札額\(a_{j}\)に等しい金額を支払うものとします。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも行いません。また、\begin{equation*}a_{i}=a_{j}
\end{equation*}の場合には両者とも商品を落札できず、支払いも行いません。状態\(\theta _{I}=\left( \theta _{1},\theta _{2}\right) \)における入札者\(i\)の利得関数\(u_{i}\left( \cdot ,\theta _{I}\right):A_{I}\rightarrow \mathbb{R} \)がそれぞれの\(a_{I}\in A_{I}\)に対して定める値は、\begin{equation*}u_{i}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{i}-a_{j} & \left( if\ a_{i}>a_{j}\right) \\
0 & \left( if\ a_{i}\leq a_{j}\right)
\end{array}\right.
\end{equation*}です。以上のベイジアンゲーム\(G\)に広義の支配戦略均衡は存在するでしょうか。状態\(\theta _{I}\)を任意に選んだ上で、状態ゲーム\(G\left(\theta _{I}\right) \)を分析します。先に明らかにしたように、以下の行動\begin{equation*}a_{1}=\theta _{1}
\end{equation*}はプレイヤー\(1\)の広義の支配戦略です。同様に、以下の行動\begin{equation*}a_{2}=\theta _{2}
\end{equation*}はプレイヤー\(1\)の広義の支配戦略です。したがって、以下の行動の組\begin{equation*}\left( a_{1},a_{2}\right) =\left( \theta _{1},\theta _{2}\right)
\end{equation*}は状態ゲーム\(G\left( \theta _{I}\right) \)の広義の支配戦略均衡です。任意の状態ゲームについて同様であるため、以下の条件\begin{eqnarray*}\forall \theta _{1} &\in &\Theta _{1}:s_{1}\left( \theta _{1}\right) =\theta
_{1} \\
\forall \theta _{2} &\in &\Theta _{2}:s_{2}\left( \theta _{2}\right) =\theta
_{2}
\end{eqnarray*}を満たす純粋戦略の組\(\left( s_{1},s_{2}\right) \)はもとのベイジアンゲーム\(G\)における広義の支配戦略均衡です。

先の命題は、ベイジアンゲームに広義の支配戦略均衡が存在しないことを示す上でも有用です。与えられたベイジアンゲーム\(G\)の何らかの状態ゲーム\(G\left( \theta _{I}\right) \)に広義の支配戦略均衡が存在しない場合、先の命題より、もとのベイジアンゲーム\(G\)に広義の支配戦略均衡は存在しません。

例(広義の支配戦略が存在しない場合)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 1,0 \\ \hline
b & 0,1 & 1,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 1,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)に広義の支配戦略均衡は存在するでしょうか。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において広義の支配戦略\(a\)を持ちますが、もう一方の状態ゲーム\(G\left( \theta_{12},\theta _{21}\right) \)において広義の支配戦略を持ちません。したがって、状態ゲーム\(G\left( \theta _{12},\theta_{21}\right) \)には広義の支配戦略均衡は存在せず、ゆえにもとのベイジアンゲーム\(G\)に広義の支配戦略均衡は存在しません。

ベイジアンゲーム\(G\)の任意の状態ゲーム\(G\left(\theta _{I}\right) \)に広義の支配戦略均衡がそれぞれ存在する場合でも、ベイジアンゲーム\(G\)においてそれらを実現できるような純粋戦略の組が存在しない場合、ベイジアンゲーム\(G\)に広義の支配戦略均衡は存在しません。

例(広義の支配戦略均衡が存在しない場合)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)に広義の支配戦略は存在するでしょうか。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)において以下の行動の組\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,a\right)
\end{equation*}は広義の支配戦略均衡であり、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において以下の行動の組\begin{equation*}\left( a_{1},a_{2}\right) =\left( a,b\right)
\end{equation*}は広義の支配戦略均衡です。ただ、プレイヤー\(2\)は相手のタイプを事前に観察できず、したがって2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta _{21}\right) \)において\(a\)をプレーし\(G\left( \theta _{12},\theta_{21}\right) \)において\(b\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、もとのベイジアンゲーム\(G\)には広義の支配戦略は存在しません。

 

演習問題

問題(広義の支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21},\theta _{22}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{11},\theta
_{22}\right) ,\left( \theta _{12},\theta _{21}\right) ,\left( \theta
_{12},\theta _{22}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3,1 & 2,0 \\ \hline
b & 5,1 & 4,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 3,0 & 2,1 \\ \hline
b & 5,0 & 4,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には広義の支配戦略均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(広義の支配戦略均衡)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21},\theta _{22}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{11},\theta
_{22}\right) ,\left( \theta _{12},\theta _{21}\right) ,\left( \theta
_{12},\theta _{22}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,2 & 0,0 \\ \hline
b & 3,0 & 1,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 3,0 & 1,2 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 1,2 & 3,0 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{22}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 1,1 & 3,0 \\ \hline
b & 0,0 & 2,2 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。このベイジアンゲーム\(G\)には広義の支配戦略均衡は存在するでしょうか。理由とともに答えてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(広義の支配戦略)
1つの商品をめぐって\(3\)人が入札を行うオークションを分析します。プレイヤー集合は、\begin{equation*}I=\left\{ 1,2,3\right\}
\end{equation*}です。それぞれの入札者\(i\in I\)の商品への評価額\(\theta _{i}\)は私的情報であり、入札者\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ 0,100\right] \end{equation*}です。それぞれの入札者\(i\)の行動\(a_{i}\)は入札額であり、任意の非負の実数を入札できるものとします。入札者\(i\)の行動集合は、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}です。入札者たちが提示する入札額の組が\(a_{I}=\left( a_{1},a_{2},a_{3}\right) \)であるとき、\begin{equation*}a_{i}>\max \left\{ a_{j},a_{k}\right\}
\end{equation*}を満たす入札者\(i\)が商品を落札し、\(\max \left\{a_{j},a_{k}\right\} \)に等しい金額を支払うものとします。他の入札者\(j,k\)は商品を落札できず、支払いも行いません。また、複数の入札者が最高額を入札する場合には誰も商品を落札できず、支払いも行いません。状態\(\theta_{I}=\left( \theta _{1},\theta _{2},\theta _{3}\right) \)における入札者\(i\)の利得関数\(u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R} \)がそれぞれの\(a_{I}\in A_{I}\)に対して定める値は、\begin{equation*}u_{i}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{i}-\max \left\{ a_{j},a_{k}\right\} & \left( if\ a_{i}>\max
\left\{ a_{j},a_{k}\right\} \right) \\
0 & \left( if\ a_{i}<\max \left\{ a_{j},a_{k}\right\} \right)
\end{array}\right.
\end{equation*}です。以上のベイジアンゲーム\(G\)において、以下の条件\begin{eqnarray*}\forall \theta _{1} &\in &\Theta _{1}:s_{1}\left( \theta _{1}\right) =\theta
_{1} \\
\forall \theta _{2} &\in &\Theta _{2}:s_{2}\left( \theta _{2}\right) =\theta
_{2} \\
\forall \theta _{3} &\in &\Theta _{3}:s_{3}\left( \theta _{3}\right) =\theta
_{3}
\end{eqnarray*}を満たす純粋戦略の組\(\left( s_{1},s_{2},s_{3}\right) \)は広義の支配戦略均衡であることを示してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録

不完備情報の静学ゲーム