教材一覧
教材一覧
教材検索

不完備情報の静学ゲーム

ベイジアンゲームにおける広義の支配戦略均衡

目次

Twitterで共有
メールで共有

ベイジアンゲームにおける広義の支配戦略

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。任意のプレイヤーの行動集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちが選び得る行動の組からなる集合\(A_{-i}\)を把握していますが、ゲームの静学性より、他のプレイヤーたちが実際に選ぶ行動\(a_{-i}\in A_{-i}\)を事前に観察することはできません。また、任意のプレイヤーのタイプ集合は共有知識であるため、プレイヤー\(i\)は他のプレイヤーたちのタイプの組からなる集合\(\Theta _{-i}\)を把握していますが、ゲームの不完備性より、他のプレイヤーたちの真のタイプ\(\theta_{-i}^{\ast }\in \Theta _{-i}\)を事前に観察することはできません。このような状況において、プレイヤー\(i\)は何らかの純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選択しますが、これは自身のそれぞれのタイプ\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を1つずつ指定する行動計画に相当します。プレイヤー\(i\)は自身の真のタイプ\(\theta _{i}^{\ast }\)を知っていますが、純粋戦略\(s_{i}\)のもとでは、真のタイプ\(\theta _{i}^{\ast }\)のもとでの行動\(s_{i}\left( \theta _{i}^{\ast }\right) \)を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ\(\theta _{i}\)に対しても、その場合に自分が選ぶであろう行動\(s_{i}\left( \theta_{i}\right) \)をそれぞれ指定する必要があります。

以上を踏まえた上で、プレイヤー\(i\in I\)のある純粋戦略\(s_{i}\in S_{i}\)に注目します。つまり、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)である場合には行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を選ぶということです。加えて、他のプレイヤーたちのタイプが\(\theta _{-i}\in \Theta _{-i}\)であり、他のプレイヤーたちが選ぶ行動が\(a_{-i}\in A_{-i}\)であるものと仮定します。以上のタイプから構成される状態\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) \)であるため、以上の想定のもとでプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta _{I}\right)
=u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta _{i},\theta
_{-i}\right)
\end{equation*}であり、プレイヤー\(i\)はこの利得を事前に把握しています。他の任意の\(\theta _{i},\theta _{-i},a_{-i}\)についても同様です。ただ、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであったとしても、さらには他のプレイヤーたちが選ぶ行動の組\(a_{-i}\)がどのようなものであったとしても、問題としている純粋戦略\(s_{i}\)のもとで上の利得が常に最大化されることが保証される場合には、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall \theta _{-i}\in \Theta _{-i},\
\forall a_{-i}\in A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}\left(
\theta _{i}\right) ,a_{-i},\theta _{i},\theta _{-i}\right) \geq u_{i}\left(
a_{i},a_{-i},\theta _{i},\theta _{-i}\right)
\end{equation*}すなわち、\begin{equation*}
\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つ場合には、\(s_{i}\)をプレイヤー\(i\)の広義の支配戦略(weakly dominant strategy)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合には、\(u_{i}\)の形状は他のプレイヤーたちのタイプの組\(\theta _{-i}\)に依存せず、自身のタイプ\(\theta _{i}\)にのみ依存するため、プレイヤー\(i\)にとって純粋戦略\(s_{i}\)が広義の支配戦略であることは、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}\left( \theta _{i}\right) ,a_{-i},\theta
_{i}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{i}\right)
\end{equation*}が成り立つことを意味します。

広義の支配戦略のもとで最大化されるものは中間期待利得ではなく利得であることから、これはプレイヤーの信念に依存しない概念です。プレイヤー\(i\)が広義の支配戦略\(s_{i}\)を持つ場合には、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらには他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、自分は\(s_{i}\)にしたがって行動を選択すれば自身の利得を常に最大化できることが保証されます。したがって、プレイヤー\(i\)が広義の支配戦略を持つ場合、プレイヤー\(i\)は他のプレイヤーのタイプや行動を読んだり、予想する必要さえもありません。

 

ベイジアンゲームの支配戦略と状態ゲームの支配戦略の関係

ベイジアンゲーム\(G\)において、プレイヤー\(i\)の純粋戦略\(s_{i}\)が広義の支配戦略であるものとします。状態\(\theta _{I}\)を任意に選び、そこでの状態ゲーム\(G\left( \theta_{I}\right) \)について考えます。ベイジアンゲーム\(G\)においてプレイヤー\(i\)が\(s_{i}\)を採用する場合、状態ゲーム\(G\left( \theta _{I}\right) \)において行動\(s_{i}\left( \theta_{i}\right) \)を選択することになります。状態ゲーム\(G\left( \theta _{I}\right) \)は完備情報ゲームであるため、行動は純粋戦略と同一視されますが、先の行動\(s_{i}\left( \theta _{i}\right) \)は状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略になることが保証されます。つまり、ベイジアンゲームにおける広義の支配戦略がそれぞれの状態ゲームにおいて命じる行動は、その状態ゲームにおける広義の支配戦略になることが保証されるということです。

命題(ベイジアンゲームの支配戦略は状態ゲームの支配戦略を導く)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が広義の支配戦略であるならば、任意の状態\(\theta _{I}\in \Theta _{I}\)において\(s_{i}\left( \theta _{i}\right) \in A_{i}\)は状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

逆の議論も成立します。つまり、ベイジアンゲーム\(G\)においてプレイヤー\(i\)が純粋戦略\(s_{i}\)を採用する場合、それぞれの状態ゲーム\(G\left( \theta _{I}\right) \)において行動\(s_{i}\left( \theta _{i}\right) \)を選択することになりますが、この行動\(s_{i}\left( \theta_{i}\right) \)が状態ゲーム\(G\left( \theta_{I}\right) \)における広義の支配戦略になることが保証される場合、先の純粋戦略\(s_{i}\)はもとのベイジアンゲーム\(G\)における広義の支配戦略です。

命題(状態ゲームの支配戦略を導く純粋戦略はベイジアンゲームの支配戦略)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が与えられているものとする。任意の状態\(\theta _{I}\in \Theta _{I}\)において\(s_{i}\left(\theta _{i}\right) \in A_{i}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略であるならば、\(s_{i}\)はベイジアンゲーム\(G\)における広義の支配戦略である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の2つの命題を踏まえると、ベイジアンゲームにおける広義の支配戦略を以下のように特徴づけることができます。

命題(ベイジアンゲームの支配戦略と状態ゲームの支配戦略の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が与えられているものとする。任意の状態\(\theta _{I}\in \Theta _{I}\)において\(s_{i}\left(\theta _{i}\right) \in A_{i}\)が状態ゲーム\(G\left( \theta _{I}\right) \)における広義の支配戦略であることと、\(s_{i}\)がベイジアンゲーム\(G\)における広義の支配戦略であることは必要十分である。

以上の命題は、ベイジアンゲームにおける広義の支配戦略を特定する作業を、完備情報ゲームである状態ゲームにおける広義の支配戦略を特定する作業へ帰着させられることを保証しています。つまり、ベイジアンゲーム\(G\)が与えられたとき、それぞれの状態ゲーム\(G\left( \theta _{I}\right) \)におけるプレイヤー\(i\)の広義の支配戦略に相当する行動\(a_{i}\)を特定した上で、それぞれの状態\(\theta_{I}\in \Theta _{I}\)に対して\(s_{i}\left( \theta_{i}\right) =a_{i}\)を満たす純粋戦略\(s_{i}\)を構成すれば、それはもとのベイジアンゲーム\(G\)における広義の支配戦略であることが保証されるということです。

例(広義の支配戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)においてプレイヤー\(1\)は広義の支配戦略を持つでしょうか。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において広義の支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において広義の支配戦略\(a\)を持つため、\begin{eqnarray*}s_{1}\left( \theta _{11}\right) &=&a \\
s_{2}\left( \theta _{12}\right) &=&a
\end{eqnarray*}を満たす純粋戦略\(s_{1}:\Theta _{1}\rightarrow A_{1}\)はもとのベイジアンゲーム\(G\)における広義の支配戦略です。

例(広義の支配戦略)
1つの商品をめぐって\(2\)人が入札を行うオークションを分析します。プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。それぞれの入札者\(i\in I\)の商品への評価額\(\theta _{i}\)は私的情報であり、入札者\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ 0,100\right] \end{equation*}です。それぞれの入札者\(i\)の行動\(a_{i}\)は入札額であり、任意の非負の実数を入札できるものとします。入札者\(i\)の行動集合は、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}です。入札者たちが提示する入札額の組が\(a_{I}=\left( a_{1},a_{2}\right) \)であるとき、\begin{equation*}a_{i}>a_{j}
\end{equation*}を満たす入札者\(i\)が商品を落札し、相手の入札額\(a_{j}\)に等しい金額を支払うものとします。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも行いません。また、\begin{equation*}a_{i}=a_{j}
\end{equation*}の場合には両者とも商品を落札できず、支払いも行いません。状態\(\theta _{I}=\left( \theta _{1},\theta _{2}\right) \)における入札者\(1\)の利得関数\(u_{1}\left( \cdot ,\theta _{I}\right):A_{I}\rightarrow \mathbb{R} \)がそれぞれの\(a_{I}\in A_{I}\)に対して定める値は、\begin{equation*}u_{1}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{1}-a_{2} & \left( if\ a_{1}>a_{2}\right) \\
0 & \left( if\ a_{1}\leq a_{2}\right)
\end{array}\right.
\end{equation*}です。以上のベイジアンゲーム\(G\)において入札者\(1\)は広義の支配戦略を持つでしょうか。状態\(\theta _{I}\)を任意に選んだ上で、状態ゲーム\(G\left( \theta _{I}\right) \)を分析します。まずは\(a_{2}>\theta _{1}\)を想定した場合、\(a_{1}>a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札して負の利得\(\theta _{1}-a_{2}<0\)を得る一方で、\(a_{1}\leq a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札せず利得\(0\)を得ます。\(a_{2}>\theta _{1}\)であるため、この場合には\(a_{1}=\theta _{1}\)は\(a_{2}\)に対する広義の最適反応の1つです。続いて\(a_{2}<\theta _{1}\)を想定した場合、\(a_{1}>a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札して正の利得\(\theta _{1}-a_{2}>0\)を得る一方で、\(a_{1}\leq a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札せず利得\(0\)を得ます。\(a_{2}<\theta _{1}\)であるため、この場合には\(a_{1}=\theta _{1}\)は\(a_{2}\)に対する広義の最適反応の1つです。最後に、\(a_{2}=\theta _{1}\)を想定した場合、\(a_{1}>a_{2}\)を満たす入札額\(a_{1}\)を選択すると商品を落札して利得\(\theta _{1}-a_{2}=0\)を得る一方で、\(a_{1}\leq a_{2}\)を満たす入札額を選択すると商品を落札せず利得\(0\)を得ます。\(a_{2}=\theta _{1}\)であるため、この場合には\(a_{1}=\theta _{1}\)は\(a_{2}\)に対する広義の最適反応の1つです。相手の行動\(a_{2}\)に関わらず、自身の行動\(a_{1}=\theta _{1}\)は常に広義の最適反応であることが明らかになりましたが、これは\(a_{1}=\theta _{1}\)が状態ゲーム\(G\left(\theta _{I}\right) \)における広義の支配戦略であることを意味します。任意の状態ゲーム\(G\left( \theta _{I}\right) \)について同様の議論が成立するため、以下の条件\begin{equation*}\forall \theta _{1}\in \Theta _{1}:s_{1}\left( \theta _{1}\right) =\theta
_{1}
\end{equation*}を満たす純粋戦略\(s_{1}:\Theta _{1}\rightarrow A_{1}\)がもとのベイジアンゲーム\(G\)における広義の支配戦略であることが明らかになりました。

先の命題はベイジアンゲームに支配戦略が存在しないことを示す上でも有用です。つまり、与えられたベイジアンゲーム\(G\)の何らかの状態ゲーム\(G\left( \theta _{I}\right) \)においてプレイヤー\(i\)が広義の支配戦略を持たない場合、先の命題より、プレイヤー\(i\)は\(G\)において広義の支配戦略を持ちません。

例(広義の支配戦略が存在しない場合)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 1,0 \\ \hline
b & 0,1 & 1,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 1,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)においてプレイヤー\(1\)は広義の支配戦略を持つでしょうか。プレイヤー\(1\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において広義の支配戦略\(a\)を持ちますが、もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において広義の支配戦略を持ちません。したがって、プレイヤー\(1\)はもとのベイジアンゲーム\(G\)において広義の支配戦略を持ちません。

ベイジアンゲーム\(G\)の異なる2つの状態ゲーム\(G\left( \theta _{I}\right) ,G\left( \theta _{I}^{\prime }\right) \)においてプレイヤー\(i\)がそれぞれ広義の支配戦略を持つ場合でも、\(G\)においてそれらを選択できるような純粋戦略が存在しない場合、先の命題より、プレイヤー\(i\)は\(G\)において広義の支配戦略を持ちません。

例(広義の支配戦略が存在しない場合)
ベイジアンゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11},\theta _{12}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21}\right\}
\end{eqnarray*}であるものとします。つまり、状態集合は、\begin{equation*}
\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta _{12},\theta
_{21}\right) \right\}
\end{equation*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 2,0 \\ \hline
b & 0,1 & 2,1 \\ \hline
\end{array}$$

として、状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)が以下の利得行列

$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 2,1 \\ \hline
b & 0,0 & 2,1 \\ \hline
\end{array}$$

としてそれぞれ与えられているものとします。以上のベイジアンゲーム\(G\)においてプレイヤー\(2\)は広義の支配戦略を持つでしょうか。プレイヤー\(2\)は状態ゲーム\(G\left( \theta _{11},\theta_{21}\right) \)において広義の支配戦略\(a\)を持ち、もう一方の状態ゲーム\(G\left( \theta _{12},\theta _{21}\right) \)において広義の支配戦略\(b\)を持ちます。ただ、プレイヤー\(2\)は相手のタイプを事前に観察できず、したがって2つの状態ゲームを事前に区別できないため、\(G\left( \theta _{11},\theta _{21}\right) \)において\(a\)をプレーし\(G\left( \theta _{12},\theta_{21}\right) \)において\(b\)をプレーするようなプレイヤー\(2\)の純粋戦略は存在しません。したがって、先の命題より、プレイヤー\(2\)はもとのベイジアンゲーム\(G\)において広義の支配戦略を持たないことが明らかになりました。

 

ベイジアンゲームにおける広義の支配戦略均衡

繰り返しになりますが、ベイジアンゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略\(s_{i}^{\ast }\in S_{i}\)が広義の支配戦略であることとは、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in A_{-i},\ \forall
a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta _{I}\right)
\end{equation*}が成り立つことを意味します。これは、プレイヤー\(i\)にとって、自分のタイプ\(\theta _{i}\)や他のプレイヤーたちのタイプ\(\theta _{-i}\)がどのようなものであるかに関わらず、また、自分がどのような信念\(f_{i}\)を持っているかに関わらず、さらに、他のプレイヤーたちがいかなる行動\(a_{-i}\)を選ぶかに関わらず、自分は\(s_{i}^{\ast }\)にしたがって行動を選択すれば自身の利得を常に最大化できることを意味します。

さて、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\in S_{I}\)において、任意のプレイヤー\(i\)の純粋戦略\(s_{i}^{\ast }\)が広義の支配戦略になっているならば、すなわち、\begin{equation*}\forall i\in I,\ \forall \theta _{I}\in \Theta _{I},\ \forall a_{-i}\in
A_{-i},\ \forall a_{i}\in A_{i}:u_{i}\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,a_{-i},\theta _{I}\right) \geq u_{i}\left( a_{i},a_{-i},\theta
_{I}\right)
\end{equation*}が成り立つならば、\(s_{I}^{\ast }\)を\(G\)の広義の支配戦略均衡(weakly dominant pure strategy equilibrium)と呼びます。

例(私的価値モデルの場合)
プレイヤー\(i\)の利得関数\(u_{i}\)に関して私的価値の仮定が成り立つ場合