教材一覧
教材検索
STATIC GAME OF INCOMPLETE INFORMATION

信念

目次

< 前のページ
Share on twitter
Twitterで共有
Share on email
メールで共有

信念

復習になりますが、ベイジアンゲーム\(G\)におけるそれぞれのプレイヤー\(i\)の純粋戦略とは、自身のそれぞれのタイプ値\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を包括的に指定する行動計画\(s_{i}:\Theta _{i}\rightarrow A_{i}\)です。プレイヤー\(i\)は自身の真のタイプ\(\theta_{i}^{\ast }\)を知っていますが、純粋戦略\(s_{i}\)のもとでは、真のタイプ\(\theta_{i}^{\ast }\)のもとでの行動\(s_{i}\left( \theta _{i}^{\ast }\right) \)を指定するだけでなく、真のタイプとは限らないそれぞれのタイプ\(\theta _{i}\)に対しても、その場合に自分が選ぶであろう行動\(s_{i}\left( \theta _{i}\right) \)をそれぞれ指定する必要があります。

プレイヤー\(i\)のタイプが\(\theta _{i}\)であるとき、彼が直面し得る状態ゲームからなる集合は\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta _{-i}\in\Theta _{-i}}\)です。プレイヤー\(i\)は自身のタイプ\(\theta_{i}\)を観察できますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)は観察できないため、自分のタイプが\(\theta _{i}\)の場合に\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta_{-i}\in \Theta _{-i}}\)の中のどの状態ゲームを実際にプレーすることになるか識別できません。プレイヤー\(i\)が純粋戦略\(s_{i}\)を選ぶこととは、自身のそれぞれのタイプ\(\theta _{i}\)に対して特定の行動\(s_{i}\left( \theta _{i}\right) \)を1つずつ事前に選び、その行動のもとで自分が直面し得る\(\left\{ G\left(\theta _{i},\theta _{-i}\right) \right\} _{\theta _{-i}\in \Theta _{-i}}\)に属するすべての状態ゲームに備えることを意味します。

こうした不確実な状況下で意思決定を迫られるプレイヤー\(i\)は、自身のそれぞれのタイプ\(\theta _{i}\)に対して、\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta _{-i}\in\Theta _{-i}}\)に属する状態ゲームがそれぞれどの程度の確率で起こり得るかを主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\}_{\theta _{-i}\in \Theta _{-i}}\)に属するそれぞれの状態ゲームの発生確率を定めることは、\(\Theta _{-i}\)に属するそれぞれの値\(\theta _{-i}\)の発生確率を定めることに等しいため、プレイヤー\(i\)のタイプの値が\(\theta _{i}\)であるときに設定する主観的確率は、タイプ集合が離散型である場合には、\begin{equation*}f_{i}:\Theta _{-i}\rightarrow \left[ 0,1\right] \end{equation*}という確率関数として定式化されます。つまり、プレイヤー\(i\)は自身のタイプの値が\(\theta _{i}\)であるとき、他のプレイヤーたちのタイプの値が\(\theta _{-i}\)である確率、すなわち自分がプレーする状態ゲームが\(G\left( \theta _{i},\theta_{-i}\right) \)である確率を\(f_{i}\left(\theta _{-i}\right) \)と予想します。

ただし、プレイヤー\(i\)が持つ私的情報\(\theta _{i}\)の中には、他のプレイヤーたちの私的情報\(\theta _{-i}\)の起こりやすさを予想する上で参考になる情報が含まれている可能性があります。そのような場合には、プレイヤー\(i\)は\(\theta _{i}\)に含まれるそのような情報を参照しながら\(\theta _{-i}\)の確率分布を予想できるため、一般的には、プレイヤー\(i\)が自身のタイプの値が\(\theta _{i}\)であるときに設定する主観的確率は、\begin{equation*}f_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \left[ 0,1\right] \end{equation*}という条件付き確率関数として定式化すべきです。つまり、プレイヤー\(i\)は自身のタイプの値が\(\theta _{i}\)であるとき、他のプレイヤーたちのタイプの値が\(\theta _{-i}\)である確率、すなわち自分がプレーする状態ゲームが\(G\left( \theta _{i},\theta _{-i}\right) \)である確率を条件付確率\(f_{i}\left(\theta _{-i}|\theta _{i}\right) \)として予想します。このような条件付き確率関数\(f_{i}\left(\cdot |\theta _{i}\right) \)をタイプ\(\theta_{i}\)のプレイヤー\(i\)の信念(belief)と呼びます。\(f_{i}\left( \cdot |\theta _{i}\right) \)は確率関数であるため、\begin{eqnarray*}&&\left( a\right) \ \forall \theta _{-i}\in \Theta _{-i}:f_{i}\left( \theta
_{-i}|\theta _{i}\right) \in \left[ 0,1\right] \\
&&\left( b\right) \ \sum_{\theta _{-i}\in \Theta _{-i}}f_{i}\left( \theta
_{-i}|\theta _{i}\right) =1
\end{eqnarray*}を満たします。\(f_{i}\left( \cdot|\theta _{i}\right) \)はプレイヤー\(i\)の主観的な予想であるため、これはプレイヤー\(i\)の私的情報であり、プレイヤーたちの共有知識ではありません。

繰り返しになりますが、ベイジアンゲーム\(G\)において、それぞれのプレイヤー\(i\)は自身のタイプの真の値\(\theta _{i}^{\ast }\)のもとでの行動を考えるだけでなく、真の値とは限らないそれぞれの値\(\theta _{i}\)に対してもその場合に自分が選ぶであろう行動を考える必要があります。したがって、信念についても同様に、自身のタイプの真の値\(\theta _{i}^{\ast }\)のもとでの信念\(f_{i}\left( \cdot |\theta_{i}^{\ast }\right) \)だけでなく、真の値とは限らないそれぞれの値\(\theta _{i}\)に対しても、その場合に自分が抱くであろう信念\(f_{i}\left( \cdot |\theta _{i}\right) \)をそれぞれ考えておく必要があります。つまり、ベイジアンゲーム\(G\)においてプレイヤー\(i\)が意思決定を行うためには、自身のタイプのそれぞれの値のもとでの信念からなる体系\begin{equation*}f_{i}=\{f_{i}\left( \cdot |\theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}
\end{equation*}が必要です。これをプレイヤー\(i\)の信念(belief)と呼びます。

タイプ\(\theta _{i}\)のプレイヤー\(i\)の信念\(f_{i}\left( \cdot |\theta _{i}\right) \)がプレイヤー\(i\)の私的情報である以上、プレイヤー\(i\)の信念\(f_{i}\)もまたプレイヤー\(i\)の私的情報です。

例(信念)
ある産業への参入を検討している2つの企業の意思決定を分析します。\(I=\left\{ 1,2\right\} \)です。それぞれの企業\(i\in I\)の技術水準\(\theta _{i}\)は私的情報であり、これは高技術\(h\)と低技術\(l\)の2つの値をとり得るものとします。\(\Theta _{i}=\left\{h,l\right\} \)です。企業\(1\)にとって自社の技術水準\(\theta _{1}\)は私的情報ですが、企業\(1\)が相手企業\(2\)の技術水準\(\theta _{2}\)を予想する際に、自分が高コスト(\(\theta _{1}=h\))である場合には相手もまた高コスト(\(\theta _{2}=h\))である確率を高く見積もり、逆に、自分が低コスト(\(\theta _{1}=l\))である場合には相手もまた低コスト(\(\theta_{2}=l\))である確率を高く見積もるのであれば、これは、企業\(1\)は自身のタイプに応じて異なる信念を持っている状況に相当します。例えば、\begin{equation*}f_{1}\left( h|h\right) =0.8,\quad f_{1}\left( l|h\right) =0.2
\end{equation*}を満たす\(\theta _{1}=h\)のもとでの信念\(f_{1}\left( \cdot |h\right) :\Theta_{2}\rightarrow \left[ 0,1\right] \)と、\begin{equation*}f_{1}\left( h|l\right) =0.2,\quad f_{1}\left( l|l\right) =0.8
\end{equation*}を満たす\(\theta _{1}=l\)のもとでの信念\(f_{1}\left( \cdot |l\right) :\Theta_{2}\rightarrow \left[ 0,1\right] \)から構成される信念\(f_{1}=\left\{ f_{1}\left( \cdot |h\right),f_{1}\left( \cdot |l\right) \right\} \)はそのような例になっています。一方、企業\(2\)は自社の技術水準\(\theta _{2}\)に関わらず、相手企業\(1\)の技術水準\(\theta _{1}\)は半々の確率で高コスト(\(\theta_{1}=h\))もしくは低コスト(\(\theta _{1}=l\))であると予想するのであれば、そのような信念は、\begin{equation*}f_{2}\left( h|h\right) =f_{2}\left( l|h\right) =0.5
\end{equation*}を満たす\(\theta _{2}=h\)のもとでの信念\(f_{2}\left( \cdot |h\right) :\Theta_{1}\rightarrow \left[ 0,1\right] \)と、\begin{equation*}f_{2}\left( h|l\right) =f_{2}\left( l|l\right) =0.5
\end{equation*}を満たす\(\theta _{2}=l\)のもとでの信念\(f_{2}\left( \cdot |l\right) :\Theta_{2}\rightarrow \left[ 0,1\right] \)から構成される信念\(f_{2}=\left\{ f_{2}\left( \cdot |h\right),f_{2}\left( \cdot |l\right) \right\} \)として定式化されます。

 

タイプ集合が連続型の場合の信念

ベイジアンゲーム\(G\)において任意のプレイヤー\(i\in I\)のタイプ集合が連続型\(\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \subset \mathbb{R} \)である場合、タイプ\(\theta _{i}\)のプレイヤー\(i\)の信念は条件付き同時分布関数\begin{equation*}F_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \left[ 0,1\right] \end{equation*}として定式化されます。つまり、プレイヤー\(i\)は自分のタイプが\(\theta _{i}\)という条件のもとで、他のプレイヤーたちのタイプの組が\(\theta _{-i}\)以下である確率を\(F_{i}\left( \theta _{-i}|\theta _{i}\right) \)と予想します。\(F_{i}\left( \cdot |\theta_{i}\right) \)は分布関数であるため、\begin{eqnarray*}&&\left( a\right) \ \forall \theta _{-i}\in \Theta _{-i}:0\leq F_{i}\left(
\theta _{-i}|\theta _{i}\right) \leq 1 \\
&&\left( b\right) \ \forall \theta _{-i},\theta _{-i}^{\prime }\in \Theta
_{-i}:\left[ \theta _{-i}\ll \theta _{-i}^{\prime }\Rightarrow F_{i}\left(
\theta _{-i}|\theta _{i}\right) \leq F_{i}\left( \theta _{-i}^{\prime
}|\theta _{i}\right) \right] \\
&&\left( c\right) \ F_{i}(\underline{\theta }_{-i}|\theta _{i})=0,\quad
F_{i}(\overline{\theta }_{-i}|\theta _{i})=1
\end{eqnarray*}がいずれも成り立ちます。\(F_{i}\left( \cdot |\theta _{i}\right) \)はプレイヤー\(i\)の主観的な予想であるため、これはプレイヤー\(i\)の私的情報であり、プレイヤーたちの共有知識ではありません。\(F_{i}\left( \cdot |\theta _{i}\right) \)に対しては多くの場合、任意の\(\theta _{-i}\in \Theta _{-i}\)に関して、\begin{equation*}F_{i}\left( \theta _{-i}|\theta _{i}\right) =\int_{-\infty }^{\theta
_{-i}}f_{i}\left( t|\theta \right) dt
\end{equation*}を満たすような\(F_{i}\left( \cdot|\theta _{i}\right) \)に対応する同時密度関数\begin{equation*}f_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \mathbb{R} \end{equation*}が存在するものと仮定します。\(f_{i}\left( \cdot |\theta_{i}\right) \)は密度関数であるため、\begin{eqnarray*}&&\left( a\right) \ \forall \theta _{-i}\in \Theta _{-i}:f_{i}\left( \theta
_{-i}|\theta _{i}\right) \geq 0 \\
&&\left( b\right) \ \int_{\theta _{-i}\in \Theta _{-i}}f\left( \theta
_{-i}|\theta _{i}\right) d\theta _{-i}=1
\end{eqnarray*}がともに成り立ちます。\(F_{i}\left( \cdot |\theta _{i}\right) \)と\(f_{i}\left(\cdot |\theta _{i}\right) \)のどちらか一方が与えられれば他方も得られるため、タイプ\(\theta _{i}\)のプレイヤー\(i\)の信念の定義としてどちらを採用しても構いません。

プレイヤー\(i\)は自分のタイプ集合\(\Theta _{i}\)に属するそれぞれのタイプ\(\theta _{i}\)に応じて異なる信念\(F_{i}\left( \cdot |\theta _{i}\right) \)もしくは\(f_{i}\left( \cdot |\theta _{i}\right) \)を持ち得るものと考えるならば、タイプ集合が連続型の場合のプレイヤー\(i\)の信念は、\begin{eqnarray*}F_{i} &=&\left\{ F_{i}\left( \cdot |\theta _{i}\right) \right\} _{\theta
_{i}\in \Theta _{i}} \\
f_{i} &=&\left\{ f_{i}\left( \cdot |\theta _{i}\right) \right\} _{\theta
_{i}\in \Theta _{i}}
\end{eqnarray*}などとして表現されます。すべてのプレイヤーの信念からなる組を\(\left\{ F_{i}\right\} _{i\in N}\)や\(\left\{f_{i}\right\} _{i\in N}\)などで表記します。

例(信念)
1つの商品をめぐって2人が入札を行うオークションを分析します。\(I=\left\{ 1,2\right\} \)です。それぞれの入札者\(i\in I\)の商品への評価額\(\theta _{i}\)は私的情報であり、これは\(\underline{\theta }\)以上\(\overline{\theta }\)以下の任意の実数を値としてとり得るものとします。\(\Theta _{i}=\left[ \underline{\theta },\overline{\theta }\right] \)です。入札者\(1\)にとって自身にとっての商品への評価額\(\theta _{1}\)は私的情報ですが、入札者\(1\)が入札者\(2\)による評価額\(\theta_{2}\)を予想する際に、自分が高い評価額を持っている場合には相手も高い評価額を持っている確率を高く見積もり、逆に、自分が低い評価額を持っている場合には相手も低い評価額を持っている確率を高く見積もるのであれば、これは、入札者\(1\)は自身のタイプに応じて異なる信念を持っている状況に相当します。具体例を挙げると、タイプ\(\theta _{1}\in \Theta _{1}\)を任意に選んだとき、それぞれの\(\theta _{2}\in \Theta _{2}\)に対して、\begin{equation*}f_{1}\left( \theta _{2}|\theta _{1}\right) =\left\{
\begin{array}{cl}
\frac{2\left( \theta _{2}-\underline{\theta }\right) }{\left( \overline{\theta }_{2}-\underline{\theta }\right) \left( \theta _{2}-\underline{\theta
}\right) } & \left( if\ \underline{\theta }\leq \theta _{2}<\theta
_{1}\right) \\
\frac{2}{\overline{\theta }-\underline{\theta }} & \left( if\ \theta
_{2}=\theta _{1}\right) \\
\frac{2\left( \overline{\theta }_{2}-\theta _{2}\right) }{\left( \overline{\theta }-\underline{\theta }\right) \left( \overline{\theta }-\theta
_{2}\right) } & \left( if\ \theta _{1}<\theta _{2}<\overline{\theta }\right)
\end{array}\right.
\end{equation*}を定める密度関数\(f_{1}\left(\cdot |\theta _{1}\right) :\Theta _{2}\rightarrow \mathbb{R} \)について考えます。これは\(\overline{\theta }\)を最大値、\(\underline{\theta }\)を最小値、そして\(\theta _{1}\)をモードとする三角分布であるため、これは、入札者\(2\)の評価額の分布の頂点が自身の評価額\(\theta _{1}\)に依存するという予測、すなわち信念を表現しています。一方、入札者\(2\)は自身による評価額\(\theta _{2}\)の水準に関わらず、入札者\(1\)の評価額は\(\left[ \underline{\theta },\overline{\theta }\right] \)の中を一様に分布しているものと予想しているものとします。具体的には、タイプ\(\theta _{2}\in \Theta _{2}\)を任意に選んだとき、\(\theta _{2}\)のもとでの入札者\(2\)の信念は、それぞれの\(\theta _{2}\in \Theta _{2}\)に対して、\begin{equation*}f_{2}\left( \theta _{1}|\theta _{2}\right) =\frac{1}{\overline{\theta }-\underline{\theta }}
\end{equation*}を定める密度関数\(f_{2}\left(\cdot |\theta _{2}\right) :\Theta _{1}\rightarrow \mathbb{R} \)として表現されるということです。

 

演習問題

問題(信念)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11}\right\} \)かつ\(\Theta _{2}=\left\{ \theta _{21},\theta_{22}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{11},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 0,0 & 1,2 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{21}\right) \)

として、状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 0,2 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}

\(G\left( \theta _{11},\theta _{22}\right) \)

としてそれぞれ与えられているものとします。このゲーム\(G\)におけるそれぞれのプレイヤーの信念を定式化してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

ベイジアンゲームにおいてプレイヤーたちはどのような行動原理のもとで意思決定を行うのでしょうか。次回は中間期待利得やベイジアン仮説などについて解説します。

質問・コメント(プレミアム会員限定) 次へ進む
< 前のページ
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録