ベイジアンゲームにおける高階の信念と共通事前分布

高階の信念

不完備情報の静学ゲームをベイジアンゲームとして定式化したとき、それぞれのプレイヤーは自身の中間期待利得を最大化するために最適な純粋戦略を選択するものと仮定します。具体的には、ベイジアンゲームではそれぞれのプレイヤーは自身のタイプを知っていますが、他のプレイヤーたちのタイプを事前に観察できません。このような不確実性下での意思決定に際して、それぞれのプレイヤー\(i\)は自身のタイプ\(\theta _{i}\)と信念\(f_{i}\)にもとづいて他のプレイヤーたちのタイプ\(\theta _{-i}\)を予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。このような仮定をベイジアン仮説と呼びます。

ここで注意したいのは、ベイジアンゲームの定義やベイジアン仮説において、プレイヤーたちが信念を形成する際の主観が具体的にどのようなものであるかが記述されていないという点です。したがって、プレイヤーはいかなる信念をも形成することができます。ただ、合理的なプレイヤーは自身の中間期待利得を最大化することを踏まえると、それぞれのプレイヤーは自身が形成し得る様々な信念の中でも自分が中間期待利得を最大化する上で最も有効な信念を探そうとするものと考えるのは自然です。さらに、ゲームにおいてプレイヤーたちは相互依存関係に直面している以上、それぞれのプレイヤーが自身の信念を選ぶプロセスにおいて、プレイヤーたちが互いの信念を読み合う状況が発生することが容易に予期されます。ただ、そのような読み合いが行われることを許容すると、ベイジアンゲームの分析が以下のように突如として複雑になってしまいます。

タイプ\(\theta _{i}\)のプレイヤー\(i\)は他のプレイヤーたちのタイプ\(\theta _{-i}\)に関する主観的な予想を形成しますが、それは\(\theta _{i}\)のもとでの信念\(f_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \left[ 0,1\right] \)として定式化されます。つまり、タイプ\(\theta _{i}\)のプレイヤー\(i\)は他のプレイヤーたちのタイプの値が\(\theta _{-i}\)である確率を\(f_{i}\left( \theta_{-i}|\theta _{i}\right) \)と見積もるということです。これをプレイヤー\(i\)の1階の信念（first-order belief）と呼びます。ベイジアン仮説より、タイプ\(\theta _{i}\)のプレイヤーは信念\(f_{i}\left( \cdot |\theta _{i}\right) \)にもとづいて導出される中間期待利得を最大化されるような戦略を選択するため、1階の信念はプレイヤー\(i\)の行動を予測する上で重要な情報です。

続いて、プレイヤー\(i\)とは異なるプレイヤー\(j\ \left( \not=i\right) \)の立場になって考えます。プレイヤー\(j\)もまた自身の1階の信念を持ちます。加えて、プレイヤー\(j\)にとっての最適な行動はプレイヤー\(i\)の最適な行動に依存する以上、プレイヤー\(j\)はプレイヤー\(i\)の行動を予測する必要がありますが、プレイヤー\(i\)の行動は彼の1階の信念に依存するため、プレイヤー\(j\)は自身にとっての最適な行動を考える際にはプレイヤー\(i\)の1階の信念を参照する必要があります。ただ、信念は主観的なものであり私的情報であるため、プレイヤー\(j\)はプレイヤー\(i\)の1階の信念を事前に観察できず、それがいかなるものであるかを予想する必要があります。これをプレイヤー\(j\)の2階の信念（second-order belief）と呼びます。プレイヤー\(j\)は自身の2階の信念を踏まえた上で意思決定を行うため、2階の信念はプレイヤー\(j\)の行動を予想する上で重要な情報です。

同様に考えていくと、それぞれのプレイヤーは3階、4階、\(\cdots \)という高階の信念（higher-order belief）をいくらでも形成する可能性がありますが、こうした複雑な状況を明示的に分析するのは実質的に不可能です。このような問題を回避するために、多くの場合、プレイヤーたちの信念に対して一定の仮定を設けた上で分析を行います。順番に解説します。

共通事前分布の仮定

プレイヤーたちのタイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)が離散型である場合、タイプ\(\theta _{i}\)のプレイヤー\(i\)の1階の信念は条件付き確率分布\begin{equation*}f_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \left[ 0,1\right] \end{equation*}として定義されます。つまり、プレイヤー\(i\)は自身のタイプが\(\theta _{i}\)であるとき、他のプレイヤーたちのタイプが\(\theta _{-i}\)である確率を\(f_{i}\left( \theta _{-i}|\theta _{i}\right) \)と予想するということです。入札者\(i\)の1階の信念とは、自身のそれぞれのタイプのもとでの1階の信念からなる体系\begin{equation*}f_{i}=\left\{ f_{i}\left( \cdot |\theta _{i}\right) \right\} _{\theta
_{i}\in \Theta _{i}}
\end{equation*}として定義されます。

一方、プレイヤー\(i\)の2階の信念とは、自身とは異なるそれぞれのプレイヤー\(j\ \left( \not=i\right) \)の1階の信念を予想する確率分布です。ただ、プレイヤー\(j\)の1階の信念はプレイヤー\(i\)のタイプ\(\theta _{i}\)に関する予想を含んでいる以上、プレイヤー\(i\)が2階の信念を持つこととは、他のプレイヤーたちのタイプ\(\theta _{-i}\)に加えて自身のタイプ\(\theta _{i}\)に関する予想、すなわち状態\(\theta _{I}\)に関する主観的な予想を形成していることを意味します。より高階の信念についても同様です。そこで、そのような予想を状態集合\(\Theta _{I}\)上に定義された同時確率関数\begin{equation*}f_{i}^{\ast }:\Theta _{I}\rightarrow \left[ 0,1\right] \end{equation*}として表現します。つまり、プレイヤー\(i\)は状態が\(\theta _{I}\)である確率を\(f_{i}^{\ast }\left( \theta _{I}\right) \)と予想するということです。

ベイジアンゲームにおいてプレイヤーたちがお互いのタイプを読み合う複雑な状況を許容した場合、それぞれのプレイヤー\(i\)は他のプレイヤーたちのタイプに関する信念\(f_{i}=\left\{ f_{i}\left( \cdot |\theta _{i}\right)\right\} _{\theta _{i}\in \Theta _{i}}\)を持つにとどまらず、自分を含めた全員のタイプ、すなわち状態に関する予想\(f_{i}^{\ast }\)を持つことになります。ただし、\(f_{i}\)は\(f_{i}^{\ast }\)の周辺確率関数として導けるという意味において整合的（consistent）でなければならないものと仮定します。つまり、プレイヤー\(i\)のタイプ\(\theta _{i}\in \Theta _{i}\)と他のプレイヤーたちのタイプ\(\theta _{-i}\in \Theta _{-i}\)をそれぞれ任意に選んだとき、\(f_{i}\)と\(f_{i}^{\ast }\)の間には、\begin{equation*}f_{i}\left( \theta _{-i}|\theta _{i}\right) =\frac{f_{i}^{\ast }\left(
\theta _{i},\theta _{-i}\right) }{\sum\limits_{\theta _{-i}\in \Theta
_{-i}}f_{i}^{\ast }\left( \theta _{i},\theta _{-i}\right) }
\end{equation*}という関係が成り立つことを要求するということです。\(f_{i}\)に対して以上の関係を満たす\(f_{i}^{\ast }\)は必ず存在します。

プレイヤーたちの信念\(f_{1},\cdots ,f_{n}\)と整合的な同時確率関数\(f_{1}^{\ast },\cdots ,f_{n}^{\ast }\)がそれぞれ与えられたとき、多くの場合、これらはいずれも等しいものと仮定します。つまり、ある同時確率関数\begin{equation*}f^{\ast }:\Theta _{I}\rightarrow \left[ 0,1\right] \end{equation*}が存在し、\begin{equation*}
\forall i\in I,\ \forall \theta _{I}\in \Theta _{i}:f^{\ast }\left( \theta
_{I}\right) =f_{i}^{\ast }\left( \theta _{I}\right)
\end{equation*}が成り立つことを仮定するということです。加えて、この\(f^{\ast }\)はプレイヤーたちにとって共有知識であるものと仮定します。このような同時確率関数\(f^{\ast }\)を共通事前分布（common prior）と呼びます。

共通事前分布の仮定のもとでは、任意のプレイヤー\(i\)の信念\(f_{i}\)は、共有知識である共通事前分布\(f^{\ast }\)と整合的です。つまり、プレイヤー\(i\in I\)とそのタイプ\(\theta _{i}\in \Theta _{i}\)および他のプレイヤーたちのタイプ\(\theta _{-i}\in \Theta _{-i}\)をそれぞれ任意に選んだときに、\(f_{i}\)と\(f^{\ast }\)の間には、\begin{equation*}f_{i}\left( \theta _{-i}|\theta _{i}\right) =\frac{f^{\ast }\left( \theta
_{i},\theta _{-i}\right) }{\sum\limits_{\theta _{-i}\in \Theta _{-i}}f^{\ast
}\left( \theta _{i},\theta _{-i}\right) }
\end{equation*}という関係が成り立つということです。この意味において、共通事前分布の仮定はすべてのプレイヤーが同一の主観的予想を持っていることを要求します。

タイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)が連続型である場合には、プレイヤー\(i\)の信念は条件付き密度関数の組\begin{equation*}f_{i}=\left\{ f_{i}\left( \cdot |\theta _{i}\right) \right\} _{\theta
_{i}\in \Theta _{i}}
\end{equation*}として表現されますが、共通事前分布の仮定のもとでは、共有知識であるような同時確率密度関数\begin{equation*}
f^{\ast }:\Theta _{I}\rightarrow \mathbb{R} \end{equation*}が存在し、プレイヤー\(i\in I\)とそのタイプ\(\theta_{i}\in \Theta _{i}\)および他のプレイヤーたちのタイプ\(\theta _{-i}\in \Theta _{-i}\)をそれぞれ任意に選んだときに、\begin{equation*}f_{i}\left( \theta _{-i}|\theta _{i}\right) =\frac{f^{\ast }\left( \theta
_{i},\theta _{-i}\right) }{\int\limits_{\theta _{-i}\in \Theta _{-i}}f^{\ast
}\left( \theta _{i},\theta _{-i}\right) d\theta _{-i}}
\end{equation*}という関係が成り立ちます。

プレイヤーたちの主観的な信念の組\(\left\{f_{i}\right\} _{i\in I}\)が与えられたとき、そのすべてと整合的であるような共通事前分布\(f^{\ast }\)は存在するとは限りません。以下の例より明らかです。

例（共通事前分布）

ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)であり、タイプ集合が\(\Theta _{1}=\left\{ \theta _{11},\theta _{12}\right\} \)かつ\(\Theta _{2}=\left\{ \theta _{21},\theta _{22}\right\} \)であるものとします。プレイヤー\(1\)の信念\(f_{1}=\left\{ f_{1}\left( \cdot |\theta _{11}\right) ,f_{1}\left( \cdot|\theta _{12}\right) \right\} \)は、\begin{eqnarray*}f_{1}\left( \theta _{21}|\theta _{11}\right) &=&0.9 \\
f_{1}\left( \theta _{22}|\theta _{11}\right) &=&0.1 \\
f_{1}\left( \theta _{21}|\theta _{12}\right) &=&0.1 \\
f_{1}\left( \theta _{21}|\theta _{12}\right) &=&0.9
\end{eqnarray*}を満たし、プレイヤー\(2\)の信念\(f_{2}=\left\{ f_{2}\left( \cdot |\theta_{21}\right) ,f_{2}\left( \cdot |\theta _{22}\right) \right\} \)は、\begin{eqnarray*}f_{2}\left( \theta _{11}|\theta _{21}\right) &=&0.5 \\
f_{2}\left( \theta _{12}|\theta _{21}\right) &=&0.5 \\
f_{2}\left( \theta _{11}|\theta _{22}\right) &=&0.5 \\
f_{2}\left( \theta _{12}|\theta _{22}\right) &=&0.5
\end{eqnarray*}を満たすものとします。共通事前分布\(f^{\ast}:\Theta _{1}\times \Theta _{2}\rightarrow \left[ 0,1\right] \)がそれぞれの状態に対して定める値を、\begin{eqnarray*}f^{\ast }\left( \theta _{11},\theta _{21}\right) &=&a \\
f^{\ast }\left( \theta _{11},\theta _{22}\right) &=&b \\
f^{\ast }\left( \theta _{12},\theta _{21}\right) &=&c \\
f^{\ast }\left( \theta _{12},\theta _{22}\right) &=&d
\end{eqnarray*}と表記します。プレイヤーたちの信念\(\left\{f_{1},f_{2}\right\} \)と共通事前分布\(f^{\ast }\)が整合的であるためには、\begin{eqnarray*}f_{1}\left( \theta _{21}|\theta _{11}\right) &=&\frac{f^{\ast }\left(
\theta _{11},\theta _{21}\right) }{f^{\ast }\left( \theta _{11},\theta
_{21}\right) +f^{\ast }\left( \theta _{11},\theta _{22}\right) }\Leftrightarrow 0.9=\frac{a}{a+b} \\
f_{1}\left( \theta _{22}|\theta _{11}\right) &=&\frac{f^{\ast }\left(
\theta _{11},\theta _{22}\right) }{f^{\ast }\left( \theta _{11},\theta
_{21}\right) +f^{\ast }\left( \theta _{11},\theta _{22}\right) }\Leftrightarrow 0.1=\frac{b}{a+b} \\
f_{1}\left( \theta _{21}|\theta _{12}\right) &=&\frac{f^{\ast }\left(
\theta _{12},\theta _{21}\right) }{f^{\ast }\left( \theta _{12},\theta
_{21}\right) +f^{\ast }\left( \theta _{12},\theta _{22}\right) }\Leftrightarrow 0.1=\frac{c}{c+d} \\
f_{1}\left( \theta _{22}|\theta _{12}\right) &=&\frac{f^{\ast }\left(
\theta _{12},\theta _{22}\right) }{f^{\ast }\left( \theta _{12},\theta
_{21}\right) +f^{\ast }\left( \theta _{12},\theta _{22}\right) }\Leftrightarrow 0.9=\frac{d}{c+d} \\
f_{2}\left( \theta _{11}|\theta _{21}\right) &=&\frac{f^{\ast }\left(
\theta _{11},\theta _{21}\right) }{f^{\ast }\left( \theta _{11},\theta
_{21}\right) +f^{\ast }\left( \theta _{12},\theta _{21}\right) }\Leftrightarrow 0.5=\frac{a}{a+c} \\
f_{2}\left( \theta _{12}|\theta _{21}\right) &=&\frac{f^{\ast }\left(
\theta _{12},\theta _{21}\right) }{f^{\ast }\left( \theta _{11},\theta
_{21}\right) +f^{\ast }\left( \theta _{12},\theta _{21}\right) }\Leftrightarrow 0.5=\frac{c}{a+c} \\
f_{2}\left( \theta _{11}|\theta _{22}\right) &=&\frac{f^{\ast }\left(
\theta _{11},\theta _{22}\right) }{f^{\ast }\left( \theta _{11},\theta
_{22}\right) +f^{\ast }\left( \theta _{12},\theta _{22}\right) }\Leftrightarrow 0.5=\frac{b}{b+d} \\
f_{2}\left( \theta _{11}|\theta _{22}\right) &=&\frac{f^{\ast }\left(
\theta _{11},\theta _{22}\right) }{f^{\ast }\left( \theta _{11},\theta
_{22}\right) +f^{\ast }\left( \theta _{12},\theta _{22}\right) }\Leftrightarrow 0.5=\frac{b}{b+d}
\end{eqnarray*}がすべて同時に成り立つ必要があります。ただ、これらを満たすのは、\begin{equation*}
a=b=c=d=0
\end{equation*}ですが、これは\(f^{\ast }\)が同時確率関数であることと矛盾です。したがって、\(\left\{ f_{1},f_{2}\right\} \)と整合的な\(f^{\ast }\)は存在しません。

共通事前分布の仮定のもとでの情報の非対称性

ベイジアンゲーム\(G\)において共通事前分布を仮定するとき、共通事前分布\(f^{\ast }\)はプレイヤーたちの共有知識とされます。また、ベイジアンゲーム\(G\)においてプレイヤーたちのタイプ集合\(\Theta_{1},\cdots ,\Theta _{n}\)は共有知識であるため、それぞれのプレイヤー\(i\)は共通事前分布\(f^{\ast }\)と整合的な自身の信念\(f_{i}=\left\{ f_{i}\left(\cdot |\theta _{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}\)を知っているだけでなく、他の任意のプレイヤー\(j\ \left( \not=i\right) \)の信念\(f_{j}=\left\{ f_{j}\left( \cdot |\theta _{j}\right) \right\} _{\theta_{j}\in \Theta _{j}}\)を導出することもできます。具体的には、整合性の仮定より、プレイヤー\(i\)は共有知識である\(f^{\ast }\)と\(\Theta _{1},\cdots ,\Theta _{n}\)から、プレイヤー\(j\)の信念\(f_{j}=\left\{f_{j}\left( \cdot |\theta _{j}\right) \right\} _{\theta _{j}\in \Theta _{j}}\)を、\begin{equation*}\forall \theta _{j}\in \Theta _{j},\ \forall \theta _{-j}\in \Theta
_{-j}:f_{j}\left( \theta _{-j}|\theta _{j}\right) =\frac{f^{\ast }\left(
\theta _{I}\right) }{\sum\limits_{\theta _{-j}\in \Theta _{-j}}f^{\ast
}\left( \theta _{j},\theta _{-j}\right) }
\end{equation*}という関係から導出できます。タイプ集合が連続型の場合にも同様です。

以上の議論は任意のプレイヤーに関して成立します。つまり、\(f^{\ast }\)と\(\Theta _{1},\cdots ,\Theta _{n}\)は共有知識であるため、任意のプレイヤー\(i\)は他の任意のプレイヤー\(j\)の信念\(f_{j}\)を先の要領で導くことができます。したがって、共通事前分布の仮定のもとでは、全員の信念\(\left\{ f_{i}\right\} _{i\in I}\)もまたプレイヤーたちの共有知識になります。繰り返しになりますが、共通事前分布を仮定しないベイジアンゲーム\(G\)においてそれぞれのプレイヤーの信念は私的情報ですが、共通事前分布の仮定のもとでは全員の信念が共有知識になります。

ただ、共通事前分布の仮定は、ベイジアンゲーム\(G\)に存在していた情報の非対称性が解消されることを意味しません。なぜなら、ベイジアンゲーム\(G\)における情報の非対称性とは、それぞれのプレイヤーにとって自身の真のタイプが私的情報であることを意味するのであり、たとえ全員のタイプの分布が共有知識になっても、それぞれのプレイヤーの真のタイプが共有知識になることを意味しないからです。つまり、プレイヤー\(i\)の真のタイプ\(\theta _{i}\)は依然として彼の私的情報であるため、たとえ他のプレイヤー\(j\)がプレイヤー\(i\)の信念\(f_{i}=\left\{ f_{i}\left( \cdot |\theta _{i}\right)\right\} _{\theta _{i}\in \Theta _{i}}\)を知った場合でも、その中のどの信念\(f_{i}\left( \cdot |\theta _{i}\right) \)がプレイヤー\(i\)の真のタイプ\(\theta _{i}\)にもとづく信念であるかは分からないからです。

以上の議論を踏まえると、共通事前分布の仮定のもとでは以下が成り立ちます。

全員のタイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)と共通事前分布\(f^{\ast }:\Theta _{I}\rightarrow \left[ 0,1\right] \)は共有知識である。
全員の信念\(\left\{ f_{i}\right\} _{i\in I}\)は\(\Theta _{1},\cdots ,\Theta _{n}\)と\(f^{\ast }\)から導かれるため共有知識である。
それぞれのプレイヤー\(i\)の真のタイプ\(\theta_{i}\)はプレイヤー\(i\)の私的情報である。
プレイヤー\(i\)の信念\(f_{i}=\left\{ f_{i}\left( \cdot |\theta _{i}\right) \right\} _{\theta_{i}\in \Theta _{i}}\)の中でも、どの信念\(f_{i}\left( \cdot |\theta _{i}\right) \)が真のタイプ\(\theta _{i}\)にもとづく信念であるかはプレイヤー\(i\)の私的情報である。

WIIS

数学のコース

経済学のコース

アカウント

WIIS

不完備情報の静学ゲーム

目次

関連知識

高階の信念

共通事前分布の仮定

共通事前分布の仮定のもとでの情報の非対称性

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率