不完備情報の静学ゲームを記述するためにはプレイヤー、行動、情報、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここではベイジアンゲームと呼ばれるモデルについて解説します。

2019年11月25日:改訂
2019年11月24日:公開

不完備情報の静学ゲームを記述する上で必要な情報

繰り返しになりますが、一般に、ゲームを記述するためにはゲームのルールを構成するプレイヤー、順番、行動、情報、結果、利得などを具体的に特定する必要があります。ただし、不完備情報の静学ゲームを分析対象とする場合には「順番」はすでに明らかです。つまり、すべてのプレイヤーは他のプレイヤーによる意思決定を観察できない状態で、もしくは同時に意思決定を行います。したがって、不完備情報の静学ゲームを記述するためにはゲームのルールの残りの要素であるプレイヤー、行動、情報、結果、利得をそれぞれ特定することになります。これらの要素を記述する方法はいくつか存在しますが、以降ではその中でもベイジアンゲーム(Bayesian game)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

不完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを\(I\)で表します。

\(n\)人のプレイヤーが参加するゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を\(I=\{1,2,\cdots ,n\}\)で表します。また、プレイヤー集合\(I\)に属する\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

戦略的相互依存関係は複数のプレイヤーが存在することで初めて成立する状況ですので、プレイヤーの人数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数\(n\)は\(2\)以上の整数と仮定します。

プレイヤーの単位として何を採用するかは分析対象となる戦略的相互依存関係に応じて変化します。個人をプレイヤーの単位とする場合もあれば、組織や国家などをプレイヤーの単位とする場合もあります。誰をプレイヤーとするかを決める上で重要なことは、ゲームにおいて自律的な意思決定を行う最小単位がプレイヤーであるということです。もう1つの重要な点は、その主体が戦略的相互依存関係に直面する中で意思決定を行う主体であるということです。したがって、他の主体との関係性の中で意思決定を行うのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。

例(プレイヤー集合)
1つの商品をめぐって複数の買い手が入札を行うオークションを分析する際には、通常、このゲームのプレイヤー集合\(I\)はすべての入札者からなる集合となります。入札者が\(2\)人だけであれば\(I=\{1,2\}\)となりますし、入札者が\(n\)人であれば\(I=\{1,2,\cdots ,n\}\)となります。商品の売り手をプレイヤーをみなすべきかどうかは状況によります。売り手が商品の販売を競売人に委託したり、もしくは自身でオークションを開催するなどして、競りのプロセスに自身が関与しないのであれば、売り手はゲームのプレイヤーとはみなされません。一方、買い手と売り手がともに値を付け合う形式のオークションでは、売り手をプレイヤーに含めて考えるべきです。

 

私的情報の表現

繰り返しになりますが、不完備情報の静学ゲームを記述するためにはゲームのルールを構成する要素、すなわち「プレイヤー」「行動」「情報」「結果」「利得」などを特定する必要があります。さらに、不完備情報ゲームのルールは共有知識ではなく、少なくとも 1 人のプレイヤーは、先の要素の中の少なくとも 1 つを知らずに意思決定を行います。不完備情報ゲームのプレイヤーが保有するゲームのルールに関する情報のうち、そのプレイヤーだけが観察可能で、他のプレイヤーたちが観察できないものを、そのプレイヤーが持つ私的情報(private information)やタイプ(type)などと呼びます。

不完備情報ゲームの静学ゲームにおいて、プレイヤー\(i\in I\)が持つ私的情報、すなわちタイプを\(\theta _{i}\)で表記します。\(\theta _{i}\)にはプレイヤー\(i\)が保有するすべての私的情報が含まれており、これは様々な値をとり得るものとします。そこで、\(\theta _{i}\)がとり得るすべての値からなる集合を\(i\)のタイプ集合(type set)と呼び、これを\(\Theta _{i}\)で表します。\(\theta _{i}\in \Theta _{i}\)です。

すべてのプレイヤーのタイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)は共有知識であるものと仮定します。プレイヤー\(i\)のタイプ\(\theta _{i}\)は自身のタイプ集合\(\Theta _{i}\)に含まれる様々な値をとり得ますが、\(\theta _{i}\)の真の値を知っているのはプレイヤー\(i\)だけであり、他の任意のプレイヤー\(j\ \left( \not=i\right) \)は\(\theta _{i}\)がとり得る値の範囲\(\Theta _{i}\)を知ってはいるが、その中のどの値が\(\theta _{i}\)の真の値であるかは知らないとみなすことにより、それぞれのプレイヤーのタイプが私的情報である状況を表現します。

すべてのプレイヤーのタイプからなる組を\(\theta _{I}=(\theta _{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちのタイプの組を\(\theta _{-i}=(\theta _{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right)\)です。

すべてのプレイヤーのタイプ集合の直積を\(\Theta _{I}=\prod_{i\in I}\Theta _{i}\)で表します。また、\(\Theta _{-i}=\prod_{j\in I\backslash \left\{ i\right\} }\Theta _{j}\)と定めます。\(\theta _{I}\in \Theta _{I}\)かつ\(\theta _{-i}\in \Theta _{-i}\)です。

例(タイプ集合)
先に例として挙げたオークションのゲームについて引き続き考えます。それぞれの入札者にとっての商品の評価額は私的情報であり、入札者は競争相手である他の入札者たちにとっての評価額を事前に観察できないものとします。この場合、仮にそれぞれの入札者が自身にとっての評価額を公言した場合でも、他の入札者はその情報の真偽を確かめるのは困難です。入札者\(i\)のタイプ\(\theta _{i}\)を、自身にとっての商品の評価額として定義します。\(\theta _{i}\)がとり得る値の最小値を\(\underline{\theta }\)、最大値を\(\overline{\theta }_{i}\)でそれぞれ表すとともに、\(\theta _{i}\)がとり得る値が連続的に変化するものと仮定するのであれば、それぞれの入札者\(i\)のタイプ集合は、\begin{equation*}
\Theta _{i}=[\underline{\theta }_{i},\overline{\theta }_{i}]\subset \mathbb{R}
\end{equation*}という\(\mathbb{R}\)上の有界な閉区間になります。任意の入札者\(i\)のタイプ集合\(\Theta _{i}\)は共有知識であるため、入札者\(j\ \left( \not=i\right) \)は競争相手である入札者\(i\)による評価額\(\theta _{i}\)がとり得る値が\(\underline{\theta }\)以上\(\overline{\theta }_{i}\)以下の実数であることを把握しています。しかし、入札者\(j\)は\(\theta _{i}\)の真の値を知らないものとみなすことにより、入札者\(i\)による評価額が入札者\(i\)の私的情報である状況を表現します。他の任意の入札者のタイプについても同様です。

すべてのプレイヤーのタイプからなる組\(\theta _{I}=(\theta _{i})_{i\in I}\)は、ゲームにおいて起こり得る 1 つの状態(state of the world)に対応しています。\(\theta _{I}\in \Theta _{I}\)であることから、すべてのプレイヤーのタイプ集合の直積\(\Theta _{I}=\prod_{i\in I}\Theta _{i}\)は、ゲームにおいて起こり得るすべての状態からなる集合です。すべてのプレイヤーのタイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)は共有知識であることから、それらの直積である\(\Theta _{I}\)もまた共有知識です。つまり、ゲームにおいて起こり得るすべての状態は、すべてのプレイヤーにとっての共有知識です。

それぞれのプレイヤー\(i\)は自身のタイプ\(\theta _{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他の任意のプレイヤー\(j\ \left( \not=i\right) \)のタイプ\(\theta _{j}\)の真の値\(\theta _{j}^{\ast }\)は知りません。プレイヤー\(i\)が他のプレイヤー\(j\)について知っていることは、\(\theta _{j}\)がとり得る値の範囲\(\Theta _{j}\)だけです。こうした事情はすべてのプレイヤーにとって同様ですので、結局、ゲームの真の状態\(\theta _{I}^{\ast }=\left( \theta _{i}^{\ast }\right) _{i\in I}\)を把握しているプレイヤーは存在しないことになります。つまり、それぞれのプレイヤー\(i\)はゲームの真の状態\(\theta _{I}^{\ast }=\left( \theta _{i}^{\ast },\theta _{-i}^{\ast }\right) \)に関する断片的な知識\(\theta _{i}^{\ast }\)を持っていますが、真の状態を構成する残りの要素\(\theta _{-i}^{\ast }\)については正確に知りません。プレイヤー\(i\)が他のプレイヤーたちについて知っていることは、他のプレイヤーたちのタイプの組\(\theta _{-i}\)がとり得る値の範囲\(\Theta _{-i}\)だけです。したがって、プレイヤー\(i\)が直面し得る状態の集合は、\begin{equation*}
\left\{ \left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta _{-i}\in \Theta _{-i}}
\end{equation*}となります。他の任意のプレイヤーについても同様の議論が成立します。

 

行動の表現

不完備情報の静学ゲームにおいてそれぞれのプレイヤーに選択肢として与えられているすべての行動からなる集合をそのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を\(A_{i}\)で表し、プレイヤー\(i\)の個々の行動を\(a_{i}\in A_{i}\)で表します。任意のプレイヤー\(i\)の行動集合\(A_{i}\)はプレイヤーたちの共有知識です。

すべてのプレイヤーの行動からなる組を\(a_{I}=(a_{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの行動の組を\(a_{-i}=(a_{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(a_{I}=\left( a_{i},a_{-i}\right) \)です。

すべてのプレイヤーの行動集合の直積を\(A_{I}=\prod_{i\in I}A_{i}\)で表します。また、\(A_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }A_{j}\)と定めます。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。

ただし、後ほど提示する例が示唆するように、不完備情報の静学ゲームではそれぞれのプレイヤーが選択可能な行動が私的情報であるような状況が起こり得ます。プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれていますので、プレイヤー\(i\)が選択可能な行動からなる集合\(A_{i}\)が私的情報であることを表現するためには、\(A_{i}\)を\(\theta _{i}\)を変数として持つ関数\(A_{i}\left( \theta _{i}\right) \)とみなすことで対応できます。ただし、この関数\(A_{i}\left( \cdot \right) \)の形状はプレイヤーたちの共有知識です。プレイヤー\(i\)のタイプ集合\(\Theta _{i}\)と行動関数\(A_{i}\left( \cdot \right) \)が共有知識であるとき、プレイヤー\(i\)がそれぞれのタイプ\(\theta _{i}\)において選択し得る行動からなる組\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)もまたプレイヤーたちの共有知識となります。しかし、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)に属するどの行動集合がプレイヤーの真の行動集合\(A_{i}\left( \theta _{i}^{\ast }\right) \)であるかを観察することはできません。このように考えることで、プレイヤー\(i\)の選択可能な行動が私的情報である状況を表現します。

例(タイプ集合)
先に例として挙げたオークションのゲームについて引き続き考えます。プレイヤー集合は\(I=\{1,2,\cdots ,n\}\)、プレイヤーである入札者\(i\in I\)のタイプ\(\theta _{i}\)は自身にとっての商品への評価額であり、タイプ集合は\(\Theta _{i}=[\underline{\theta }_{i},\overline{\theta }_{i}]\subset \mathbb{R}\)です。それぞれの入札者は売りに出されている商品への入札価格を提示するものとします。つまり、入札者\(i\)の行動\(a_{i}\)は入札価格であり、行動集合\(A_{i}\)は入札者\(i\)が提示し得る入札価格の範囲です。仮に、それぞれの入札者\(i\)は商品への評価額を上回るような価格は入札しないものと考えるのであれば、評価額\(\theta _{i}\)の水準に応じて、提示し得る入札額の範囲\(A_{i}\)に違いが生じるはずです。したがって、ここでも\(A_{i}\)は\(\theta _{i}\)を変数として持つ関数\(A_{i}\left( \theta _{i}\right) \)です。具体例を挙げると、商品への評価額が\(\theta _{i}\)の場合には入札価格をそれ以下に設定するということであれば、例えば、\begin{equation*}
A_{i}\left( \theta _{i}\right) =[0,\theta _{i}]\subset \mathbb{R}
\end{equation*}などと設定できます。つまり、商品への評価額が\(\theta _{i}\)である場合、入札者\(i\)が提示し得る入札額は\(0\)以上\(\theta _{i}\)以下の実数です。

繰り返しになりますが、プレイヤー\(i\)の行動集合が私的情報である場合には、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)ごとに行動集合\(A_{i}\left( \theta _{i}\right) \)を設定することになるため、プレイヤー\(i\)の行動集合は\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)として記述されます。一方、プレイヤー\(i\)の行動集合が私的情報ではない場合には、プレイヤー\(i\)のタイプ\(\theta _{i}\)にはプレイヤー\(i\)の行動集合に関する情報は含まれていないことになるため、ある集合\(A_{i}\)が存在して、\begin{equation*}
\forall \theta _{i}\in \Theta _{i}:A_{i}=A_{i}\left( \theta _{i}\right)
\end{equation*}という関係が成り立つはずです。つまり、プレイヤー\(i\)の行動集合が私的情報でない場合には、行動集合はタイプ\(\theta _{i}\)の値に依存せず\(A_{i}\)で一定になるということです。

後ほど詳しく解説するように、プレイヤーの行動集合が私的情報であるようなゲームが与えられたとき、一般性を失わない形で、上の条件が成立する形にゲームを変換することが常に可能です。したがって、そのような変換を念頭に置くのであれば、不完備情報の静学ゲームにおいても、任意のプレイヤー\(i\)の行動集合を\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)ではなく\(A_{i}\)と記述しても一般性は失われません。

 

結果の表現

不完備情報の静学ゲームにおいてプレイヤーたちが行動の組\(a_{I}\in A_{I}\)を選ぶと、それに対して何らかの結果が実現します。不完備情報の静学ゲームにおいて起こり得る結果を特定することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を 1 つずつ割り当てることを意味します。ただし、異なる行動の組が同一の結果をもたらす状況は起こり得ます。以上の議論より、不完備情報の静学ゲームにおいては、\(A_{I}\)を結果集合とみなしても一般性は失われません。

例(結果)
先に例として挙げたオークションのゲームについて引き続き考えます。プレイヤー集合は\(I=\{1,2,\cdots ,n\}\)、プレイヤーである入札者\(i\in I\)のタイプ\(\theta _{i}\)は自身にとっての商品への評価額であり、タイプ集合は\(\Theta _{i}=[\underline{\theta }_{i},\overline{\theta }_{i}]\subset \mathbb{R}\)です。それぞれの入札者\(i\)の行動\(a_{i}\)は売りに出されている商品への入札価格であり、それは非負の実数を値としてとり得るものとします。つまり、\(A_{i}=[0,+\infty )\)です。すべての入札者が提示する価格の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)のもとで実現し得る結果の例としては、最大の価格を入札した入札者が商品を落札し、落札者は入札額に等しい金額を支払う、というものが考えられます。単純化のために引き分けが起こらないものと仮定するならば、\(a_{i}=\max \left\{ a_{1},\cdots ,a_{n}\right\} \)を満たす入札者\(i\)が商品を落札し、自身の入札額\(a_{i}\)に等しい金額を支払うということです。他の任意の入札者は商品を落札できず、支払いも行いません。

 

利得の表現

プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が 1 つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、\(A_{I}\)に属するどの行動の組を好むかを記述しても一般性は失われません。そこで、2 つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、プレイヤー\(i\)が\(a_{I}\)のもとで実現する結果を\(a_{I}^{\prime }\)のもとで実現する結果以上に好ましいものと考える場合には、そのことを\(a_{I}\succsim _{i}a_{I}^{\prime }\)で表現します。この記号\(\succsim _{i}\)は行動の組の集合\(A_{I}\)上に定義された二項関係であり、プレイヤー\(i\)の選好関係(preference relation)と呼びます。プレイヤー\(i\)の選好\(\succsim _{I}\)が\(A_{I}\)上に定義されていることは、プレイヤー\(i\)がゲームの結果どうしを比較する評価体系は自身の行動\(a_{i}\)だけに依存するのではなく自分とは異なるプレイヤーたちの行動の組\(a_{-i}\)にも依存することを意味します。つまり、選好を上のように定義することを通じてプレイヤーの間に戦略的相互依存関係が存在する状況を表現しています。

不完備情報の静学ゲームではそれぞれのプレイヤーの選好が私的情報であるような状況が起こり得ます。むしろ、現実にはプレイヤーの選好が私的状況であることは多く、不完備情報ゲームはそのような状況を明示的に分析するために開発された分析ツールであるとさえ言えます。さて、プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれていますので、プレイヤー\(i\)の選好\(\succsim _{i}\)が私的情報であることを表現するためには、\(\succsim _{i}\)を\(\theta _{i}\)を変数として持つ関数\(\succsim _{i}\left( \theta _{i}\right) \)とみなすことで対応できます。ただし、この関数\(\succsim _{i}\left( \cdot \right) \)の形状はプレイヤーたちの共有知識です。プレイヤー\(i\)のタイプ集合\(\Theta _{i}\)と選好\(\succsim _{i}\left( \cdot \right) \)が共有知識であるとき、それぞれのタイプ\(\theta _{i}\)におけるプレイヤー\(i\)の選好からなる組\(\{\succsim _{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)もまたプレイヤーたちの共有知識となります。しかし、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\{\succsim _{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)に属するどの選好がプレイヤーの真の行動集合\(\succsim _{i}\left( \theta _{i}^{\ast }\right) \)であるかを観察することはできません。このように考えることで、プレイヤー\(i\)の選好が私的情報である状況を表現します。

後ほど提示する例が示唆するように、プレイヤー\(i\)の選好\(\succsim _{i}\)は自身の私的情報\(\theta _{i}\)に依存するだけでなく、他のプレイヤーたちの私的情報\(\theta _{-i}\)に依存して変化し得る状況も起こり得ます。そこで、それぞれのプレイヤー\(i\)の選好関係\(\succsim _{i}\)を、すべてのプレイヤーの私的情報からなる組\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \)すなわち状態を変数として持つ関数\(\succsim _{i}\left( \theta _{I}\right) \)として記述します。ただし、この関数\(\succsim _{i}\left( \cdot \right) \)の形状はプレイヤーたちの共有知識です。その上で、状態が\(\theta _{I}\)であるときに、2 つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、プレイヤー\(i\)が\(a_{I}\)のもとで実現する結果を\(a_{I}^{\prime }\)のもとで実現する結果以上に好ましいものと考える場合には、そのことを\(a_{I}\ \succsim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\)で表現します。

不完備情報の静学ゲームにおいてそれぞれのプレイヤー\(i\)の選好を記述する際には、それぞれの状態\(\theta _{I}\in \Theta _{I}\)ごとに選好\(\succsim _{i}\left( \theta _{I}\right) \)を設定することになるため、プレイヤー\(i\)の選好は\(\{\succsim _{i}\left( \theta _{I}\right) \}_{\theta _{I}\in \Theta _{I}}\)として記述されます。状態集合\(\Theta _{I}\)とプレイヤー\(i\)の選好\(\succsim _{i}\left( \cdot \right) \)が共有知識であるとき、それぞれの状態\(\theta _{I}\)におけるプレイヤー\(i\)の選好からなる組\(\{\succsim _{i}\left( \theta _{I}\right) \}_{\theta _{I}\in \Theta _{I}}\)もまたプレイヤーたちの共有知識となります。ただし、真の状態\(\theta _{I}^{\ast }\)を把握しているプレイヤーは存在しないため、\(\{\succsim _{i}\left( \theta _{I}\right) \}_{\theta _{I}\in \Theta _{I}}\)に属するどの選好がプレイヤー\(i\)の真の利得関数であるかを把握しているプレイヤーは存在しません。プレイヤー\(i\)自身も例外ではなく、真のタイプが\(\theta _{i}^{\ast }\)であるプレイヤー\(i\)が直面する自身の選好からなる集合は\(\{\succsim _{i}\left( \theta _{i}^{\ast },\theta _{-i}\right) \}_{\theta _{-i}\in \Theta _{-i}}\)であり、この中のどの選好が自分の真の選好であるかを事前に知ることはできません。

状態\(\theta _{I}\)におけるプレイヤー\(i\)の選好関係\(\succsim _{i}\left( \theta _{I}\right) \)が与えられたとき、行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\ \succ _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\ \overset{def}{\Leftrightarrow }\ a_{I}\ \succsim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\ \wedge \ \lnot \left( a_{I}^{\prime }\ \succsim _{i}\left( \theta _{I}\right) \ a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\left( \theta _{I}\right) \)を定義します。つまり、状態\(\theta _{I}\)において、プレイヤー\(i\)にとって\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましく、なおかつ、\(a_{I}^{\prime }\)が\(a_{I}\)以上に望ましくない場合にはそのことを\(a_{I}\ \succ _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\)で表現するということです。言い換えると、\(a_{I}\ \succ _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\)とは、状態\(\theta _{I}\)において、プレイヤー\(i\)にとって\(a_{I}\)のもとで実現する結果が\(a_{I}^{\prime }\)のもとで実現する結果より望ましいことを意味します。この二項関係\(\succ _{i}\left( \theta _{I}\right) \)を状態\(\theta _{I}\)におけるプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。

状態\(\theta _{I}\)におけるプレイヤー\(i\)の選好関係\(\succsim _{i}\left( \theta _{I}\right) \)が与えられたとき、行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\ \sim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\ \overset{def}{\Leftrightarrow }\ a_{I}\ \succsim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\ \wedge \ a_{I}^{\prime }\ \succsim _{i}\left( \theta _{I}\right) \ a_{I}
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\left( \theta _{I}\right) \)を定義します。つまり、状態\(\theta _{I}\)において、プレイヤー\(i\)にとって\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましく、なおかつ、\(a_{I}^{\prime }\)が\(a_{I}\)以上に望ましい場合にはそのことを\(a_{I}\ \sim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\)で表現するということです。言い換えると、\(a_{I}\ \sim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\)とは、状態\(\theta _{I}\)において、プレイヤー\(i\)にとって\(a_{I}\)のもとで実現する結果と\(a_{I}^{\prime }\)のもとで実現する結果が同じ程度望ましいことを意味します。この二項関係\(\sim _{i}\left( \theta _{I}\right) \)を状態\(\theta _{I}\)におけるプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。

例(選好)
先に例として挙げたオークションのゲームについて引き続き考えます。プレイヤー集合は\(I=\{1,2,\cdots ,n\}\)、プレイヤーである入札者\(i\in I\)のタイプ\(\theta _{i}\)は自身にとっての商品への評価額であり、タイプ集合は\(\Theta _{i}=[\underline{\theta }_{i},\overline{\theta }_{i}]\subset \mathbb{R}\)です。それぞれの入札者\(i\)の行動\(a_{i}\)は売りに出されている商品への入札価格であり、行動集合は\(A_{i}=[0,+\infty )\)です。入札者たちが提示する価格の組が\(a_{I}=\left( a_{i}\right) _{i\in I}\)であるとき、\(a_{i}=\max \left\{ a_{1},\cdots ,a_{n}\right\} \)を満たす入札者\(i\)が商品を落札し、自身の入札額\(a_{i}\)に等しい金額を支払います。他の任意の入札者は商品を落札できず、支払いも行いません。それぞれの入札者\(i\)が落札した商品を事後的に転売しようと考えている場合や、商品から得られる満足が他の人たちによる商品への評価によって左右されるのであれば、入札者\(i\)の選好\(\succsim _{i}\)は自身にとっての評価額\(\theta _{i}\)だけでなく、他の入札者たちにとっての評価額\(\theta _{-i}\)にも依存するため、入札者\(i\)の選好は\(\succsim _{i}\left( \theta _{I}\right) \)と定式化できます。さらに、入札者\(i\)は商品の価値を、すべての入札者による評価額の平均値\begin{equation}
\frac{\sum_{i=1}^{n}\theta _{i}}{n} \tag{1}
\end{equation}として推定するものとします。このような想定のもとで、ベンチマークとして以下の 2 つの行動の組について考えます。1 つ目は、入札者\(i\)の入札額は\(0\)で、他の任意の入札者\(j\ \left( \not=i\right) \)の入札額が\(10\)であるような組\begin{equation*}
a_{I}=\left( a_{1},\cdots ,a_{i},\cdots ,a_{n}\right) =\left( 10,\cdots ,0,\cdots ,10\right)
\end{equation*}であり、2 つ目は、入札者\(i\)の入札額は\(50\)で、他の任意の入札者\(j\)の入札額が\(10\)であるような組\begin{equation*}
a_{I}^{\prime }=\left( a_{1},\cdots ,a_{i},\cdots ,a_{n}\right) =\left( 10,\cdots ,50,\cdots ,10\right)
\end{equation*}です。さて、入札者\(i\)による財への評価額が\(10\)で、他の任意の入札者\(j\)による評価額が\(0\)であるような状態\begin{equation*}
\theta _{I}=\left( \theta _{1},\cdots ,\theta _{i},\cdots ,\theta _{n}\right) =\left( 10,\cdots ,0,\cdots ,10\right)
\end{equation*}においては、\(n\)が十分大きいとき、先の推定評価額\(\left( 1\right) \)はおよそ\(0\)であるため、入札者\(i\)にとって、商品を落札して\(50\)を支払うよりも、商品を落札しないことのほうが明らかに望ましいです。つまり、\(a_{I}\ \succ _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }\)が成り立ちます。一方、入札者\(i\)による財への評価額が\(10\)で、他の任意の入札者\(j\)による評価額が\(100\)であるような状態\begin{equation*}
\theta _{I}^{\prime }=\left( \theta _{1},\cdots ,\theta _{i},\cdots ,\theta _{n}\right) =\left( 10,\cdots ,0,\cdots ,10\right)
\end{equation*}においては、\(n\)が十分大きいとき、先の推定評価額\(\left( 1\right) \)はおよそ\(100\)であるため、入札者\(i\)にとって、商品を落札しないことよりも、商品を落札して\(50\)を支払うほうが明らかに望ましいです。つまり、\(a_{I}^{\prime }\ \succ _{i}\left( \theta _{I}^{\prime }\right) \ a_{I}\)が成り立ちます。\(\theta _{i}=\theta _{i}^{\prime }\)であるため、\(\theta _{I}\)と\(\theta _{I}^{\prime }\)の違いは他の入札者たちのタイプ\(\theta _{-i},\theta _{-i}^{\prime }\)の違いに起因しています。したがって、上の例では、入札者\(i\)の選好\(\succsim _{i}\)が自身のタイプ\(\theta _{i}\)だけでなく他の入札者たちのタイプ\(\theta _{-i}\)にも依存する形になっています。

状態\(\theta _{I}\)におけるプレイヤー\(i\)の選好関係\(\succsim _{i}\left( \theta _{I}\right) \)が与えられたとき、それに対してある関数\(u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R}\)が存在して、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
u_{i}\left( a_{I},\theta _{I}\right) \geq u_{i}\left( a_{I}^{\prime },\theta _{I}\right) \ \Leftrightarrow \ a_{I}\ \succsim _{i}\left( \theta _{I}\right) \ a_{I}^{\prime }
\end{equation*}という関係が成り立つ場合には、\(u_{i}\left( \cdot ,\theta _{I}\right) \)を\(\succsim _{i}\left( \theta _{I}\right) \)を表現する利得関数(payoff function)と呼びます。さらに、プレイヤー\(i\)の利得関数\(u_{i}\left( \theta _{I}\right) \)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I},\theta _{I}\right) \)を、状態\(\theta _{I}\)においてプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。

 

行動集合を共有知識とみなすことができる根拠

繰り返しになりますが、プレイヤー\(i\)の行動集合が私的情報である場合には、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)ごとに行動集合\(A_{i}\left( \theta _{i}\right) \)を設定することになるため、プレイヤー\(i\)の行動集合は\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)として記述されます。しかし、利得関数を上手く変換することにより、それぞれのプレイヤーの行動集合が私的情報であるようなモデルを、プレイヤーの行動集合がプレイヤーたちの共有知識であるようなモデルへ変換することができます。

具体的には、プレイヤー\(i\)の行動集合が\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)として記述されるとき、新たな行動集合\(A_{i}\)を、\begin{equation*}
A_{i}=\bigcup\limits_{\theta _{i}\in \Theta _{i}}A_{i}\left( \theta _{i}\right)
\end{equation*}と定義します。つまり、この集合\(A_{i}\)にはプレイヤー\(i\)がそれぞれのタイプ\(\theta _{i}\)のもとで選択し得るすべての行動が含まれています。プレイヤー\(i\)の特定のタイプ\(\theta _{i}\)を任意に選びます。このとき、プレイヤー\(i\)が選択可能な行動からなる集合は\(A_{i}\left( \theta _{i}\right) \)ですが、これは\(A_{i}\)の部分集合であるため、\(A_{i}\)の中には\(\theta _{i}\)のもとでプレイヤー\(i\)が選択不可能な行動が含まれている可能性があります。そのような任意の行動を\(a_{i}\in A_{i}\backslash A_{i}\left( \theta _{i}\right) \)で表す。このとき、他のプレイヤーたちの任意のタイプの組\(\theta _{-i}\in \Theta _{-i}\)に対して、\begin{equation*}
u_{i}\left( a_{i},\theta _{i},\theta _{-i}\right) =-\infty
\end{equation*}と定めるのであれば、タイプ\(\theta _{i}\)のプレイヤー\(i\)はこの行動\(a_{i}\)を選ぶ可能性を排除できます。したがって、このような仮定のもとでは、プレイヤー\(i\)の行動集合\(A_{i}\)から先の行動\(a_{i}\)は実質的に取り除かれています。同様の議論は、\(A_{i}\backslash A_{i}\left( \theta _{i}\right) \)に属する任意の行動に対しても可能です。

議論を整理します。それぞれのプレイヤー\(i\)の行動集合からなる組\(\left\{ A_{i}\left( \theta _{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}\)に対して先のように\(A_{i}\)を定義します。プレイヤー\(i\)の行動集合は自身のタイプ\(\theta _{i}\)に依存せず常に\(A_{i}\)であり、この\(A_{i}\)はプレイヤーたちの共有知識であるものとします。その上で、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)について、\begin{equation*}
\forall a_{i}\in A_{i}\backslash A_{i}\left( \theta _{i}\right) ,\ \forall \theta _{-i}\in \Theta _{-i}:u_{i}\left( a_{i},\theta _{i},\theta _{-i}\right) =-\infty
\end{equation*}が成り立つものと仮定します。このとき、プレイヤー\(i\)が直面する行動集合は\(A_{i}\)ですが、それぞれのタイプ\(\theta _{i}\)において実質的に選択対象となり得る行動からなる集合は\(A_{i}\left( \theta _{i}\right) \)に限定されます。したがって、このような変換を行えば、プレイヤー\(i\)の行動集合を自身のタイプ\(\theta _{i}\)に依存しない集合\(A_{i}\)とみなしても一般性は失われません。

 

ベイジアンゲーム

繰り返しになりますが、不完備情報の静学ゲームを記述するためにはプレイヤー、行動、情報、結果、利得をそれぞれ具体的に特定する必要があります。ゲームのプレイヤーをプレイヤー集合\(I\)によって表現可能であり、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)によって表現可能です。不完備情報の静学ゲームである非対称的な情報構造はそれぞれのプレイヤー\(i\)のタイプ集合\(\Theta _{i}\)を通じて表現します。プレイヤーたちのそれぞれの行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が 1 つずつ対応しており、状態\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \in \Theta _{I}\)においてプレイヤー\(i\)がそれぞれの結果から得る利得は\(\theta _{I}\)のもとでの利得関数\(u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R}\)として表現可能です。それぞれの状態におけるプレイヤー\(i\)の利得関数からなる組を\(u_{i}=\{u_{i}\left( \cdot ,\theta _{I}\right) \}_{\theta _{I}\in \Theta _{I}}\)で表します。そこで、これらの要素からなるモデルを、\begin{equation*}
G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ \Theta _{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}で表し、これをベイジアンゲーム(Bayesian game)と呼びます。

ベイジアンゲーム\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。それぞれのプレイヤー\(i\in I\)は自身のタイプ\(\theta _{i}\in \Theta _{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他の任意のプレイヤー\(j\ \left( \not=i\right) \)のタイプ\(\theta _{j}\in \Theta _{j}\)の真の値\(\theta _{j}^{\ast }\)は知りません。プレイヤー\(i\)が他のプレイヤー\(j\)について知っていることは、\(\theta _{j}\)がとり得る値の範囲\(\Theta _{j}\)だけです。したがって、プレイヤー\(i\)が直面し得る状態の集合は、\begin{equation*}
\left\{ \left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta _{-i}\in \Theta _{-i}}
\end{equation*}となります。他の任意のプレイヤーについても同様の議論が成立します。

また、ゲームの静学性と不完備性より、プレイヤーたちは以下の手順で意志決定を行います。

  1. 自身の真のタイプ\(\theta _{i}^{\ast }\)を知るが他のプレイヤーたちの真のタイプ\(\theta _{-i}^{\ast }\)を知らないそれぞれのプレイヤー\(i\)は自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択した行動を選択できない。
  2. プレイヤーたちが選択した行動の組\(a_{I}\)に対して、ゲームのルールが結果を定める。
  3. 真の状態\(\theta _{I}^{\ast }\)とプレイヤーたちが選択した行動の組\(a_{I}\)に応じて、それぞれのプレイヤー\(i\)は利得\(u_{i}\left( a_{I},\theta _{I}^{\ast }\right) \)を得る。

次回はベイジアンゲームの中でも私的価値モデルと呼ばれるクラスのゲームについて解説します。

次へ進む 質問・コメントを投稿する 演習問題(プレミアム会員限定)

ワイズをさらに活用するための会員サービス

ユーザー名とメールアドレスを入力して一般会員に無料登録すれば、質問やコメントを投稿できるようになります。さらに、有料(500円/月)のプレミアム会員へアップグレードすることにより、プレミアムコンテンツ(命題の証明や演習問題、解答など)にアクセスできます。
会員サービス

ディスカッションに参加しますか?

質問やコメントを投稿するにはログインが必要です。
ログイン

アカウント
ログイン