教材一覧
教材一覧
教材検索
STATIC GAME OF INCOMPLETE INFORMATION

ベイジアンゲームの定義

目次

< 前のページ
次のページ >
Share on twitter
Twitterで共有
Share on email
メールで共有

不完備情報の静学ゲーム

ゲーム理論(game theory)は戦略的相互依存性(strategic interdependence)が存在する状況を分析対象とする学問です。戦略的相互依存性が存在する状況とは、複数の主体が関わり合う場面において、それぞれの主体が最終的に直面する結果が自身の行動だけによって決まるのではなく、他の主体による行動にも依存するような状況を指します。戦略的相互依存関係が成立する状況をモデル化する際には、以下の要素を具体的に記述します。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
  2. プレイヤーたちはどのような順番(turn)で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)を選択可能か。
  4. プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどのように評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。

以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。

戦略的相互依存関係に直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、プレイヤーたちはグループを作って互いに協力的な意志決定を行う可能性があります。そして、その場合の意思決定は、プレイヤーたちの間に拘束的な合意が成立しない場合の意思決定とは異なるものになり得ます。ですから、戦略的相互依存関係を分析する際には、プレイヤーたちの間に拘束的な合意が成立するか否かを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しないようなゲームです。非協力ゲームではプレイヤーたちの間に拘束的な合意が成立しないため、それぞれのプレイヤーは他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。したがって、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。

ゲームに参加するすべてのプレイヤーが同時に意思決定を行うとき、そのゲームを静学ゲーム(static game)や同時手番ゲーム(simultaneous move game)などと呼びます。本節の分析対象は静学ゲームです。静学ゲームという概念はゲームのルールの中でも「順番」を基準にゲームを分類することで得られる概念ですが、「情報」によって静学ゲームという概念を特徴づけることもできます。具体的には、プレイヤーたちが同時に意思決定を行うことは、それぞれのプレイヤーが意思決定を行う際に、他のプレイヤーたちが行った意思決定を事前に観察できないことと実質的に同じです。したがって、静学ゲームを「それぞれのプレイヤーが意志決定を行う際に他のプレイヤーたちが行った意志決定に関する情報を与えられないゲーム」と定義することもできます。

戦略的相互依存関係に直面したそれぞれのプレイヤーは、自分が直面しているゲームのルールを常に正確に把握できるとは限りません。戦略的相互依存関係を分析する際には、それぞれのプレイヤーがゲームのルールにどの程度精通しているかを事前に明らかにしておく必要があります。本節の分析対象である不完備情報ゲーム(game of incomplete information)とは、少なくとも1人のプレイヤーがゲームのルールを構成する少なくとも1つの要素を知らないようなゲームのことです。不完備情報ゲームのプレイヤーが保有するゲームのルールに関する情報のうち、そのプレイヤーだけが観察可能で他のプレイヤーたちが観察できないものを、そのプレイヤーが持つ私的情報(private information)やタイプ(type)などと呼びます。少なくとも1人のプレイヤーが私的情報を持つ場合には、プレイヤーたちが直面する情報構造は対称的ではないため、情報の非対称性(asymmetric information)が存在すると表現します。不完備情報ゲームは情報の非対称性が成立する戦略的状況です。

本節の分析対象は非協力かつ静学かつ不完備情報であるようなゲームです。これを不完備情報の静学ゲーム(static games of incomplete information)と呼びます。不完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は他のプレイヤーたちの意思決定からは独立した形で行われます。不完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」は明らかです。つまり、不完備情報の静学ゲームおいて、すべてのプレイヤーは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちが選択する行動を観察できない状態で自身の行動を決定する必要があります。以上を踏まえると、不完備情報の静学ゲームを記述するためには、ゲームのルールの残りの要素である「プレイヤー」「行動」「情報」「結果」「利得」を特定すればよいということになります。これらの要素を記述する方法はいくつか存在しますが、以下ではベイジアンゲーム(Bayesian game)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

不完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを\(I\)で表記します。プレイヤー集合\(I\)はすべてのプレイヤーにとっての共有知識であるものと仮定します。

\(n\)人のプレイヤーが参加するゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を\(I=\{1,2,\cdots ,n\}\)で表します。また、プレイヤー集合\(I\)に属する\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

戦略的相互依存関係は複数のプレイヤーが存在することで初めて成立する状況であるため、プレイヤーの人数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数\(n\)は\(2\)以上の整数と仮定します。

プレイヤーの単位として何を採用するかは分析対象となる戦略的相互依存関係に応じて変化します。個人をプレイヤーの単位とする場合もあれば、組織や国家などをプレイヤーの単位とする場合もあります。プレイヤーの単位を決定する上で重要なことは、ゲームにおいて自律的な意思決定を行う最小単位がプレイヤーであるということです。もう1つの重要な点は、その主体が戦略的相互依存関係に直面する中で意思決定を行う主体であるということです。したがって、他の主体との関係性の中で意思決定を行うのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。

例(プレイヤー集合)
ある産業への参入を検討している複数の企業による意思決定を分析する場合、このゲームのプレイヤー集合\(I\)はすべての潜在的参入企業からなる集合です。そのような企業が\(2\)社あるならば\(I=\left\{ 1,2\right\} \)となります。
例(プレイヤー集合)
1つの商品をめぐって複数の人たちが入札を行うオークションを分析する場合、このゲームのプレイヤー集合\(I\)はすべての入札者からなる集合です。入札者が\(n\)人いるならば\(I=\left\{ 1,\cdots ,n\right\} \)となります。ただし、状況によっては商品の売り手をプレイヤーをみなした上で分析を行います。

 

私的情報の表現

不完備情報ゲームでは、少なくとも1人のプレイヤーはゲームのルールを構成する少なくとも1つの要素を知りませんが、このような状況をどのように表現すればよいでしょうか。

問題としているゲームのルールを構成する要素のうち、あるプレイヤー\(i\in I\)だけが観察可能で、他のプレイヤーが観察できない要素をプレイヤー\(i\)の私的情報(privateinformation)やタイプ(type)などと呼び、これを\(\theta _{i}\)で表記します。\(\theta _{i}\)にはプレイヤー\(i\)が保有するすべての私的情報が含まれており、これは様々な値をとり得るものとします。そこで、\(\theta _{i}\)がとり得るすべての値からなる集合を\(i\)のタイプ集合(type set)と呼び、これを\(\Theta _{i}\)で表します。\(\theta _{i}\in \Theta _{i}\)です。

すべてのプレイヤーのタイプ集合\(\Theta _{1},\cdots ,\Theta_{n}\)は共有知識であるものと仮定します。プレイヤー\(i\)のタイプ\(\theta_{i}\)は自身のタイプ集合\(\Theta _{i}\)に含まれる様々な値をとり得ますが、\(\theta _{i}\)の真の値を知っているのはプレイヤー\(i\)だけであり、他の任意のプレイヤー\(j\ \left(\not=i\right) \)は\(\theta _{i}\)がとり得る値の範囲\(\Theta _{i}\)を知ってはいるが、その中のどの値が\(\theta _{i}\)の真の値であるかは知らないとみなすことにより、それぞれのプレイヤーのタイプが私的情報である状況を表現します。

すべてのプレイヤーのタイプからなる組を\(\theta _{I}=(\theta _{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちのタイプの組を\(\theta _{-i}=(\theta _{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \)です。

すべてのプレイヤーのタイプ集合の直積を\(\Theta _{I}=\prod_{i\in I}\Theta _{i}\)で表します。また、\(\Theta _{-i}=\prod_{j\in I\backslash \left\{ i\right\} }\Theta _{j}\)と定めます。\(\theta _{I}\in \Theta _{I}\)かつ\(\theta _{-i}\in\Theta _{-i}\)です。

例(タイプ集合)
先の新規参入問題の例において、それぞれの企業の技術水準は私的情報であり、競争相手の企業はそれを事前に観察できないものとします。この場合、仮にそれぞれの企業が自社の技術水準を公言した場合でも、他の企業はその情報の真偽を確かめるのは困難です。企業\(i\)のタイプ\(\theta_{i}\)を、自社の技術水準として定義します。\(\theta _{i}\)は高技術\(h\)と低技術\(l\)の2つの値をとり得るものと仮定するのであれば、企業\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left\{ h,l\right\}
\end{equation*}という離散型の有限集合になります。任意の企業\(i\)のタイプ集合\(\Theta _{i}\)は共有知識であるため、企業\(j\ \left( \not=i\right) \)は競争相手である企業\(i\)の技術水準\(\theta _{i}\)がとり得る値が\(h\)と\(l\)のどちらか一方であることを把握しています。しかし、\(\theta _{i}\)の真の値を知っているのは企業\(i\)だけであり、企業\(j\)は\(\theta _{i}\)の真の値を知らないものとみなすことにより、企業\(i\)の技術水準が企業\(i\)の私的情報である状況を表現します。他の任意の企業のタイプについても同様です。
例(タイプ集合)
先のオークションの例において、それぞれの入札者にとって商品への評価額は私的情報であり、競争相手である他の入札者はそれを事前に観察できないものとします。この場合、仮にそれぞれの入札者が自身にとっての商品の評価額を公言した場合でも、他の入札者はその情報の真偽を確かめるのは困難です。入札者\(i\)のタイプ\(\theta _{i}\)を、自身にとっての商品の評価額として定義します。\(\theta _{i}\)は\(\underline{\theta }_{i}\)以上\(\overline{\theta }_{i}\)以下の任意の実数を値としてとり得るものと仮定するのであれば、入札者\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \end{equation*}という\(\mathbb{R} \)上の有界な閉区間になります。任意の入札者\(i\)のタイプ集合\(\Theta_{i}\)は共有知識であるため、入札者\(j\ \left( \not=i\right) \)は競争相手である入札者\(i\)による評価額\(\theta _{i}\)がとり得る値が\(\underline{\theta }_{i}\)以上\(\overline{\theta }_{i}\)以下の実数であることを把握しています。しかし、\(\theta _{i}\)の真の値を知っているのは入札者\(i\)だけであり、入札者\(j\)は\(\theta _{i}\)の真の値を知らないものとみなすことにより、入札者\(i\)による商品への評価額が入札者\(i\)の私的情報である状況を表現します。他の任意の入札者のタイプについても同様です。

すべてのプレイヤーのタイプからなる組\(\theta _{I}=(\theta _{i})_{i\in I}\)を、ゲームにおいて起こり得る状態(state of the world)と呼びます。\(\theta _{I}\in \Theta _{I}\)であることから、\(\Theta _{I}\)はゲームにおいて起こり得るすべての状態からなる集合です。すべてのプレイヤーのタイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)は共有知識であることから、それらの直積である\(\Theta _{I}\)もまた共有知識です。つまり、ゲームにおいて起こり得るすべての状態は、すべてのプレイヤーにとっての共有知識です。

それぞれのプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他の任意のプレイヤー\(j\ \left( \not=i\right) \)のタイプ\(\theta _{j}\)の真の値\(\theta_{j}^{\ast }\)を知りません。プレイヤー\(i\)が他のプレイヤー\(j\)について知っていることは、\(\theta _{j}\)がとり得る値の範囲\(\Theta _{j}\)だけです。こうした事情はすべてのプレイヤーにとって同様ですので、結局、ゲームの真の状態\(\theta _{I}^{\ast}=\left( \theta _{i}^{\ast }\right) _{i\in I}\)を把握しているプレイヤーは存在しないことになります。つまり、それぞれのプレイヤー\(i\)はゲームの真の状態\(\theta _{I}^{\ast }=\left( \theta _{i}^{\ast },\theta _{-i}^{\ast}\right) \)に関する断片的な知識\(\theta _{i}^{\ast }\)を持っていますが、真の状態を構成する残りの要素\(\theta _{-i}^{\ast }\)については正確に知りません。プレイヤー\(i\)が他のプレイヤーたちについて知っていることは、他のプレイヤーたちのタイプの組\(\theta _{-i}\)がとり得る値の範囲\(\Theta _{-i}\)だけです。したがって、プレイヤー\(i\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}}
\end{equation*}となります。他の任意のプレイヤーについても同様の議論が成立します。

例(状態集合)
先の新規参入問題の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれの企業\(i\in I\)のタイプ集合が\(\Theta _{i}=\left\{ h,l\right\} \)であるものとします。この場合、起こり得る状態\(\left( \theta _{1},\theta _{2}\right) \)からなる集合\(\Theta _{I}\)は、\begin{equation*}\left\{ \left( h,h\right) ,\left( h,l\right) ,\left( l,h\right) ,\left(
l,l\right) \right\}
\end{equation*}です。仮に企業\(1\)の真の技術水準が\(h\)である場合、企業\(1\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( h,h\right) ,\left( h,l\right) \right\}
\end{equation*}です。一方、企業\(1\)の真の技術水準が\(l\)である場合、企業\(1\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( l,h\right) ,\left( l,l\right) \right\}
\end{equation*}です。企業\(2\)についても同様に考えます。
例(状態集合)
先のオークションの例において、プレイヤー集合が\(I=\left\{ 1,\cdots ,n\right\} \)であるとともに、それぞれの入札者\(i\in I\)のタイプ集合が\(\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \)であるものとします。この場合、起こり得る状態\(\left( \theta _{1},\theta _{2}\right) \)からなる集合\(\Theta _{I}\)は、\begin{equation*}\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \times \left[
\underline{\theta }_{2},\overline{\theta }_{2}\right] \end{equation*}です。仮に入札者\(1\)による商品への真の評価額が\(1\)である場合、入札者\(1\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( 1,\theta _{2}\right) \ |\ \theta _{2}\in \left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \right\}
\end{equation*}です。なぜなら、入札者\(1\)は自身にとっての真の評価額\(1\)を知っている一方で、入札者\(2\)による真の評価額が\(\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \)の中のどの値であるかを事前に観察できないからです。他のケースについても同様に考えます。

 

行動の表現

不完備情報の静学ゲームにおいてそれぞれのプレイヤーに選択肢として与えられているすべての行動からなる集合をそのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を\(A_{i}\)で表し、プレイヤー\(i\)の個々の行動を\(a_{i}\in A_{i}\)で表します。

すべてのプレイヤーの行動からなる組を\(a_{I}=(a_{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの行動の組を\(a_{-i}=(a_{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(a_{I}=\left( a_{i},a_{-i}\right) \)です。

すべてのプレイヤーの行動集合の直積を\(A_{I}=\prod_{i\in I}A_{i}\)で表します。また、\(A_{-i}=\prod_{j\in I\backslash \left\{ i\right\}}A_{j}\)と定めます。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。

例(行動集合)
先の新規参入問題の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれの企業\(i\in I\)のタイプ集合が\(\Theta _{i}=\left\{ h,l\right\} \)であるものとします。それぞれの企業\(i\)は問題としている産業に参入する(entryの頭文字である\(e\)で表記する)もしくは参入しない(not entryの頭文字である\(n\)で表記する)という選択が可能であるならば、そのような状況を、\begin{equation*}A_{i}=\left\{ e,n\right\}
\end{equation*}と表現できます。

不完備情報の静学ゲームでは、それぞれのプレイヤーにとって選択可能な行動が私的情報であるような状況も起こり得ます。つまり、タイプの定義より、プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれているため、プレイヤー\(i\)が選択可能な行動からなる集合\(A_{i}\)が私的情報であることを表現するためには、\(A_{i}\)の要素が\(\theta _{i}\)の値に依存して変化するものとみなすことで対応できます。そのことを\(A_{i}\left( \theta _{i}\right) \)と表記します。ただ、\(A_{i}\left(\cdot \right) \)の形状はプレイヤーたちの共有知識です。プレイヤー\(i\)のタイプ集合\(\Theta _{i}\)と\(A_{i}\left(\cdot \right) \)が共有知識であるとき、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)であるときの行動集合\(A_{i}\left( \theta _{i}\right) \)もまたプレイヤーたちの共有知識になります。任意の\(\theta _{i}\)について同様の議論が成り立つため、プレイヤー\(i\)が直面し得る行動集合からなる集合\(\left\{ A_{i}\left( \theta _{i}\right)\right\} _{\theta _{i}\in \Theta _{i}}\)もまたプレイヤーたちの共有知識です。ただ、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\{A_{i}\left(\theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)に属するどの行動集合がプレイヤー\(i\)の真の行動集合\(A_{i}\left( \theta _{i}^{\ast }\right) \)であるかを観察することはできません。このように考えることにより、プレイヤー\(i\)の選択可能な行動が私的情報である状況を表現します。

例(行動集合)
先のオークションの例において、プレイヤー集合が\(I=\left\{ 1,\cdots ,n\right\} \)であるとともに、それぞれの入札者\(i\in I\)のタイプ集合が\(\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \)であるものとします。オークションにおいてそれぞれの入札者\(i\)は商品への入札価格を提示するものとします。つまり、入札者\(i\)の行動\(a_{i}\)は入札価格であり、行動集合\(A_{i}\)は入札者\(i\)が提示し得る入札価格の範囲です。入札額は非負の実数でなければならないというオークションルールが設定されているものとします。また、入札者\(i\)は商品への評価額\(\theta _{i}\)を上回るような価格を入札する可能性を排除できるのであれば(例えば、入札者は代理人であり、雇い主からそのように命じられている場合)、そのような状況を、\begin{equation*}A_{i}\left( \theta _{i}\right) =\left[ 0,\theta _{i}\right] \end{equation*}と表現できます。つまり、商品への評価額が\(\theta _{i}\)である場合、入札者\(i\)が提示し得る入札額は\(0\)以上\(\theta _{i}\)以下の実数であるということです。

繰り返しになりますが、プレイヤー\(i\)の行動集合が私的情報である場合、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)ごとに行動集合\(A_{i}\left( \theta _{i}\right) \)を設定することになるため、プレイヤー\(i\)の行動集合を総体的に\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)と記述することになります。一方、プレイヤー\(i\)の行動集合が私的情報ではない場合には、プレイヤー\(i\)のタイプ\(\theta _{i}\)にはプレイヤー\(i\)の行動集合に関する情報は含まれていないことになるため、ある集合\(A_{i}\)が存在して、\begin{equation*}\forall \theta _{i}\in \Theta _{i}:A_{i}=A_{i}\left( \theta _{i}\right)
\end{equation*}という関係が成り立つはずです。つまり、プレイヤー\(i\)の行動集合が私的情報でない場合には、行動集合はタイプ\(\theta _{i}\)の値に依存せず\(A_{i}\)で一定です。

後ほど詳しく解説するように、プレイヤーの行動集合が私的情報であるようなゲームが与えられたとき、一般性を失わない形で、上の条件が成立する形にゲームを変換することができます。したがって、そのような変換を踏まえると、不完備情報の静学ゲームにおいて任意のプレイヤー\(i\)の行動集合を\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)ではなく\(A_{i}\)と記述しても一般性は失われません。

例(行動集合)
先のオークションの例において、一定の仮定のもとでは、任意の入札者\(i\in I\)の行動集合を、\begin{equation*}A_{i}=[0,+\infty )
\end{equation*}と仮定しても一般性は失われません(理由は後述します)。つまり、任意の入札者は任意の非負の実数を入札できるということです。

 

結果の表現

不完備情報の静学ゲームにおいてプレイヤーたちが行動の組\(a_{I}\in A_{I}\)を選ぶと、それに対して何らかの結果が実現します。不完備情報の静学ゲームにおいて起こり得る結果を特定することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を1つずつ割り当てることを意味します。ただし、異なる行動の組が同一の結果をもたらす状況は起こり得ます。

例(結果)
先の新規参入問題の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれの企業\(i\in I\)のタイプ集合が\(\Theta _{i}=\left\{ h,l\right\} \)であり、行動集合は\(A_{i}=\left\{ e,n\right\} \)であるものとします。両企業が提示する行動の組のもとで実現し得る結果の例としては以下のようなものがあります。まず、\(\left( a_{1},a_{2}\right) =\left(e,e\right) \)の場合、すなわち両企業が参入する場合には、両企業が市場の利益を二等分します。また、\(\left( a_{1},a_{2}\right)=\left( e,n\right) ,\left( n,e\right) \)の場合、すなわち一方が参入し他方が参入する場合には、参入した企業が市場の利益を独占し、参入しなかった企業は利益を得られません。最後に、\(\left( a_{1},a_{2}\right) =\left( n,n\right) \)の場合、すなわち両社が参入しなかった場合には両社とも利益を得られません。
例(結果)
先のオークションの例において、プレイヤー集合が\(I=\left\{ 1,\cdots ,n\right\} \)であるとともに、それぞれの入札者\(i\in I\)のタイプ集合が\(\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \)であり、行動集合は\(A_{i}=[0,+\infty )\)であるものとします。入札者たちが提示する入札額の組\(a_{I}=\left(a_{i}\right) _{i\in I}\)のもとで実演し得る結果の例としては、最大の入札額を提示した入札者が商品を落札し、落札者は入札額に等しい金額を支払う、というものが考えられます。引き分けの場合にはその中から1人をランダムに選びます。つまり、\begin{equation*}a_{i}=\max \left\{ a_{1},\cdots ,a_{n}\right\}
\end{equation*}を満たす1人の入札者\(i\)が商品を落札し、自身の入札額\(a_{i}\)に等しい金額を支払うということです。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも行いません。

 

利得の表現

プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\)が持つ好みの体系を行動の組からなる集合\(A_{I}\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succsim _{i}a_{I}^{\prime }\Leftrightarrow \text{プレイヤー}i\text{は}a_{I}\text{を}a_{I}^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(a_{I}\)(のもとで実現する結果)を\(a_{I}^{\prime }\)(のもとで実現する結果)以上に好むとき、そしてその場合にのみ\(a_{I}\succsim _{i}a_{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むとは、\(a_{I}\)を\(a_{I}^{\prime }\)よりも好むか、または\(a_{I}\)と\(a_{I}^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succ _{i}a_{I}^{\prime }\Leftrightarrow \left[ a_{I}\succsim
_{i}a_{I}^{\prime }\wedge \lnot \left( a_{I}^{\prime }\succsim
_{i}a_{I}\right) \right] \end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むが\(a_{I}^{\prime }\)を\(a_{I}\)以上には好まないとき、そしてその場合にのみ\(a_{I}\succ _{i}a_{I}^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\sim _{i}a_{I}^{\prime }\Leftrightarrow \left( a_{I}\succsim
_{i}a_{I}^{\prime }\wedge a_{I}^{\prime }\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むと同時に\(a_{I}^{\prime }\)を\(a_{I}\)以上に好むとき、そしてその場合にのみ\(a_{I}\sim _{i}a_{I}^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、ある関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)が存在して、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}という関係が成り立つ場合には、この関数\(u_{i}\)のことを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。また、利得関数\(u\)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)をプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。つまり、選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、行動の組\(a_{I},a_{I}^{\prime }\)について\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましいことと、\(a_{I}\)の利得が\(a_{I}^{\prime }\)の利得以上であることが必要十分になります。言い換えると、利得関数を用いれば、行動の組の間の相対的な望ましさを、行動の組がもたらす利得の大小関係として表現できるということです。ちなみに、選好関係\(\succsim_{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{eqnarray*}u_{i}\left( a_{I}\right) &>&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succ _{i}a_{I}^{\prime } \\
u_{i}\left( a_{I}\right) &=&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\sim _{i}a_{I}^{\prime }
\end{eqnarray*}という関係もまた成立します。

プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)の効用\(u_{i}\left( a_{I}\right)=u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく自分とは異なるプレイヤーたちの行動の組\(a_{-i}\)にも依存することを意味します。つまり、利得関数を上のように定義することを通じて、プレイヤー間に戦略的相互依存関係が存在する状況を表現しています。

一般に、プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。ただ、利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。いずれにせよ、以降では利得関数を用いて議論を行います。

後ほど提示する例が示唆するように、不完備情報の静学ゲームでは、それぞれのプレイヤーの選好(利得関数)が私的情報であるような状況が起こり得ます。むしろ、実際にはプレイヤーの選好が私的状況であることは多く、不完備情報ゲームはそのような状況を明示的に分析するために開発された分析ツールであるとさえ言えます。タイプの定義より、プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれているため、プレイヤー\(i\)の利得関数\(u_{i}\)が私的情報であることを表現するためには\(u_{i}\)の形状が\(\theta _{i}\)の値に依存して変化すること、言い換えると、\(u_{i}\)がそれぞれの行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)が\(\theta _{i}\)の値に依存して変化するものとみなすことで対応できます。つまり、\(u_{i}\)は\(a_{I}\)を変数として持つだけでなく\(\theta _{i}\)をも変数として持つものとみなすということです。さらに言い換えると、\(u_{i}\)の定義域を\(A_{I}\times \Theta _{i}\)とみなすということです。そのことを\(u_{i}\left( \cdot,\theta _{i}\right) \)と表記します。ただ、\(u_{i}\left( \cdot ,\cdot \right) \)の形状はプレイヤーたちの共有知識です。プレイヤー\(i\)のタイプ集合\(\Theta _{i}\)と\(u_{i}\left( \cdot ,\cdot \right) \)が共有知識であるとき、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)であるときの効用関数\(u_{i}\left( \cdot ,\theta_{i}\right) \)もまたプレイヤーたちの共有知識になります。任意の\(\theta _{i}\)について同様の議論が成り立つため、プレイヤー\(i\)が持ち得る効用関数からなる集合\(\left\{ u_{i}\left( \cdot ,\theta _{i}\right) \right\} _{\theta _{i}\in\Theta _{i}}\)もまたプレイヤーたちの共有知識です。ただ、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\left\{ u_{i}\left( \cdot ,\theta _{i}\right)\right\} _{\theta _{i}\in \Theta _{i}}\)に属するどの選好がプレイヤー\(i\)の真の効用関数\(u_{i}\left( \cdot ,\theta _{i}^{\ast }\right) \)であるかを観察することはできません。このように考えることにより、プレイヤー\(i\)の効用関数が私的情報である状況を表現します。

例(利得関数)
先の新規参入問題の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれの企業\(i\in I\)のタイプ集合が\(\Theta _{i}=\left\{ h,l\right\} \)であり、行動集合は\(A_{i}=\left\{ e,n\right\} \)であるものとします。両企業が提示する行動の組が\(\left(a_{1},a_{2}\right) =\left( e,e\right) \)である場合、すなわち両社が参入する場合、企業\(1\)は市場の利益\(P\ \left( >0\right) \)の半分である\(\frac{P}{2}\)を得るものとします。加えて、この場合には競争相手がいるため企業\(1\)は追加的な研究開発が必要であり、その費用は自社の技術水準\(\theta _{1}\)に依存するものとします。企業\(1\)の技術水準が高い場合(\(\theta _{1}=h\))の追加的な研究開発費を\(c_{h}\ \left(>0\right) \)で表記し、技術水準が低い場合(\(\theta _{1}=l\))の追加的な研究開発費を\(c_{l}\ \left( >0\right) \)で表記します。\(c_{h}<c_{l}\)です。企業が得る利益を利得と同一視するのであれば、この場合に企業\(1\)が得る利得は、\begin{eqnarray*}&&u_{1}\left( e,e,h\right) =\frac{P}{2}-c_{h} \\
&&u_{1}\left( e,e,l\right) =\frac{P}{2}-c_{l}
\end{eqnarray*}となります。企業\(2\)についても同様に、\begin{eqnarray*}&&u_{2}\left( e,e,h\right) =\frac{P}{2}-c_{h} \\
&&u_{2}\left( e,e,l\right) =\frac{P}{2}-c_{l}
\end{eqnarray*}が成り立ちます。続いて、両企業が提示する行動の組が\(\left(a_{1},a_{2}\right) =\left( e,n\right) \)である場合、すなわち企業\(1\)だけが参入する場合、企業\(1\)は市場の利益\(P\)を独占するものとします。しかも、この場合には競争相手がいないため追加的な研究開発は不要であり、自社の技術水準\(\theta _{1}\)に依存した追加費用も不要です。したがって、この場合に企業\(1\)が得る利得は、\begin{equation*}u_{1}\left( e,n,h\right) =u_{1}\left( e,n,l\right) =P
\end{equation*}を満たします。企業\(2\)は参入しないため利益は得られず、追加的な研究開発も行いません。つまり、\begin{equation*}u_{2}\left( e,n,h\right) =u_{2}\left( e,n,l\right) =0
\end{equation*}です。続いて、両企業が提示する行動の組が\(\left( a_{1},a_{2}\right) =\left( n,e\right) \)である場合、すなわち企業\(2\)だけが参入する場合、先と同様に考えることにより、\begin{eqnarray*}u_{1}\left( n,e,h\right) &=&u_{1}\left( n,e,l\right) =0 \\
u_{2}\left( n,e,h\right) &=&u_{2}\left( n,e,l\right) =P
\end{eqnarray*}を得ます。最後に、両企業が提示する行動の組が\(\left( a_{1},a_{2}\right) =\left(n,n\right) \)である場合、すなわち両企業が参入する場合、両社とも利益が得られず、追加的な研究開発も行わないため、\begin{eqnarray*}u_{1}\left( n,n,h\right) &=&u_{1}\left( n,n,l\right) =0 \\
u_{2}\left( n,n,h\right) &=&u_{2}\left( n,n,l\right) =P
\end{eqnarray*}となります。

例(利得関数)
先のオークションの例において、プレイヤー集合が\(I=\left\{ 1,\cdots ,n\right\} \)であるとともに、それぞれの入札者\(i\in I\)のタイプ集合が\(\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \)であり、行動集合は\(A_{i}=[0,+\infty )\)であるものとします。入札者たちが提示する入札額の組が\(a_{I}=\left( a_{i}\right) _{i\in I}\)であるとき、\begin{equation*}a_{i}=\max \left\{ a_{1},\cdots ,a_{n}\right\}
\end{equation*}を満たす1人の入札者\(i\)が商品を落札し、自身の入札額\(a_{i}\)に等しい金額を支払うものとします。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも行いません。仮に、落札者の利得が、落札した商品への評価額から支払額を引いた額と一致するのであれば、\(a_{I}\)のもとで入札者\(i\)が落札者であるとき、\begin{equation*}u_{i}\left( a_{I},\theta _{i}\right) =\theta _{i}-a_{i}
\end{equation*}となります。一方、\(a_{I}\)のもとで落札できなかった任意の入札者\(j\)は商品を入手できず支払いも行わないため、\begin{equation*}u_{j}\left( a_{I},\theta _{j}\right) =0
\end{equation*}と定めます。

後ほど提示する例が示唆するように、不完備情報の静学ゲームでは、それぞれのプレイヤー\(i\)の選好(利得関数)が自身の私的情報\(\theta _{i}\)に依存するだけでなく、他のプレイヤーたちの私的情報\(\theta _{-i}\)にも依存するような状況も起こり得ます。プレイヤー\(i\)の利得関数\(u_{i}\)の形状が自身のタイプ\(\theta _{i}\)と他のプレイヤーのタイプ\(\theta _{-i}\)に依存すること、すなわち状態\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \)に依存して変化し得ることを\(u_{i}\left( \cdot ,\theta _{I}\right) =u_{i}\left(\cdot ,\theta _{i},\theta _{-i}\right) \)と表記します。つまり、利得関数\(u_{i}\)の定義域を\(A\times\Theta _{I}\)とみなすということです。\(u_{i}\left( \cdot ,\cdot \right) \)の形状はプレイヤーたちの共有知識です。状態集合\(\Theta _{I}\)と\(u_{i}\left( \cdot,\cdot \right) \)が共有知識であるとき、状態が\(\theta _{I}\in\Theta _{I}\)であるときのプレイヤー\(i\)の効用関数\(u_{i}\left( \cdot ,\theta _{I}\right) \)もまたプレイヤーたちの共有知識になります。任意の\(\theta _{I}\)について同様の議論が成り立つため、プレイヤー\(i\)が持ち得る効用関数からなる集合\(\left\{ u_{i}\left( \cdot ,\theta_{I}\right) \right\} _{\theta _{I}\in \Theta _{I}}\)もまたプレイヤーたちの共有知識です。この場合、プレイヤー\(i\)自身も自分の真の利得関数\(u_{i}\left( \cdot ,\theta _{I}^{\ast }\right) \)を事前に知ることができません。なぜなら、\(u_{i}\left( \cdot ,\theta _{I}^{\ast }\right) \)を知るためには自身の真のタイプ\(\theta _{i}^{\ast }\)のタイプだけでなく他のプレイヤーたちの真のタイプ\(\theta _{-i}^{\ast }\)を知っている必要がありますが、プレイヤー\(i\)は\(\theta_{-i}^{\ast }\)を事前に観察できないからです。

例(利得関数)
先のオークションの例において、それぞれの入札者\(i\)が落札した商品を転売しようと考えている場合や、落札した商品から得られる利得の大きさが他の人たちによる商品への評価によって左右されるのであれば(例えば、他の人がその商品を高く評価するほど、入札者はその商品からより高い満足度を得る場合)、入札者\(i\)の利得関数\(u_{i}\)は自身にとっての評価額\(\theta _{i}\)だけでなく、他の入札者たちにとっての評価額\(\theta _{-i}\)にも依存するため、入札者\(i\)の利得関数を\(u_{i}\left( \cdot ,\theta _{I}\right) \)と定式化できます。具体的には、入札者\(1\)は商品の価値を、すべての入札者による評価額の平均値\begin{equation*}\frac{\sum_{i=1}^{n}\theta _{i}}{n}
\end{equation*}として推定するものとします。このような想定のもとで、ベンチマークとして以下の2つの行動の組について考えます。1つ目は、入札者\(1\)の入札額は\(0\)で、他の任意の入札者\(j\ \left( \not=1\right) \)の入札額が\(10\)であるような組\begin{equation*}a_{I}=\left( a_{1},a_{2},\cdots ,a_{n}\right) =\left( 0,10,\cdots ,10\right)
\end{equation*}であり、2 つ目は、入札者\(1\)の入札額は\(50\)で、他の任意の入札者\(j\)の入札額が\(10\)であるような組\begin{equation*}a_{I}^{\prime }=\left( a_{1},a_{2},\cdots ,a_{n}\right) =\left( 50,10,\cdots
,10\right)
\end{equation*}です。さて、入札者\(1\)による商品への評価額が\(10\)で、他の任意の入札者\(j\)による評価額が\(0\)であるような状態\begin{equation*}\theta _{I}=\left( \theta _{1},\theta _{2},\cdots ,\theta _{n}\right)
=\left( 10,0\cdots ,0\right)
\end{equation*}においては、\(n\)が十分大きいとき、先の推定評価額\(\left( 1\right) \)はおよそ\(0\)であるため、入札者\(1\)にとって、商品を落札して\(50\)を支払うよりも、商品を落札しないことのほうが明らかに望ましいです。つまり、\begin{equation*}u_{1}\left( a_{I},\theta _{I}\right) >u_{1}\left( a_{I}^{\prime },\theta
_{I}\right)
\end{equation*}が成り立ちます。一方、入札者\(1\)による財への評価額が\(10\)で、他の任意の入札者\(j\)による評価額が\(100\)であるような状態\begin{equation*}\theta _{I}^{\prime }=\left( \theta _{1},\theta _{2},\cdots ,\theta
_{n}\right) =\left( 10,100,\cdots ,100\right)
\end{equation*}においては、\(n\)が十分大きいとき、先の推定評価額はおよそ\(100\)であるため、入札者\(i\)にとって、商品を落札しないことよりも、商品を落札して\(50\)を支払うほうが明らかに望ましいです。つまり、\begin{equation*}u_{1}\left( a_{I}^{\prime },\theta _{I}^{\prime }\right) >u_{1}\left(
a_{I},\theta _{I}^{\prime }\right)
\end{equation*}が成り立ちます。\(\theta_{1}=\theta _{1}^{\prime }\)であるため、\(\theta _{I}\)と\(\theta _{I}^{\prime }\)の違いは他の入札者たちのタイプ\(\theta _{-1},\theta _{-1}^{\prime }\)の違いに起因しています。したがって、上の例では、入札者\(1\)の利得が自身のタイプ\(\theta _{1}\)だけでなく他の入札者たちのタイプ\(\theta _{-1}\)にも依存する形になっています。

先に指摘したように、プレイヤー\(i\)の行動集合\(A_{i}\)が私的情報である場合には、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)ごとに行動集合\(A_{i}\left( \theta_{i}\right) \)を指定することになるため、プレイヤー\(i\)の行動集合を\(\{A_{i}\left(\theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)と記述する必要があります。しかし、利得関数を上手く変換することにより、それぞれのプレイヤーの行動集合が私的情報であるようなモデルを、プレイヤーの行動集合がプレイヤーたちの共有知識であるようなモデルへ変換することができます。具体的には、プレイヤー\(i\)の行動集合が\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)として記述されるとき、新たな行動集合\(A_{i}\)を、\begin{equation*}A_{i}=\bigcup\limits_{\theta _{i}\in \Theta _{i}}A_{i}\left( \theta
_{i}\right)
\end{equation*}と定義します。つまり、この集合\(A_{i}\)にはプレイヤー\(i\)がそれぞれのタイプ\(\theta _{i}\)のもとで選択し得るすべての行動が含まれています。プレイヤー\(i\)の特定のタイプ\(\theta _{i}\)を任意に選びます。このとき、プレイヤー\(i\)が選択可能な行動からなる集合は\(A_{i}\left( \theta _{i}\right) \)ですが、これは\(A_{i}\)の部分集合であるため、\(A_{i}\)の中には\(\theta _{i}\)のもとでプレイヤー\(i\)が選択不可能な行動が含まれている可能性があります。そのような行動\(a_{i}\in A_{i}\backslash A_{i}\left( \theta_{i}\right) \)を任意に選んだ上で、他のプレイヤーたちの任意のタイプの組\(\theta _{-i}\in \Theta _{-i}\)に対して、\begin{equation*}u_{i}\left( a_{i},\theta _{i},\theta _{-i}\right) =-\infty
\end{equation*}と定めるのであれば、タイプ\(\theta _{i}\)のプレイヤー\(i\)がこの行動\(a_{i}\)を選ぶ可能性を排除できます。\(A_{i}\backslash A_{i}\left( \theta_{i}\right) \)に属する任意の行動に対して同様の操作が可能です。

議論を整理しましょう。それぞれのプレイヤー\(i\)の行動集合からなる組\(\{A_{i}\left( \theta _{i}\right) \}_{\theta_{i}\in \Theta _{i}}\)に対して先のように\(A_{i}\)を定義します。プレイヤー\(i\)の行動集合は自身のタイプ\(\theta _{i}\)に依存せず常に\(A_{i}\)であり、この\(A_{i}\)はプレイヤーたちの共有知識であるものとします。その上で、プレイヤー\(i\)の利得関数\(u_{i}\)は、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)について、\begin{equation*}\forall a_{i}\in A_{i}\backslash A_{i}\left( \theta _{i}\right) ,\ \forall
\theta _{-i}\in \Theta _{-i}:u_{i}\left( a_{i},\theta _{i},\theta
_{-i}\right) =-\infty
\end{equation*}を満たすものと仮定します。モデルの上で、プレイヤー\(i\)が直面する行動集合は\(A_{i}\)ですが、プレイヤー\(i\)がタイプ\(\theta _{i}\)のときに選択対象となり得る行動からなる集合は実質的には\(A_{i}\left( \theta _{i}\right) \)に限定されます。このような変換を行えば、プレイヤー\(i\)の行動集合を自身のタイプ\(\theta _{i}\)に依存しない集合\(A_{i}\)とみなしても一般性は失われません。

 

ベイジアンゲーム

繰り返しになりますが、不完備情報の静学ゲームを記述するためには「プレイヤー」、「行動」、「情報」、「結果」、「利得」をそれぞれ特定する必要があります。ゲームのプレイヤーをプレイヤー集合\(I\)によって記述され、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)として記述されます。また、プレイヤー間の非対称的な情報構造はそれぞれのプレイヤー\(i\)のタイプ集合\(\Theta _{i}\)によって記述されます。プレイヤーたちが選ぶ行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しており、状態\(\theta_{I}=\left( \theta _{i},\theta _{-i}\right) \in \Theta _{I}\)においてプレイヤー\(i\)がそれぞれの結果から得る利得は\(\theta _{I}\)のもとでの利得関数\(u_{i}\left( \cdot ,\theta_{I}\right) :A_{I}\rightarrow \mathbb{R} \)を通じて記述されます。それぞれの状態におけるプレイヤー\(i\)の利得関数からなる集合を\(u_{i}=\left\{ u_{i}\left( \cdot ,\theta _{I}\right)\right\} _{\theta _{I}\in \Theta _{I}}\)で表記します。以上の要素からなるモデルを、\begin{equation*}G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ \Theta _{i}\right\} _{i\in
I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}と表記し、これをベイジアンゲーム(Bayesian game)と呼びます。

不完備情報の静学ゲームがベイジアンゲーム\(G\)によって表現されるとき、\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。それぞれのプレイヤー\(i\in I\)は自身のタイプ\(\theta _{i}\in \Theta _{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他の任意のプレイヤー\(j\ \left( \not=i\right) \)のタイプ\(\theta _{j}\in \Theta _{j}\)の真の値\(\theta_{j}^{\ast }\)は知りません。プレイヤー\(i\)が他のプレイヤー\(j\)について知っていることは、\(\theta _{j}\)がとり得る値の範囲\(\Theta _{j}\)だけです。したがって、プレイヤー\(i\)が直面し得る状態の集合は、\begin{equation*}\left\{ \left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}}
\end{equation*}となります。他の任意のプレイヤーについても同様の議論が成立します。また、ゲームの静学性と不完備性より、プレイヤーたちは以下の手順で意志決定を行います。

  1. 自身の真のタイプ\(\theta _{i}^{\ast }\)を知るが他のプレイヤーたちの真のタイプ\(\theta _{-i}^{\ast }\)を知らないそれぞれのプレイヤー\(i\)は自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択した行動を観察できない。
  2. プレイヤーたちが選択した行動の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)に対して、ゲームのルールが結果を定める。
  3. そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(a_{I},\theta _{I}^{\ast }\right) \)を得る。

 

状態ゲーム

問題としている不完備情報の静学ゲームがベイジアンゲーム\(G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ \Theta _{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})\)として表されているものとします。この場合、それぞれのプレイヤー\(i\in I\)は自身のタイプ\(\theta _{i}\in\Theta _{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他のプレイヤーたちのタイプ\(\theta_{-i}\in \Theta _{-i}\)の真の値\(\theta _{-i}^{\ast }\)は知らないという意味において情報の非対称性が成立しています。しかし、仮に真の状態\(\theta _{I}^{\ast }=\left( \theta_{i}^{\ast },\theta _{-i}^{\ast }\right) \)がプレイヤーたちの共有知識である場合には、情報の非対称性はもはや存在せず、そこでプレイヤーたちが直面する戦略的状況は完備情報ゲームになります。具体的には、真の状態\(\theta _{I}^{\ast }\)がプレイヤーたちの共有知識であるとき、その場合の戦略的状況は以下のような戦略型ゲームとして記述されます。

  1. プレイヤー集合はベイジアンゲーム\(G\)のプレイヤー集合\(I\)をそのまま引き継ぐ。
  2. それぞれのプレイヤー\(i\in I\)の行動集合はベイジアンゲームの行動集合\(A_{i}\)をそのまま引き継ぐ。
  3. それぞれのプレイヤー\(i\)の利得関数は、真の状態\(\theta _{I}^{\ast }\)のもとでの利得関数\(u_{i}\left( \cdot ,\theta_{I}^{\ast }\right) :A_{I}\rightarrow \mathbb{R} \)である。

ベイジアンゲーム\(G\)と真の状態\(\theta _{I}^{\ast }\)から定義されるこのような戦略型ゲームを\(\theta _{I}^{\ast }\)のもとでの状態ゲーム(state game)と呼び、これを、\begin{equation*}G\left( \theta _{I}^{\ast }\right) =(I,\left\{ A_{i}\right\} _{i\in
I},\left\{ u_{i}\left( \cdot ,\theta _{I}^{\ast }\right) \right\} _{i\in I})
\end{equation*}と表記します。

ベイジアンゲーム\(G\)の要素であるプレイヤー集合\(I\)、任意のプレイヤー\(i\)の行動集合\(A_{i}\)、任意のプレイヤー\(i\)の状態\(\theta _{I}^{\ast }\)における利得関数\(u_{i}\left( \cdot ,\theta _{I}^{\ast}\right) \)はいずれも共有知識であるため、状態ゲーム\(G\left( \theta _{I}^{\ast }\right) \)の要素もまた共有知識です。

ここでは真の状態\(\theta_{I}^{\ast }\)に対してそこでの状態ゲーム\(G\left( \theta _{I}^{\ast }\right) \)を考えましたが、真の状態とは限らないそれぞれの状態\(\theta _{I}\in\Theta _{I}\)に対しても、そこでの状態ゲーム\(G\left( \theta_{I}\right) \)を考えることができます。ベイジアンゲーム\(G\)においてそれぞれのプレイヤー\(i\)は自身のタイプ\(\theta _{i}\)の真の値\(\theta _{i}^{\ast }\)を知っていますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)の真の値\(\theta _{-i}^{\ast }\)を事前に観察できません。したがって、ベイジアンゲーム\(G\)においてプレイヤー\(i\)が直面する不確実な状況は、彼が直面する真の状態ゲームが、\begin{equation*}\left\{ G\left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}}
\end{equation*}の中のどれであるかを事前に知ることができないこととして表現できます。

例(状態ゲーム)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合が\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合が\(\Theta _{1}=\left\{ \theta_{11}\right\} \)かつ\(\Theta _{2}=\left\{ \theta _{21},\theta_{22}\right\} \)であるものとします。この場合、2通りの状態\(\left( \theta _{11},\theta _{21}\right) \)と\(\left( \theta _{11},\theta _{21}\right) \)が存在します。状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 0,0 & 1,2 \\ \hline
\end{array}

として、状態ゲーム\(G\left( \theta _{11},\theta _{21}\right) \)は以下の利得行列

\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 0,2 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}

としてそれぞれ与えられているものとします。これらの状態ゲームを構成する要素はいずれもプレイヤーたちの共有知識です。また、タイプ集合\(\Theta _{1},\Theta _{2}\)は共有知識であるため、プレイヤーたちがこの2つの状態ゲームに直面し得るという事実もまた共有知識です。プレイヤー\(1\)のタイプは\(\theta _{11}\)の1通りであるため、プレイヤー\(2\)は不確実性に直面していません。つまり、プレイヤー\(2\)の真のタイプが\(\theta _{21}\)である場合、プレイヤー\(2\)は自身が直面するゲームが\(G\left( \theta _{11},\theta _{21}\right) \)であることを知っており、真のタイプが\(\theta _{21}\)の場合には、自身が直面するゲームが\(G\left( \theta_{11},\theta _{22}\right) \)であることを知っています。一方、プレイヤー\(2\)のタイプとしては\(\theta _{21}\)と\(\theta _{22}\)の2通り存在し、プレイヤー\(1\)はプレイヤー\(2\)の真のタイプがどちらであるかを事前に知ることはできないため、プレイヤー\(1\)は自分がどちらの状態ゲームをプレーすることになるかが分からず、不確実性に直面しています。

 

演習問題

問題(ベイジアンゲーム)
本文中で取り上げた参入ゲームに対して、それぞれの状態\(\left(\theta _{1},\theta _{2}\right) \)のもとでの状態ゲーム\(G\left( \theta _{1},\theta_{2}\right) \)を利得行列として表現してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回はベイジアンゲームの中でも私的価値モデルと呼ばれるクラスのゲームについて解説します。

< 前のページ
次のページ >
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

ベイジアンゲーム

メカニズムのもとでのゲーム

単一財オークション市場においてメカニズムを提示された入札者たちが直面する戦略的状況はベイジアンゲームとして定式化されます。そのようなゲームにおいて、それぞれの入札者は自身のタイプと信念にもとづいて他の入札者たちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録